Палят ли поисковики наши адалт-блоги по идентичным изображениям?
Дата: 08.02.2008
Рубрики: Поисковые системы |
Началось все с того, что я никак не мог понять, почему из штампуемых на одном графическом и разном текстовом контентах блоги вылазят «один через два».
Паранойка загнала меня в думы о том, что изображения-то могут тоже палиться на уникальность (ха! додумался!).
Вообще, давно тревожили яндексовские гранты за 2004-2005-й года:
1. А.Ю. Дорогов, Р.Г. Курбанов. Быстрая классификация JPEG–изображений.
2. М.В. Смирнов, И.Н.Сивяков. Распознавание типовых портретных изображений в задаче автоматической классификации.
…и прочие. Не вдаваясь в подробности и соответствие темы документа с обсуждаемой (гг!), достаточно уже осознания того, что ПС давно начали работать с изображениями на уровне отличном от побитного/чексумного сравнения.
Перепечатывать лениво, вот тут тред коротенький на тему уникальность изображений.
В общем-то, я так и думал, что спалить нас легко, несмотря на ресайз, пережатие и штамповку «копирайта», но теперь я эксперементально убедился, что это легче легкого (найденая на просторах интернета программа Image Comparer легко нашла 99%-ю вероятность идентичности оригинального изображения и его jpeg- и gif-тумбинашки (80% ресайз, плюс непрозрачный, визуально выделяющийся гиф, нашлепнутый в качестве «копирайта»).
Вот так-то. Может еще рано, может уже поздно, но иметь ввиду подобную подставу все-таки стоит, особенно тем, кто двигает сайты изображениями (ну вот я, например :)).
Хотя вот подумал.. допустим работает этот алгоритм поблочно (что вроде как логично).
берем фотку, и кропим с краю 20 пикселей. Сиськи наверняка не пострадают. Справа можно сделать фулл-хейт копирайтДумаю это уже будет менее палевно (ну, если там фиксированные позиции блоков в матрицах, т.е. блок с координатами 1a:1a сравнивается с 1b:1b). Ща проверю на проге.
response добавил 08.02.2008 в 05:26
ха! сделал как сказал, только отрезал 40 пикселей, а с другой стороны вставил фулл-хейт с монотонным фоном и надписью - при сравнении не был преодолен минимальный порог в 70% вероятности идентичностиспалили тему
np: Anti-Flag — Operation Iraqi Liberation (O.I.L.)
Комментарии
Комментарии (3) на запись “Палят ли поисковики наши адалт-блоги по идентичным изображениям?”
Оставить комментарий




Самая полезная информация и софт для ее добычи.
ага, оно. спасибо :)
хм…
далеко зашел прогресс…
т.е. на одном дизе клепать доры видимо не стоит
Где в посте хоть слово про диз? ;)