Палят ли поисковики наши адалт-блоги по идентичным изображениям?

Дата: 08.02.2008
Рубрики: Поисковые системы |

Началось все с того, что я никак не мог понять, почему из штампуемых на одном графическом и разном текстовом контентах блоги вылазят «один через два».

Паранойка загнала меня в думы о том, что изображения-то могут тоже палиться на уникальность (ха! додумался!).

Вообще, давно тревожили яндексовские гранты за 2004-2005-й года:
1. А.Ю. Дорогов, Р.Г. Курбанов. Быстрая классификация JPEG–изображений.
2. М.В. Смирнов, И.Н.Сивяков. Распознавание типовых портретных изображений в задаче автоматической классификации.

…и прочие. Не вдаваясь в подробности и соответствие темы документа с обсуждаемой (гг!), достаточно уже осознания того, что ПС давно начали работать с изображениями на уровне отличном от побитного/чексумного сравнения.

Перепечатывать лениво, вот тут тред коротенький на тему уникальность изображений.

В общем-то, я так и думал, что спалить нас легко, несмотря на ресайз, пережатие и штамповку «копирайта», но теперь я эксперементально убедился, что это легче легкого (найденая на просторах интернета программа Image Comparer легко нашла 99%-ю вероятность идентичности оригинального изображения и его jpeg- и gif-тумбинашки (80% ресайз, плюс непрозрачный, визуально выделяющийся гиф, нашлепнутый в качестве «копирайта»).

Вот так-то. Может еще рано, может уже поздно, но иметь ввиду подобную подставу все-таки стоит, особенно тем, кто двигает сайты изображениями (ну вот я, например :)).

Хотя вот подумал.. допустим работает этот алгоритм поблочно (что вроде как логично).
берем фотку, и кропим с краю 20 пикселей. Сиськи наверняка не пострадают. Справа можно сделать фулл-хейт копирайт

Думаю это уже будет менее палевно (ну, если там фиксированные позиции блоков в матрицах, т.е. блок с координатами 1a:1a сравнивается с 1b:1b). Ща проверю на проге.

response добавил 08.02.2008 в 05:26
ха! сделал как сказал, только отрезал 40 пикселей, а с другой стороны вставил фулл-хейт с монотонным фоном и надписью - при сравнении не был преодолен минимальный порог в 70% вероятности идентичности

спалили тему

np: Anti-Flag — Operation Iraqi Liberation (O.I.L.)

Комментарии

Комментарии (3) на запись “Палят ли поисковики наши адалт-блоги по идентичным изображениям?”

  1. iam304 25.03.2008 11:23

    ага, оно. спасибо :)

  2. Drew 03.05.2008 20:25

    хм…
    далеко зашел прогресс…
    т.е. на одном дизе клепать доры видимо не стоит

  3. 99th 06.05.2008 21:05

    Где в посте хоть слово про диз? ;)

Оставить комментарий