Поисковик Яндекс запустил технологию поиска по картинке, загруженной пользователем, и назвал её «Сибирь». Поисковик уже учится не только искать, но и обобщать картинки, говорится в сообщении Яндекса, с которым 9 сентября ознакомился корреспондент Сиб.фм.
Технология позволяет не только найти описание изображения, но и любую другую связанную с ним информацию. «Например, по картинке товара можно найти интернет-магазин, в котором он продаётся, а по фотографии певицы — сайт, где её фотографий целая коллекция. Наконец, можно просто поискать такую же картинку, но, например, не обрезанную или без подписей», — написал в блоге Яндекса менеджер проектов компьютерного зрения Александр Крайнов.
Технологию назвали «Сибирь» (от англ. CBIR — Content-based image retrieval, то есть поиск изображения по содержанию).
После того как пользователь загрузил картинку, поисковая машина превращает её в набор визуальных слов. Визуальные слова — это удобные для поиска численные представления ключевых элементов картинки (границы объектов, контрастные области и так далее). После этого поисковая машина выбирает среди известных ей миллиардов картинок изображения, содержащие такие же визуальные слова, как на загруженной картинке, отсекая все остальные. Потом компьютер сопоставляет расположение ключевых элементов на оставшихся изображениях и выстраивает их по близости к загруженной картинке так, что сверху оказываются наиболее похожие. Всё это занимает меньше минуты.
«Наш поиск по картинке — это лишь первый шаг на довольно трудном пути. Сейчас Яндекс ищет картинки, совпадающие с загруженной или имеющие идентичные фрагменты, но постепенно будет учиться большему. К примеру, поиск уже показывает способности к обобщению: иногда находится не просто такая же картинка, а другое изображение, содержащее такой же объект», — написал Крайнов.
Поиск по картинкам и загруженным изображениям поддерживает и Google, основной конкурент российского поисковика.