Новости интернет-маркетинга RSS

20042004 20052005 20062006 20072007 20082008 20092009

Google научился индексировать отсканированные документы

01.11.2008

Компания Google объявила о том, что ее поисковик научился индексировать текст на отсканированных изображениях.

По словам представителей компании, для определения текста на картинке используется специальная технология оптического распознавания Optical Character Recognition, которая умеет конвертировать изображение слов в файлы с текстом.

На сегодняшний день, поисковик Google умеет распознавать только текст в документах формата PDF. Вполне вероятно, в перспективе к данному формату будет добавлена поддержка и других типов файлов.

http://www.cnews.ru/news/line/index.shtml?2008/11/01/325745