Google научился индексировать отсканированные документы
01.11.2008
Компания Google объявила о том, что ее поисковик научился индексировать текст на отсканированных изображениях.
По словам представителей компании, для определения текста на картинке используется специальная технология оптического распознавания Optical Character Recognition, которая умеет конвертировать изображение слов в файлы с текстом.
На сегодняшний день, поисковик Google умеет распознавать только текст в документах формата PDF. Вполне вероятно, в перспективе к данному формату будет добавлена поддержка и других типов файлов.

