Как книги Google выделяют текст на отсканированном изображении

Если я сделаю поиск по ключевым словам здесь:

http://books.google.com/ebooks/reader?id=s1gVAAAAYAAJ&printsec=frontcover&output=reader&pg=GBS.PA7

Выделенный текст в "текущем тексте" кажется достаточно простым, но если вы переключитесь, чтобы показать "отсканированные страницы", он все равно будет отображать выделенный текст? Кто-нибудь знает, как они этого добиваются.

1 ответ

Решение

Через процесс распознавания текста, когда они сканируют изображение или динамически, когда вы запрашиваете страницу.

Другие вопросы по тегам