Как книги Google выделяют текст на отсканированном изображении
Если я сделаю поиск по ключевым словам здесь:
http://books.google.com/ebooks/reader?id=s1gVAAAAYAAJ&printsec=frontcover&output=reader&pg=GBS.PA7
Выделенный текст в "текущем тексте" кажется достаточно простым, но если вы переключитесь, чтобы показать "отсканированные страницы", он все равно будет отображать выделенный текст? Кто-нибудь знает, как они этого добиваются.
1 ответ
Решение
Через процесс распознавания текста, когда они сканируют изображение или динамически, когда вы запрашиваете страницу.