HOCR в HTML для визуализации
Как конвертировать hOCR в HTML для визуализации?
Если вы открываете необработанный файл hOCR, он отображается только как обычный текст (элементы не располагаются)
2 ответа
Есть разные решения для этой задачи, и я знаю эти три:
https://github.com/kba/hocrjs (наложение данных hocr на изображение, различные варианты, как это показать)
https://github.com/not-implemented/hocr-proofreader (показывает изображение слева и данные hocr справа, которые можно использовать для ввода поправок)
Кажется, что все эти репозитории состоят в основном из некоторых файлов JavaScript и CSS. Первые два репозитория имеют ссылку на демонстрационную страницу, где я взял фотографии.
Первый предоставляет скрипт Greasemonkey/Tampermonkey, который позволяет внедрить этот оверлей на любом подходящем веб-сайте hocr онлайн и локально (для этого может быть возможна некоторая конфигурация). Я не знаю, насколько сложно использовать другие solutins для ваших собственных файлов hocr, но это должно быть выполнимо.
Чтобы добавить интерфейс в простой файл hOCR, добавьте эту строку непосредственно перед закрывающим тегом:
<script src="https://unpkg.com/hocrjs"></script>
Затем откройте файл html (hOCR) в вашем браузере.