Невозможно сделать boxfile (или открыть tiff) в Tesseract
Я следую этим инструкциям для обучения движка Tesseract OCR новому шрифту.
Тем не менее, при попытке сделать файл коробки, я получаю сообщение об ошибке. Это команда, которую я использую:
H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0 batch.nochop makebox
А вот и сообщение об ошибке:
Tesseract Open Source OCR Engine v3.02 with Leptonica
TIFFstream: Sorry, can not handle image.
Unsupported image type.
Некоторое гугление предполагает, что при установке Leptonica может возникнуть ошибка. Я даже не знаю, установлена ли Leptonica на моем компьютере, и веб-страница сильно сбивает с толку несколько README (один называется README, а другой - "Документация"), ни один из них не настолько прост, чтобы я мог понять, как я это сделал. работа на винде. У меня есть Express Edition Visual Studio 2008, поэтому я не могу использовать предложенную командную строку.
Итак, мой вопрос: кто-нибудь знает, что может быть не так и как я могу это исправить?
1 ответ
Похоже, у тебя плохой имидж. Вы можете использовать инструмент jTessBoxEditor для создания изображений TIFF, подходящих для учебных целей.