Ошибка Font_Property во время обучения Tesseract-OCR V 3.01

Я столкнулся с проблемой при настройке файла свойств шрифта для обучения движка tesseract v 3.01 ocr. в соответствии с 3.01v вы должны настроить файл свойств шрифта. Формат файла font_properties таков, что

и 0 или 1 флаги должны использоваться, чтобы указать свойства. Кто-нибудь знает, что означает фиксированный, засечек или фрактур?

и когда я запускаю его с моим файлом font_properties, он выдает следующую ошибку

Спасибо

3 ответа

Решение

Никакие входные файлы для обучения Тессеракту не должны содержать пробелов в своих именах.

Запись в font_properties должна соответствовать части имени шрифта имени файла изображения; например, если font_properties имеет uknumberplate, то имя файла вашего изображения должно быть eng.uknumberplate.exp0.tif.

Fixed (или моноширинный), Serif и Fraktur являются стандартными дескрипторами шрифтов - вы можете посмотреть, что они значат в Википедии.

Что касается вашей ошибки, убедитесь, что вы правильно отформатировали файл font_properties, как указано в учебном руководстве Training Tesseract 3 ниже. Если вы тренируете только один шрифт, файл должен содержать одну строку, в вашем случае

times_new_roman 0 0 0 1 0

Вы не включили то, что поместили в файл font_properties, но учтите, что в имени шрифта не должно быть пробелов!

http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

Вы должны поместить font_properties.txt в команду, но затем в Windows выдается исключение, но он находит файл свойств шрифта.

Другие вопросы по тегам