Языковой файл или тренинг tessnet2

Я довольно новичок в tessnet2. Поэтому я использую Tessnet2, потому что я использую OCR на языке C#. Поэтому я добавляю tessnet_32.dll в ссылку, чтобы заставить OCR работать. Однако я столкнулся с проблемой.

Так как tessnet2 - это tesseract2.0, я не могу использовать все языковые файлы, которые есть в github tesseract. Поэтому мой вопрос:

1) Возможно ли, что я могу извлечь lang.traineddata и получить все 8 файлов, которые можно использовать в tessnet2? 2) Если нет, то можете ли вы объяснить, как подготовить данные для добавления нового языка? (например, корейский или японский)? Я знаю, что https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract2 имеет все шаги. Но когда я использую командную строку, я ничего не получаю. Другими словами, я застрял в создании коробки. Если кто-нибудь может объяснить мне, как обучать данные с помощью установки tesseract 2.0, было бы здорово.

Спасибо за помощь мне.

0 ответов

Другие вопросы по тегам