Тессеракт тренинг

Я пытаюсь обучить определенные изображения номерного знака определенному шрифту. Мне интересно, где я должен положить файл unicharambigs во время обучения. Я подготовил набор данных без файла unicharambigs. но когда я включил папку tessdata в свой код, во время выполнения возникла исключительная ситуация: "Попытка чтения или записи защищенной памяти. Это часто указывает на то, что другая память повреждена". Я новичок в использовании тессеракта. У меня есть несколько вопросов для уточнения, так как я считаю, что указанное выше исключение происходит из-за одной из следующих проблем.

1) обязательно ли иметь файл unicharambigs? если да, то куда мне поместить этот файл перед созданием окончательных обученных данных?

2) какие файлы следует учитывать в папке tessdata при интеграции с кодом C#?

Я проводил тестирование с предварительно подготовленным набором данных, но я хочу иметь свой собственный набор данных, и когда я использую эту папку tessdata, приложение не завершит работу с вышеупомянутым исключением времени выполнения. поэтому я считаю, что это как-то связано с моей собственной папкой tessdata.

ОБНОВИТЬ

Просто чтобы добавить к вопросу. Когда я использовал папку tessdata по умолчанию, созданную установкой tesseract, приложение работает нормально, но с ошибочным результатом. Я снова обучил tesseract и заменил существующий файл обученных данных новым файлом обученных данных, который был создан после обучения, и мое приложение снова упало.

Я использую C# и tesseract dot net wrapper.

1 ответ

Решение

На самом деле здесь проблема заключается в несовпадении версий обученной библиотеки tessedata и tesseract. Я полагаю, что обученная версия tessedata является последней версией>3.0 из-за этой старой версии (2.0) dll выдает исключение типа Попытка чтения или записи защищенной памяти ", поэтому, пожалуйста, попробуйте tesseract dll. https://github.com/charlesw/tesseract/tree/master/Samples Загрузите образец проекта по ссылке выше и проверьте свои обученные данные. Он имеет ссылку на пакет Nuget tesseract, так что он будет поддерживать Tesseract 3.02 с обученными tessedata.

Другие вопросы по тегам