Можете ли вы использовать MODI OCR для распознавания неязыковых предметов?

Question

Можете ли вы использовать MODI OCR для распознавания неязыковых предметов?

У меня есть документ OCR, работающий с изображением, работает нормально, когда на странице есть такие слова, как "coffee" или "432", но когда я пытаюсь распознать слово "abc123", я получаю "Ошибка выполнения OCR",

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);  // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

Конечно, MS не создавал эту библиотеку, чтобы распознавать только языковые слова? Или они? Я пропускаю настройку MODI.document или что-то?

Любая помощь будет оценена,

0

.net ocr modi

Источник

user16642 05 мар '11 в 20:56

1 ответ

Решение

Другие вопросы по тегам .net ocr modi

user17034 05 мар '11 в 22:06 2011-03-05 22:06 · Accepted Answer · 2011-03-05 22:06

Да, они сделали. OCR становится действительно неточным без соответствующего словаря и фрагментов, которые не обеспечивают контекст. Как и люди: ABC123, ABCI23, ABCl23. Три разные строки. Это решается на практике с помощью специальных шрифтов, которые сводят к минимуму вероятность того, что буквы и цифры будут неоднозначными, как вы видите на банковском чеке.