Можете ли вы использовать MODI OCR для распознавания неязыковых предметов?
У меня есть документ OCR, работающий с изображением, работает нормально, когда на странице есть такие слова, как "coffee" или "432", но когда я пытаюсь распознать слово "abc123", я получаю "Ошибка выполнения OCR",
MODI.Document md = new MODI.Document();
md.Create("c:\\temp\\mpk.tiff");
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0];
FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
md.Close();
Конечно, MS не создавал эту библиотеку, чтобы распознавать только языковые слова? Или они? Я пропускаю настройку MODI.document или что-то?
Любая помощь будет оценена,
1 ответ
Решение
Да, они сделали. OCR становится действительно неточным без соответствующего словаря и фрагментов, которые не обеспечивают контекст. Как и люди: ABC123, ABCI23, ABCl23. Три разные строки. Это решается на практике с помощью специальных шрифтов, которые сводят к минимуму вероятность того, что буквы и цифры будут неоднозначными, как вы видите на банковском чеке.