Windows 7 OCR API

Я просматривал замены для Office 2007 MODI OCR (решение OneNote 2010 имеет меньшее качество / результаты, чем в 2007 году:-(). Я заметил, что Windows 7 содержит библиотеку OCR после установки дополнительного фильтра TIFF.

Компонент OCR устанавливается в

%programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 

но я не вижу API для этого?

Кто-нибудь видит, как это можно связать предпочтительно в C#?

ОТВЕТ: нашел решение, как только будет установлена ​​дополнительная функция win7 для tiff ifilter, я смогу получить текстовый вывод скриншота, используя код / ​​exe на http://www.codeproject.com/KB/cs/IFilter.aspx. Также, если добавить один и тот же [HKEY_CLASSES_ROOT.tiff\PersistentHandler] для.png и.jpg, тогда OCR также работает для jpg и png.

3 ответа

  1. Tessnet OCR - хорошее решение, но довольно старое (последний выпуск от 2009 года). Есть несколько очень хороших бесплатных решений для распознавания текста, доступных для.NET:
  2. Asprise C# OCR SDK. Очень хороший и быстрый.
  3. Microsoft Research Project Гавайское веб-решение (облачное) OCR с полными документами и образцами (прекращено в 2013 году)
  4. Bing OCR Web (облачный) OCR замена для выше. (прекращено в марте 2014 г.)

Попробуйте TessNet, используя предложения, которые я сделал для автора в этом посте (увеличить изображение, используйте отдельный процесс):
C# OCR не может распознать цифры (тессеракт 2)

Я изучал Windows 7 DLL и нашел 3 библиотеки, которые могут быть полезны: thocr.psp.dll,xocr3.psp.dll и ximage3b.dll. На этом и других подобных сайтах я узнал, что ximage3b - это система Windows ocr. Я искал документацию онлайн, но я не добился успеха, но эй! по крайней мере, я знаю, что это там, я дам вам, ребята, обновление, если я узнаю, как использовать его с C#/C/C++.

Другие вопросы по тегам