Windows 7 OCR API
Я просматривал замены для Office 2007 MODI OCR (решение OneNote 2010 имеет меньшее качество / результаты, чем в 2007 году:-(). Я заметил, что Windows 7 содержит библиотеку OCR после установки дополнительного фильтра TIFF.
Компонент OCR устанавливается в
%programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll
но я не вижу API для этого?
Кто-нибудь видит, как это можно связать предпочтительно в C#?
ОТВЕТ: нашел решение, как только будет установлена дополнительная функция win7 для tiff ifilter, я смогу получить текстовый вывод скриншота, используя код / exe на http://www.codeproject.com/KB/cs/IFilter.aspx. Также, если добавить один и тот же [HKEY_CLASSES_ROOT.tiff\PersistentHandler] для.png и.jpg, тогда OCR также работает для jpg и png.
3 ответа
- Tessnet OCR - хорошее решение, но довольно старое (последний выпуск от 2009 года). Есть несколько очень хороших бесплатных решений для распознавания текста, доступных для.NET:
- Asprise C# OCR SDK. Очень хороший и быстрый.
- Microsoft Research Project Гавайское
веб-решение (облачное) OCR с полными документами и образцами(прекращено в 2013 году) - Bing OCR
Web (облачный) OCR замена для выше.(прекращено в марте 2014 г.)
Попробуйте TessNet, используя предложения, которые я сделал для автора в этом посте (увеличить изображение, используйте отдельный процесс):
C# OCR не может распознать цифры (тессеракт 2)
Я изучал Windows 7 DLL и нашел 3 библиотеки, которые могут быть полезны: thocr.psp.dll,xocr3.psp.dll и ximage3b.dll. На этом и других подобных сайтах я узнал, что ximage3b - это система Windows ocr. Я искал документацию онлайн, но я не добился успеха, но эй! по крайней мере, я знаю, что это там, я дам вам, ребята, обновление, если я узнаю, как использовать его с C#/C/C++.