Описание тега tesseract

Tesseract - это движок OCR (оптического распознавания символов), первоначально разработанный в HP Labs, а теперь доступный в виде библиотеки с открытым исходным кодом при поддержке Google.

Tesseract - это многоязычный механизм OCR (оптического распознавания символов) с открытым исходным кодом, изначально разработанный в HP Labs. В настоящее время он спонсируется Google и распространяется по лицензии Apache 2.0. В настоящее время он распознает 107 языков. Tesseract в основном написан на C++ и C. Проект размещен на https://github.com/tesseract-ocr/tesseract, а его форумы поддержки находятся на http://groups.google.com/group/tesseract-ocr.