Установка Tesseract-OCR на CentOS 6
Я пытаюсь установить Tesseract-OCR на моем сервере, однако, когда я устанавливаю все, что я считаю правильными репозиториями. Когда я пытаюсь установить его, пакет не найден
Я попытался добавить rpmforge, но безрезультатно. Любые идеи от кого-то, кто сделал ранее или знаком с добавлением и поиском через репозитории?
6 ответов
Я использовал эту инструкцию и работал правильно в Centos
Установите Tesseract OCR libs из источников в Centos
Скачать источники Leptonica и Teseract:
$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gzСконфигурировать, скомпилировать, установить библиотеки:
$ tar xzvf leptonica-1.69.tar.gz
$ cd leptonica-1.69
$./configure $ make $ sudo make install$ tar xzf tesseract-ocr-3.02.02.tar.gz $ cd tesseract-3.01 $./autogen.sh $./configure $ make $ sudo make install $ sudo ldconfig
Загрузите языки (английский) и скопируйте в папку tessdata:
$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr / tessdata / * / usr / local / share / tessdata
и наслаждайтесь этим;)
Я рекомендую попробовать установить из rpm здесь: http://pkgs.org/download/tesseract Также есть несколько зависимостей: libpng-devel, libjpeg-devel, libtiff-devel, zlib и leptonica. Последние 2 также можно найти на сайте RPM
Я написал скрипт bash для установки Tesseract 3.05 на Centos 7. Он выбирает и устанавливает все зависимости, а также устанавливает языковые файлы для английского, хинди, бенгальского и тайского языков.
Код доступен на GitHub
https://github.com/EisenVault/install-tesseract-redhat-centos
Надеюсь это поможет.
Это сработало для меня:
/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch
Тессеракт не находится в репозитории epel, но в репозитории epel-Testing ведьма по умолчанию не активирована.
Установите библиотеки Tesseract OCR из источников (ОБНОВЛЕНО 14 июля 2018 года)
Скачать источники Leptonica и Teseract:
$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz
Сконфигурируйте, скомпилируйте, установите Leptonica:
$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install
Сконфигурируйте, скомпилируйте, установите Tesseract:
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig
Скачать языковой файл:
Я загружаю файл английского языка (eng.traineddata) здесь. Вы можете увидеть полный список языковых файлов здесь и скачать в соответствии с вашими потребностями. https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
Загрузите языки (английский) и скопируйте в папку tessdata:
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
Теперь ваш Tesseract OCR установлен и готов к использованию! Пример:
$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng
Наслаждаться!!!
введите описание изображения здесь
ням установить --nogpgcheck тессеракт
после установки для тестирования введите следующую команду: tesseract --version
Я закончил тем, что переключился на Ubuntu. Tesseract поддерживается красиво и устанавливается без проблем.
apt-get install tesseract-ocr