Установка Tesseract-OCR на CentOS 6

Я пытаюсь установить Tesseract-OCR на моем сервере, однако, когда я устанавливаю все, что я считаю правильными репозиториями. Когда я пытаюсь установить его, пакет не найден

Я попытался добавить rpmforge, но безрезультатно. Любые идеи от кого-то, кто сделал ранее или знаком с добавлением и поиском через репозитории?

6 ответов

Решение

Я использовал эту инструкцию и работал правильно в Centos

Установите Tesseract OCR libs из источников в Centos

  1. Скачать источники Leptonica и Teseract:

    $ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
    $ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

  2. Сконфигурировать, скомпилировать, установить библиотеки:

    $ tar xzvf leptonica-1.69.tar.gz
    $ cd leptonica-1.69
    $./configure $ make $ sudo make install

    $ tar xzf tesseract-ocr-3.02.02.tar.gz $ cd tesseract-3.01 $./autogen.sh $./configure $ make $ sudo make install $ sudo ldconfig

  3. Загрузите языки (английский) и скопируйте в папку tessdata:

    $ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
    $ tar xzf tesseract-ocr-3.02.eng.tar.gz
    $ sudo cp tesseract-ocr / tessdata / * / usr / local / share / tessdata

и наслаждайтесь этим;)

Я рекомендую попробовать установить из rpm здесь: http://pkgs.org/download/tesseract Также есть несколько зависимостей: libpng-devel, libjpeg-devel, libtiff-devel, zlib и leptonica. Последние 2 также можно найти на сайте RPM

Я написал скрипт bash для установки Tesseract 3.05 на Centos 7. Он выбирает и устанавливает все зависимости, а также устанавливает языковые файлы для английского, хинди, бенгальского и тайского языков.

Код доступен на GitHub

https://github.com/EisenVault/install-tesseract-redhat-centos

Надеюсь это поможет.

Это сработало для меня:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

Тессеракт не находится в репозитории epel, но в репозитории epel-Testing ведьма по умолчанию не активирована.

Установите библиотеки Tesseract OCR из источников (ОБНОВЛЕНО 14 июля 2018 года)

Скачать источники Leptonica и Teseract:

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

Сконфигурируйте, скомпилируйте, установите Leptonica:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install

Сконфигурируйте, скомпилируйте, установите Tesseract:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig

Скачать языковой файл:

Я загружаю файл английского языка (eng.traineddata) здесь. Вы можете увидеть полный список языковых файлов здесь и скачать в соответствии с вашими потребностями. https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

Загрузите языки (английский) и скопируйте в папку tessdata:

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

Теперь ваш Tesseract OCR установлен и готов к использованию! Пример:

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

Наслаждаться!!!

введите описание изображения здесь

ням установить --nogpgcheck тессеракт

после установки для тестирования введите следующую команду: tesseract --version

Я закончил тем, что переключился на Ubuntu. Tesseract поддерживается красиво и устанавливается без проблем.

apt-get install tesseract-ocr
Другие вопросы по тегам