Описание тега pytesseract

Оптическое распознавание символов для Python
1 ответ

pytesseract пытается распознать чистые черно-белые картинки с номерами шрифтов и 7-ю сегментными цифрами (python)

Я пытался заставить тессеракт распознать числа на этом изображении: но при запуске скрипта вывод пуст, то есть он не может Есть идеи, как заставить это работать? не похоже, что преобразование изображения в текст будет плохим, и то же самое происходи…
08 авг '18 в 16:57
0 ответов

Получение текста из изображения плана этажа с помощью pytesseract

У меня есть база данных изображений.jpg, .pdf и.png, которые представляют планы домов. Я пытаюсь использовать pytesseract для извлечения текста из изображений - с целью получения общей площади каждого дома (кв. Фут или кв. М). Я новичок в pytesserac…
24 авг '18 в 13:32
1 ответ

Как изменить часть цвета фона, который является черным, на белый?

Я работал над PyTesseract OCR и преобразовывал PDF в JPEG, чтобы сделать OCR изображение. Часть изображения имеет черный фон и белый текст, который Тессеракт не может распознать, тогда как все остальные части моего изображения читаются очень хорошо.…
07 фев '19 в 12:14
0 ответов

Не удается заставить Pytesseract работать в Visual Studio 2017 с Python, но он работает из файла.py

Я могу запустить файл формы кода, но не из Visual Studio 2017 from PIL import Image import pytesseract import argparse import os ap = argparse.ArgumentParser() ap.add_argument("-i", "--image", required=True, help="path to input image to be OCR'd") a…
0 ответов

Объект Jupyter Notebook не имеет атрибута

Я получаю сообщение об ошибке при преобразовании изображений в текст, когда я работаю на ноутбуке Jupyter с помощью Ubuntu. но когда я работаю с окнами, я успешно извлекаю текст из изображений. Пожалуйста, смотрите на изображение нажмите здесь, чтоб…
13 ответов

(-215: утверждение не выполнено)!_Src.empty() в функции 'cv::cvtColor'

Я пытаюсь распознать текст из изображения, чтобы затем выводить текст; однако эта ошибка выплевывает: Traceback (последний вызов был последним): Файл "C:/Users/Beast's Beast/AppData/Local/Programs/Python/Python37-32/imageDet.py", строка 41, в печати…
0 ответов

Есть ли способ сделать Pytesseract быстрее, используя около 150 ROI на изображении? Я даю это ROI для каждого конкретного слова в изображении

Я хочу прочитать текст с картинки, а также пометить каждое слово соответствующей координатой на изображении. Таким образом, я извлек координаты и получил ROI (прямоугольник) для каждого слова. Теперь я запускаю цикл for для запуска Pytesseract для к…
30 дек '18 в 03:56
2 ответа

PyTesseract - распознает цифры в простом изображении

Я пытаюсь использовать pytesseract для распознавания двух чисел из изображения: я пытался --psm 6 вплоть до 10 я пытался -c tessedit_char_whitelist=0123456789' Ни один из вышеперечисленных возвратов 49 число. Ближайший я вернулся 4 без 9 Есть ли у в…
1 ответ

Как извлечь данные из изображения, которое содержит табличные данные?

Я использую pytesseract, pillow,cv2 для распознавания изображений и получения текста, присутствующего на изображении. Поскольку мой ввод представляет собой отсканированный документ PDF, я сначала преобразовал его в формат изображения (JPEG), а затем…
14 янв '19 в 09:44
0 ответов

Почему я не могу распознать простой альфа-текст из изображений, используя python,pytesseract,cv2

Я пытаюсь определить текст на кнопках и меню, чтобы убедиться, что они правильно идентифицированы, прежде чем нажимать их. Любая помощь будет принята с благодарностью. Я пытался изменить цветовые шкалы, изменяя размеры и улучшая изображения, но ничт…
18 янв '19 в 02:25
0 ответов

Извлечение текста водяного знака из скриншотов ТВ

Я пытаюсь выяснить, как извлечь водяные знаки хэштегов из скриншотов ТВ. Несколько примеров: скриншот1, скриншот2, скриншот3, скриншот4 У меня уже есть скриншоты, безуспешно пытались использовать Tesseract для распознавания хэштегов. Проблема заключ…
21 янв '19 в 11:14
1 ответ

Python Detect charecter tesseract ocr создает BLOB-объекты для текста с помощью pytesseract

Я работаю над тессерактом и создал коробочный файл для символов на изображении. Используя tesseract в командной строке, он обнаружил символы и показал положение каждого обнаруженного символа в файле блока. Вот вывод командной строки. /Desktop $ tess…
31 янв '19 в 07:28
4 ответа

Ошибка поиска символа при использовании Tesseract

Я использую Tesseract 4 для проекта уже более двух месяцев. (Это означает, что он работает на входных изображениях более двух месяцев.) Проблема, которую я показываю, заключается в следующем: multiprocess.pool.RemoteTraceback: """ Traceback (most re…
23 сен '18 в 07:58
0 ответов

OpenCV - извлечение нечеткого текста для распознавания текста

Я пытаюсь извлечь текст из зашумленных изображений с помощью Pytesseract OCR. У меня возникают трудности при извлечении / очистке текста из изображений, чтобы он был в формате, подходящем для Pytesseract. Мой текущий подход заключается в том, чтобы …
25 фев '19 в 21:42
0 ответов

Как мне упаковать PyTesseract с помощью PyInstaller?

Я впервые создаю такой исполняемый файл, поэтому дайте мне знать, что я могу сделать, чтобы помочь вам помочь мне! Для создания своего проекта на Python я установил что-то под названием Pillow, PyTesseract и PyInstaller, чтобы я мог читать текст с и…
24 июл '18 в 02:16
1 ответ

Использование pytesseract для создания PDF из изображения

Я использую следующий код для создания PDF из изображения. PDF=pytesseract.image_to_pdf_or_hocr(test_image,lang='dan',config='',nice=0,extension='pdf') и тип переменной PDF отображается как БАЙТЫ. КАК опубликовать или получить PDF-файл?
06 дек '18 в 08:18
0 ответов

Pytesseract не может получить полный текст

Я пытаюсь извлечь текст из изображения grayScaleImage_withfiltering код tessract или pytessract в моем случае может получить черные шрифты на белом фоне, но не может выбрать те, которые находятся в белых шрифтах на черном фоне. Это изображение было …
20 дек '18 в 07:10
1 ответ

Тессеракт OCR - укажите шаблон

Я пытаюсь выполнить OCR, используя Tesseract (версия 3.04.00). Все мои изображения имеют одинаковый шаблон (цифра точка цифра цифра, т. Е. Десятичная с точностью до 2 цифр). Я пытался использовать --user-patterns вариант, но я не могу заставить его …
04 янв '19 в 12:26
0 ответов

Распознать текст с помощью tesseract

Здравствуйте, я пытаюсь распознать текст из изображения, используя Tesseract, но не могу получить результат. Я использую технику EAST для обнаружения текста. У меня есть еще один вопрос, как я могу продлить отступ поля. cv2.putText в этом случае не …
21 ноя '18 в 10:50
1 ответ

Как мне исправить синтаксическую ошибку для этого?

Файл "C:\Users\Suhaas\Documents\ocr_local_image.py", строка 8 print pytesseract.image_to_string(Image.open('test.jpg')) ^ SyntaxError: invalid syntax
01 авг '18 в 15:28