Каковы идеальные размеры изображения для лучшего распознавания текста от Google Vision?

Я использую OCR Google Vision уже некоторое время. И я заметил, что результат распознавания зависит от размера изображения. Скажем, например, что изображение размером 720 x 1280 дает лучший результат, чем 360 x 720. И наоборот, иногда хуже.

Я испытал то же самое с Microsoft OCR API.

Так есть ли идеальный размер изображения, который всегда дает хороший результат распознавания? Как размеры изображения влияют на результат распознавания?

3 ответа

Пожалуйста, обратитесь сюда для получения этой информации: Google Поддерживаемые изображения

FACE_DETECTION 1600 x 1200 Расстояние между глазами является наиболее важным

LANDMARK_DETECTION 640 x 480

LOGO_DETECTION 640 x 480

LABEL_DETECTION 640 x 480

TEXT_DETECTION и DOCUMENT_TEXT_DETECTION 1024 x 768 Для распознавания символов требуется большее разрешение

SAFE_SEARCH_DETECTION 640 x 480

Google Поддерживаемые изображения

Основываясь на ссылке ниже, не только разрешение, соотношение сторон также является фактором https://www.mlreader.com/prepare-image-for-google-vision-api

Размеры изображения не влияют систематически на результаты распознавания. Но что сильно влияет на результат качества распознавания, так это разрешение документа (dpi). Как правило, лучшие результаты достигаются с разрешением 300 точек на дюйм. Ниже 70 точек на дюйм все становится сложно. Я предполагаю, что с изменением размеров вашего документа вы также косвенно меняете dpi.

Другие вопросы по тегам