Каковы идеальные размеры изображения для лучшего распознавания текста от Google Vision?
Я использую OCR Google Vision уже некоторое время. И я заметил, что результат распознавания зависит от размера изображения. Скажем, например, что изображение размером 720 x 1280 дает лучший результат, чем 360 x 720. И наоборот, иногда хуже.
Я испытал то же самое с Microsoft OCR API.
Так есть ли идеальный размер изображения, который всегда дает хороший результат распознавания? Как размеры изображения влияют на результат распознавания?
3 ответа
Пожалуйста, обратитесь сюда для получения этой информации: Google Поддерживаемые изображения
FACE_DETECTION 1600 x 1200 Расстояние между глазами является наиболее важным
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION и DOCUMENT_TEXT_DETECTION 1024 x 768 Для распознавания символов требуется большее разрешение
SAFE_SEARCH_DETECTION 640 x 480
Основываясь на ссылке ниже, не только разрешение, соотношение сторон также является фактором https://www.mlreader.com/prepare-image-for-google-vision-api
Размеры изображения не влияют систематически на результаты распознавания. Но что сильно влияет на результат качества распознавания, так это разрешение документа (dpi). Как правило, лучшие результаты достигаются с разрешением 300 точек на дюйм. Ниже 70 точек на дюйм все становится сложно. Я предполагаю, что с изменением размеров вашего документа вы также косвенно меняете dpi.