Как читать тексты в одной колонке с помощью Google Cloud Vision API

Question

Как читать тексты в одной колонке с помощью Google Cloud Vision API

У меня есть следующий документ изображения

Документ

Когда я пытаюсь преобразовать изображение в текст, результат будет следующим:

Заголовок

Ссылка: Rad: Dte: Ddo:

Ejecutivo 76520400300 Банко де Богота Лус Адриана

Боттон Текст

Проблема в том, что Google API распознает его как две колонки, поэтому, как я могу настроить Google API для получения одного столбца текста?

Моя цель - получить:

Заголовок

Ссылка:Ejecutivo Rad: 76520400300 Dte: Banco de Bogotá Ddo:Luz Adriana

Боттон Текст

3

ocr google-cloud-vision text-recognition

Источник

user6335332 27 дек '18 в 18:26

2 ответа

Решение

Член команды Google ответил, что Document AI работает лучше, чем Cloud Vision, согласно обновленной информации о проблеме.

2

Источник

user4582443 11 дек '21 в 10:43

Другие вопросы по тегам ocr google-cloud-vision text-recognition

user7958995 02 янв '19 в 14:45 2019-01-02 14:45 · Accepted Answer · 2019-01-02 14:45

Cloud Vision API не имеет специального свойства запроса для указания формата, используемого для чтения или сортировки данных файла. Вместо этого я думаю, что доступный обходной путь заключается в использовании свойств ответа BoundingPoly и Vertex, которые отображают координаты, связанные с каждым словом, содержащимся в изображении, для обработки данных вершин в логике кода и определения текста, который должен быть сгруппированы по столбцам и строкам. Вы можете посмотреть по этой ссылке, которая включает в себя несколько примеров ответов, которые включают эти свойства.

В случае, если эта функция не покрывает ваши текущие потребности, вы можете использовать кнопку " Отправить отзыв", расположенную в нижнем левом и правом верхних углах общедоступной документации службы, а также взглянуть на инструмент "Отслеживание проблем", чтобы вызвать Запрос функции API Vision и уведомление Google об этой желаемой функциональности.