Как читать тексты в одной колонке с помощью Google Cloud Vision API

У меня есть следующий документ изображения

Документ

Когда я пытаюсь преобразовать изображение в текст, результат будет следующим:

Заголовок

Ссылка: Rad: Dte: Ddo:

Ejecutivo 76520400300 Банко де Богота Лус Адриана

Боттон Текст

Проблема в том, что Google API распознает его как две колонки, поэтому, как я могу настроить Google API для получения одного столбца текста?

Моя цель - получить:

Заголовок

Ссылка:Ejecutivo Rad: 76520400300 Dte: Banco de Bogotá Ddo:Luz Adriana

Боттон Текст

2 ответа

Решение

Cloud Vision API не имеет специального свойства запроса для указания формата, используемого для чтения или сортировки данных файла. Вместо этого я думаю, что доступный обходной путь заключается в использовании свойств ответа BoundingPoly и Vertex, которые отображают координаты, связанные с каждым словом, содержащимся в изображении, для обработки данных вершин в логике кода и определения текста, который должен быть сгруппированы по столбцам и строкам. Вы можете посмотреть по этой ссылке, которая включает в себя несколько примеров ответов, которые включают эти свойства.

В случае, если эта функция не покрывает ваши текущие потребности, вы можете использовать кнопку " Отправить отзыв", расположенную в нижнем левом и правом верхних углах общедоступной документации службы, а также взглянуть на инструмент "Отслеживание проблем", чтобы вызвать Запрос функции API Vision и уведомление Google об этой желаемой функциональности.

Член команды Google ответил, что Document AI работает лучше, чем Cloud Vision, согласно обновленной информации о проблеме.

Другие вопросы по тегам