Как читать тексты в одной колонке с помощью Google Cloud Vision API
У меня есть следующий документ изображения
Когда я пытаюсь преобразовать изображение в текст, результат будет следующим:
Заголовок
Ссылка: Rad: Dte: Ddo:
Ejecutivo 76520400300 Банко де Богота Лус Адриана
Боттон Текст
Проблема в том, что Google API распознает его как две колонки, поэтому, как я могу настроить Google API для получения одного столбца текста?
Моя цель - получить:
Заголовок
Ссылка:Ejecutivo Rad: 76520400300 Dte: Banco de Bogotá Ddo:Luz Adriana
Боттон Текст
2 ответа
Cloud Vision API не имеет специального свойства запроса для указания формата, используемого для чтения или сортировки данных файла. Вместо этого я думаю, что доступный обходной путь заключается в использовании свойств ответа BoundingPoly и Vertex, которые отображают координаты, связанные с каждым словом, содержащимся в изображении, для обработки данных вершин в логике кода и определения текста, который должен быть сгруппированы по столбцам и строкам. Вы можете посмотреть по этой ссылке, которая включает в себя несколько примеров ответов, которые включают эти свойства.
В случае, если эта функция не покрывает ваши текущие потребности, вы можете использовать кнопку " Отправить отзыв", расположенную в нижнем левом и правом верхних углах общедоступной документации службы, а также взглянуть на инструмент "Отслеживание проблем", чтобы вызвать Запрос функции API Vision и уведомление Google об этой желаемой функциональности.
Член команды Google ответил, что Document AI работает лучше, чем Cloud Vision, согласно обновленной информации о проблеме.