Преобразование документа для формы PDF (например, w2/1040/etc) в виде ключа / значений вместо одной строки на основе информации о шрифте

Попытка использовать службу преобразования документов для захвата пар ключ / значение json для документов pdf, таких как (w2/1040/etc формы).

Содержимое таких форм в ответе json входит как часть "текста" в "содержимое". Отсутствуют данные формы, но в основном визуализируются метки формы в виде одной строки.

Я хотел бы знать, есть ли в любом случае захватить данные формы для PDF (w2 / 1040 / и т. Д.) Как ключ / значения в JSON вместо одной строки?

Благодарю.

1 ответ

К сожалению, Служба преобразования документов в настоящее время не поддерживает формы в PDF-файлах. Самое большее, он может распознавать некоторые формы как таблицы, но не как пары ключ / значение.

Если он распознает форму как таблицу, вам все равно нужно будет выполнить некоторую нетривиальную постобработку, чтобы сопоставить ее с парами ключ / значение.

Другие вопросы по тегам