Получить координаты таблицы с табулой
Я использую Tabula-py, чтобы получить таблицы PDF. Я хочу обрезать PDF, чтобы получить изображение таблицы. Как я могу получить координаты таблицы, которая была обнаружена Табулой?
0 ответов
Существует множество специфичных для языка библиотек с открытым исходным кодом, таких как tabula, camelot и т. Д., Которые действуют как средства извлечения таблиц, имеют основное ограничение и работают только с текстовыми PDF-файлами.
Если вы хотите извлечь таблицы из изображений или отсканировать PDF-файлы, возможно, вам следует попробовать ExtractTable.
ExtractTable использует AI для обнаружения табличной структуры в изображении и SCAN PDF, что позволяет разработчикам анализировать таблицы через API. Это дает разработчикам главное преимущество - не беспокоиться о координатах столбцов или области таблицы, повернутые изображения и др.