Синтаксический анализ таблицы pdf возвращает текст с (cid:xxx)

Camelot может правильно определить схему таблицы на странице PDF, однако некоторые столбцы содержат текст с cid как "(cid:1005)(cid:856)(cid:1008)(cid:1009)(cid:1081)" . Кто-нибудь нашел решение, чтобы обойти эту проблему?

Я искал переполнение стека, но не смог найти решение для решения проблемы разрешения cids в простой текст.

0 ответов

Другие вопросы по тегам