Загрузка внешних пользовательских шрифтов в документы PDF с использованием pdfbox в java

Я нацеливаюсь на чтение контента с не встроенной кодировкой с использованием PDFBox. Свойства шрифта документа PDF Как показано на рисунке, я могу извлечь текст из PDF для всех шрифтов с типом TrueType и Encoding Built-in. В результате я получаю субкодированный текст вместо содержимого типа Type1 и пользовательской кодировки

Я получил следующий текст!

и на самом деле, текст в формате PDF, 7.+13. ОПИСАТЬ РЕАКЦИЮ

В любом случае, мы можем сделать внешние файлы шрифтов доступными для pdf и заставить pdfbox загрузить эти файлы в документ, чтобы мы получили фактический текст, присутствующий в pdf.

0 ответов

Другие вопросы по тегам