Загрузка внешних пользовательских шрифтов в документы PDF с использованием pdfbox в java
Я нацеливаюсь на чтение контента с не встроенной кодировкой с использованием PDFBox. Как показано на рисунке, я могу извлечь текст из PDF для всех шрифтов с типом TrueType и Encoding Built-in. В результате я получаю субкодированный текст вместо содержимого типа Type1 и пользовательской кодировки
Я получил следующий текст!
и на самом деле, текст в формате PDF, 7.+13. ОПИСАТЬ РЕАКЦИЮ
В любом случае, мы можем сделать внешние файлы шрифтов доступными для pdf и заставить pdfbox загрузить эти файлы в документ, чтобы мы получили фактический текст, присутствующий в pdf.