Вывод pdf2htmlEX показывает шрифт Times New Roman только для нескольких символов?

Я никогда не видел ничего подобного. Я использую инструмент под названием pdf2htmlEX, который конвертирует PDF в HTML, но у меня странная проблема. Посмотрите на этот скриншот:

Смотрите первый символ (W)? Это в Times New Roman. Теперь вот еще более странная часть:

Только W а также ' находится в Times New Roman (2 символа), а остальные в Libration Sans. Как на земле это возможно? Как pdf2htmlEX в состоянии использовать разные шрифты для каждого символа?

Имейте в виду, что если я напишу эти символы где-либо еще, они будут написаны шрифтом без засечек (документ изначально Verdana, вот почему).

Любая подсказка, почему это происходит и как я могу это исправить?

1 ответ

Ооо, я мог бы найти ответ, но, честно говоря, не тот, который я хотел.

У меня есть PDF, который был создан в Microsoft Word и экспортирован как PDF, никогда не использовал символ W (в данном случае). Когда я случайно добавил его в свой документ, теперь он обычно отображается в HTML.

У меня есть ощущение, что pdf2htmlEX компилирует шрифт на основе символов, используемых в документе. Очень странно.

Не уверен, что у меня есть решение для этого, но теперь у меня есть объяснение по крайней мере.

Другие вопросы по тегам