Можно ли заменить необычные шрифты PDF документа обычными шрифтами?

Я получил файл PDF, который использует необычные шрифты.

нестандартные шрифты

Шрифты прекрасно смотрятся человеческому глазу,

шрифты выглядят хорошо

но если я попытаюсь cut-past я получаю строку '???'

Можно ли заменить определенные шрифты документа PDF обычными шрифтами (например, в PDF-редакторе Foxit Phantom)?

1 ответ

Это может быть возможно, например, с PitStop Pro от Enfocus. Однако, как другие указали в комментариях, возможно, что шрифты в pdf и самом pdf имели всю информацию, чтобы сделать это возможным удаленным.

Может быть, более подробно об этом:

Кодировка в PDF-файле может указывать программному обеспечению, какой символ должен отображаться, и тогда этот символ будет выбран из шрифта для отображения, но также возможно создать PDF-файл, чтобы он отображал только "показать глиф 3 во встроенном шрифте". шрифт'. Вот что делает кодировка Identity-H, которую вы видите в сводке.

Обратите внимание, что слово "глиф", а не "символ" специально используется, когда речь идет об отдельных "рисунках", которые составляют шрифт, чтобы указать, что эти вещи являются только "случайными" рисунками, пока некоторая информация не будет добавлена ​​в шрифт, чтобы указать, какая буква (или другой символ, например число), которые они представляют.

Например, для символа 'нижний регистр-а' шрифт, на который вы сейчас смотрите, имеет следующий глиф:

но другие шрифты будут иметь что-то, что может выглядеть совершенно иначе. Только потому, что мы научились читать эти разные изображения как строчные буквы, мы думаем, что они представляют одну и ту же букву.

Если этой информации нет в PDF, как в вашем случае, все же возможно, что эту информацию можно получить из шрифта, включенного в pdf: шрифт на вашем компьютере должен каким-то образом позволить программе выбрать правильный глиф если он хочет отобразить "нижний регистр-а". Однако, если pdf настроен так, чтобы просто сказать "показать глиф № 3 во встроенном шрифте", эта информация больше не нужна, и ее можно удалить из шрифта, прежде чем шрифт будет помещен в pdf. Это делается либо для того, чтобы уменьшить размер PDF, либо для предотвращения копирования текста, например, работ, защищенных авторским правом.

В этом случае только OCR может помочь. Я думаю, что Adobe Acrobat (полная версия, а не Adobe Reader) добавил именно это в одной из последних версий; однако это означает, что он пытается угадать букву из показанного "изображения", поэтому может ошибиться.

Другие вопросы по тегам