Можно ли заменить необычные шрифты PDF документа обычными шрифтами?
1 ответ
Это может быть возможно, например, с PitStop Pro от Enfocus. Однако, как другие указали в комментариях, возможно, что шрифты в pdf и самом pdf имели всю информацию, чтобы сделать это возможным удаленным.
Может быть, более подробно об этом:
Кодировка в PDF-файле может указывать программному обеспечению, какой символ должен отображаться, и тогда этот символ будет выбран из шрифта для отображения, но также возможно создать PDF-файл, чтобы он отображал только "показать глиф 3 во встроенном шрифте". шрифт'. Вот что делает кодировка Identity-H, которую вы видите в сводке.
Обратите внимание, что слово "глиф", а не "символ" специально используется, когда речь идет об отдельных "рисунках", которые составляют шрифт, чтобы указать, что эти вещи являются только "случайными" рисунками, пока некоторая информация не будет добавлена в шрифт, чтобы указать, какая буква (или другой символ, например число), которые они представляют.
Например, для символа 'нижний регистр-а' шрифт, на который вы сейчас смотрите, имеет следующий глиф:
но другие шрифты будут иметь что-то, что может выглядеть совершенно иначе. Только потому, что мы научились читать эти разные изображения как строчные буквы, мы думаем, что они представляют одну и ту же букву.
Если этой информации нет в PDF, как в вашем случае, все же возможно, что эту информацию можно получить из шрифта, включенного в pdf: шрифт на вашем компьютере должен каким-то образом позволить программе выбрать правильный глиф если он хочет отобразить "нижний регистр-а". Однако, если pdf настроен так, чтобы просто сказать "показать глиф № 3 во встроенном шрифте", эта информация больше не нужна, и ее можно удалить из шрифта, прежде чем шрифт будет помещен в pdf. Это делается либо для того, чтобы уменьшить размер PDF, либо для предотвращения копирования текста, например, работ, защищенных авторским правом.
В этом случае только OCR может помочь. Я думаю, что Adobe Acrobat (полная версия, а не Adobe Reader) добавил именно это в одной из последних версий; однако это означает, что он пытается угадать букву из показанного "изображения", поэтому может ошибиться.