Почему я не могу скопировать символы IPA из PDF в Linux?

У меня есть файл PDF с некоторыми фонетическими символами (IPA), такими как: ʤ, ə и т. Д. Если я копирую текст с этими символами, я вставляю текст без них.

Linux Mint 17.

1 ответ

Я предлагаю использовать Apache Tika. После установки используйте следующую команду:

java -jar tika-app-1.0.jar ‐‐text < document.pdf > document.txt
Другие вопросы по тегам