Почему я не могу скопировать символы IPA из PDF в Linux?
У меня есть файл PDF с некоторыми фонетическими символами (IPA), такими как: ʤ, ə и т. Д. Если я копирую текст с этими символами, я вставляю текст без них.
Linux Mint 17.
1 ответ
Я предлагаю использовать Apache Tika. После установки используйте следующую команду:
java -jar tika-app-1.0.jar ‐‐text < document.pdf > document.txt