Экспорт PDF > HTML с помощью Acrobat Pro, все специальные символы отображаются? несмотря на кажущуюся кодировку UTF-8.
У меня есть набор PDF-файлов, которые я экспортирую в HTML-файлы с помощью опции экспорта HTML 4.01. Когда я открываю файлы в SublimeText или Chrome, все специальные символы отображаются как?. Заявленная кодировка UTF-8:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html40/strict.dtd">
<!-- Created from PDF via Acrobat SaveAsXML -->
<!-- Mapping table version: 28-February-2003 -->
<HTML>
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=UTF-8">
Проблема сохраняется, если я использую опцию SublimeText "Save with encoding-" и сохраняю в UTF-8. Странно то, что это происходит только с некоторыми PDF-файлами. Другие сохраняются с правильной кодировкой, но нет никакой разницы в процессе экспорта. Есть ли что-то, что я могу проверить в самих файлах PDF или в процессе экспорта, чтобы посмотреть на это?