PDFPage.string возвращает знаки вопроса

PDFKit введен в iOS 11 и является очень мощным инструментом для чтения и управления PDF-документами. Тем не менее, похоже, что PDFKit по-прежнему не может обрабатывать многобайтовые символьные строки, такие как PDF-документы на китайском языке, даже те, которые закодированы шрифтом Apple Pinfang-SC-Regular. С помощью PDFPage.string на таких документах отображается строка знаков вопроса вместо обычных символов UTF.

Я знал, что в традиционной платформе Core Graphics PDF преобразование строки документа PDF в NSString может быть очень утомительным, хитрым или просто невозможным при обработке нелатинских символов, если связанная карта Font's /toUnicode не завершена (см., Например, этот вопрос SO и ответ /questions/14490912/cgpdfscannerpopstring-vozvraschaet-strannyij-rezultat/14490920#14490920). Мне просто интересно, вызвано ли то же самое тем, с чем я столкнулся с PDFKit, и есть ли обходной путь, тем более что PingFang - это чисто семейство шрифтов Apple.

0 ответов

Другие вопросы по тегам