iOS: PDF-сканер получает координаты текста

Question

iOS: PDF-сканер получает координаты текста

Я использую CGPDFScanner для сканирования PDF. Должен ли я использовать оператор Td, чтобы найти позиции текста? Могу ли я иметь пример того, как использовать этот оператор, чтобы получить позиции текста? Тока я использовал операторы Tj и TJ, чтобы найти текст. Теперь я хотел бы узнать положение каждого слова на одной странице PDF. Как я могу это сделать?

Спасибо

2

ios iphone cgpdfscanner

Источник

user340002 29 янв '13 в 07:25

2 ответа

Другие вопросы по тегам ios iphone cgpdfscanner

user465916 09 апр '13 в 15:14 2013-04-09 15:14 · Answer 1 · 2013-04-09 15:14

Посмотрите эту библиотеку: https://github.com/KurtCode/PDFKitten/ найдите и выделите текст

1

Источник

user465916 09 апр '13 в 15:14

user1118321 07 сен '15 в 05:03 2015-09-07 05:03 · Answer 2 · 2015-09-07 05:03

Чтобы получить координаты текста, вам нужно отслеживать матрицу преобразования текста. См. Раздел 5.3.1, "Операторы позиционирования текста" в PDF 1.4 Reference. (Я не уверен, что более поздние версии ссылочного номера одинаковы или нет.) Хотя Td Оператор установит текущий перевод в текстовой матрице, есть другие операторы, которые влияют на текстовую матрицу, а также на другое состояние текста. Вам нужно следить за текстовой матрицей при обработке файла. Tm Оператор напрямую установит текстовую матрицу. TD Оператор перемещается на следующую строку и смещается по параметрам x и y. T* просто переходит на следующую строку.