Описание тега cgpdfscanner

2 ответа

Невозможно прочитать текст из PDF в IOS

Я пытаюсь извлечь текст для PDF-документа в моем приложении iOS, я использую CGPDFScanner.. Я использовал ссылку из этих ссылок: нужен поиск по списку в VFR Reader Отображение и поиск содержимого PDF на iPhone Методы, указанные в двух вышеупомянутых…
18 фев '14 в 07:50
0 ответов

Чтение текста из PDF с помощью CGPDFScanner - что не так с этим файлом PDF?

Я пытаюсь извлечь текст из этого файла: https://www.dropbox.com/s/249snnj1nsve5ir/Lebenslauf.pdf?dl=0 используя CGPDFScanner. Я могу обнаружить, что кодировка символов - это WinAnsiEncoding из включенного словаря PDF, но все символы искажены. В каче…
17 апр '15 в 08:36
1 ответ

CGPDFScanner - \x15 символ во время сканирования

Я пытаюсь извлечь текст страницы 5 в формате PDF.PDF имеет шрифт YLJAAA+CMSY10, который не имеет отображений (CMap) или даже кодировок (кодировка по умолчанию или /Differences). При извлечении текста после строки "tetex package" CGPDFScanner возвращ…
07 июл '15 в 10:37
1 ответ

iOS pdf поиск наиболее ярких результатов

Я нашел здесь отличный пост http://web.archive.org/web/20131122162015/http://blog.random-ideas.net/?p=184 котором рассказывается, как использовать сканер, но как выделить результат?
13 ноя '14 в 18:58
1 ответ

Отсутствует оператор синтаксического анализа PDF

Я анализирую файл PDF, и кажется, что оператор Tf отсутствует. На устройствах чтения PDF, таких как Acrobat Reader или Preview, я вижу, что шрифт изменяется. Но во время разбора у меня нет оператора Tf. У меня все еще есть оператор ET, который отмеч…
18 фев '16 в 15:52
1 ответ

iOS Как получить координаты всех слов на странице PDF

Я просмотрел много уроков и обычно собирал ссылки на pdfkitten, но, как я его тестировал, я не удовлетворен результатом. Так что поиск не работает с умножением слова и т. Д. Итак, что я ищу, мне нужно получить все слова со страницы pdf и выделить их…
12 июн '14 в 16:29
1 ответ

Чтение точного текста из оператора "Tj/TJ" в CGPDFDictionaryRef

Я пытаюсь прочитать текст из оператора "Tj / TJ" в CGPDFDictionary, но оператор TJ/Tj имеет текст в (кодированном) формате, например, дляTj = <00> <1F><05>. Теперь я хочу получить этот точный текст в NSString, т.е. NSString должен содержать "<00> <1…
1 ответ

Передача UnsafeMutablePointer в Ref Object в функции в Swift 3

Я разрабатываю анализатор PDF в Swift, поэтому я наткнулся на функцию CGPDFScannerPopString, которая принимает CGPDFScannerRef и UnsafeMutablePointer? Код Objective C выглядит следующим образом: CGPDFStringRef pdfString; CGPDFScannerPopString(pdfSca…
1 ответ

Пробелы не обнаруживаются при сканировании PDF - iOS (CGPDFScanner)

Я работаю над сканированием PDF, где я хочу извлечь текст из PDF. Я использую pdf Multithreading.pdf для поиска. Я могу извлечь текст, но не могу извлечь пробелы из текста. Я получаю только обратные вызовы для оператора Tj, а не для TJ. В чем может …
20 ноя '14 в 12:29
1 ответ

При разборе PDF получить один и тот же текст дважды на разных страницах

У меня есть файл PDF, который содержит 2 страницы. Когда я анализирую это с моим анализатором, в Ojective-C, я имею следующую ситуацию. Для первой страницы все в порядке, у меня есть текст, который я должен был иметь (который я визуально вижу в прог…
03 июн '13 в 12:00
1 ответ

iOS - различать фоновый текст (водяной знак) и реальный текст в PDF

У меня есть PDF с водяным знаком на заднем плане. Когда начинается сканирование для выделения любого слова водяным знаком или аннотацией на фоне, оно выбирается так, как оно было найдено первым в области касания. Я использую CGPDFScanner для сканиро…
19 июн '15 в 11:50
1 ответ

CGPDFStringGetBytePtr возвращает неверную строку при сканировании pdf

У меня есть один PDF, и я пытаюсь сканировать PDF с помощью CGPDFScanner. При сканировании PDF, когда встречается слово "файл", CGPDFStringGetBytePtr API возвращает "\x02le". PDF имеет шрифт Type1 и не имеет ToUnicodeMapping(CMap). Словарь кодирован…
08 май '15 в 07:36
1 ответ

Разбирать поток содержимого PDF как строку в xCode?

Я пытаюсь получить поток содержимого из внутренней структуры PDF-файлов с помощью xCode. Мне удалось добраться до массива содержимого с помощью: CGPDFDictionaryGetArray (str, "Contents", & val) Затем подсчитываем количество объектов в массиве, возвр…
21 ноя '13 в 10:33
1 ответ

CGPDFScannerScan не вызывает функцию обратного вызова

Я пытаюсь получить strings из pdfFile отправлено в мое приложение через меню Открыть в... из другого приложения. Я написал pdfscanner к которому я передаю pdfPage и сканер должен запустить обратный вызов "getString"Я в основном использую SWIFT, но к…
26 дек '14 в 20:24
0 ответов

Получить PDF-текст в быстром

Я безуспешно пытаюсь получить текст со страницы в формате pdf. я попробую: CGPDFOperatorTableSetCallback(operatorTableRef!, "ET") { (scanner, info) in var val:UnsafePointer&lt;Int8&gt;? let ret=CGPDFScannerPopName(scanner, &amp;val) print("ET : \(va…
16 ноя '16 в 13:10
2 ответа

iOS: PDF-сканер получает координаты текста

Я использую CGPDFScanner для сканирования PDF. Должен ли я использовать оператор Td, чтобы найти позиции текста? Могу ли я иметь пример того, как использовать этот оператор, чтобы получить позиции текста? Тока я использовал операторы Tj и TJ, чтобы …
29 янв '13 в 07:25