Поиск текста, выделен он или нет

Я сейчас пытаюсь использовать PyPDF2 прочитать файл PDF в Python.Я хочу знать, выделен ли текст файла PDF или нет.

Контекст:

Мы используем для выделения текста в файле PDF другим цветом. Есть ли способ узнать, какой текст выделен в Python, используя какую-либо библиотеку или около того? Если есть, пожалуйста, направьте меня к нужному источнику.

Я смотрю во многих местах для этой проблемы. Что я нашел это PyPDF2 не может решить эту проблему?

1 ответ

В PyPdf2 вы можете использовать getObject, который является словарем. Затем вы можете найти ключ = '/Annots' и его значения в нем. Вы можете по крайней мере знать, имеет ли страница выделенный текст или нет.

Другие вопросы по тегам