Поиск текста, выделен он или нет
Я сейчас пытаюсь использовать PyPDF2
прочитать файл PDF в Python
.Я хочу знать, выделен ли текст файла PDF или нет.
Контекст:
Мы используем для выделения текста в файле PDF другим цветом. Есть ли способ узнать, какой текст выделен в Python, используя какую-либо библиотеку или около того? Если есть, пожалуйста, направьте меня к нужному источнику.
Я смотрю во многих местах для этой проблемы. Что я нашел это PyPDF2
не может решить эту проблему?
1 ответ
В PyPdf2 вы можете использовать getObject, который является словарем. Затем вы можете найти ключ = '/Annots' и его значения в нем. Вы можете по крайней мере знать, имеет ли страница выделенный текст или нет.