Как использовать page.filter(test_function) в библиотеке PDFPlumber?
Я пытаюсь удалить таблицы внутри страницы pdf и пытаюсь использовать для этого функцию page.filter(), здесь у меня есть координаты bbox таблицы, и я пытаюсь сравнить, находятся ли координаты объекта внутри координат таблицы или нет. Но я не смог найти пример использования функции фильтра.
вот ссылка на документацию
Я пытался таким образом:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(lambda x: x if filter_func(x) else '')
но это использование не работает, к сожалению, пожалуйста, помогите узнать, как использовать функцию page.filter
1 ответ
Решение
Нашел это, которое работает:
def filter_func(object):
#some logic to find the coordinates inside boundary or not
new_page = page.filter(filter_func)
page.filter является генератором и выполняется только при использовании new_page