Как использовать page.filter(test_function) в библиотеке PDFPlumber?

Я пытаюсь удалить таблицы внутри страницы pdf и пытаюсь использовать для этого функцию page.filter(), здесь у меня есть координаты bbox таблицы, и я пытаюсь сравнить, находятся ли координаты объекта внутри координат таблицы или нет. Но я не смог найти пример использования функции фильтра.

вот ссылка на документацию

Я пытался таким образом:

def filter_func(object):
  #some logic to find the coordinates inside boundary or not

new_page = page.filter(lambda x: x if filter_func(x) else '')

но это использование не работает, к сожалению, пожалуйста, помогите узнать, как использовать функцию page.filter

1 ответ

Решение

Нашел это, которое работает:

def filter_func(object):
 #some logic to find the coordinates inside boundary or not

new_page = page.filter(filter_func)

page.filter является генератором и выполняется только при использовании new_page

Другие вопросы по тегам