Удалите верхние и нижние колонтитулы из текстового вывода с помощью Smalot\PdfParser

Я устанавливаю скрипт на основе PDFparser. Это работает для большинства типов PDF для меня. Мне удалось вывести текст в том же формате, в котором он отображается в PDF

$text .= nl2br($page->getText());

Теперь мне нужно выяснить, как удалить верхние и нижние колонтитулы. Из того, что я понял в моем ограниченном исследовании, они не особо отмечены в PDF. Я предполагаю, что если у меня один и тот же тип документа, я смогу найти какой-то шаблон и добавить регулярное выражение.

Вот ссылка на тестовый файл, с которым я работал: https://docdro.id/NyFyxJq

Как это обычно делается? Кто-нибудь был в состоянии сделать это с PdfParser?

0 ответов

Другие вопросы по тегам