Удалите верхние и нижние колонтитулы из текстового вывода с помощью Smalot\PdfParser
Я устанавливаю скрипт на основе PDFparser. Это работает для большинства типов PDF для меня. Мне удалось вывести текст в том же формате, в котором он отображается в PDF
$text .= nl2br($page->getText());
Теперь мне нужно выяснить, как удалить верхние и нижние колонтитулы. Из того, что я понял в моем ограниченном исследовании, они не особо отмечены в PDF. Я предполагаю, что если у меня один и тот же тип документа, я смогу найти какой-то шаблон и добавить регулярное выражение.
Вот ссылка на тестовый файл, с которым я работал: https://docdro.id/NyFyxJq
Как это обычно делается? Кто-нибудь был в состоянии сделать это с PdfParser?