Извлечение данных из PDF в CSV с помощью R

Я использовал этот код для извлечения данных из моего PDF-файла:

tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")

Но здесь используется конец строки для разделения PDF. Я хочу отделить каждый абзац. Есть ли какая-нибудь другая функция разделения, которую я могу использовать для получения данных по абзацам?

0 ответов

Другие вопросы по тегам