Извлечение данных из PDF в CSV с помощью R
Я использовал этот код для извлечения данных из моего PDF-файла:
tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")
Но здесь используется конец строки для разделения PDF. Я хочу отделить каждый абзац. Есть ли какая-нибудь другая функция разделения, которую я могу использовать для получения данных по абзацам?