Извлечение текста из раздела PDF с сохранением строк в одну строку
У меня есть куча файлов PDF, и мне нужно извлечь из них некоторую информацию. "Раздел" имеет текст "Referências" и выглядит как на картинке ниже:
Я пробовал много инструментов для извлечения текста, чтобы выполнить эту задачу, но проблема в том, что мне нужно, чтобы строка оставалась в той же строке, я не знаю, могу ли я объяснить это правильно, поэтому давайте посмотрим пример:
Я не хочу этого: Я хочу чтобы:
Надеюсь, вы понимаете, извините за английскую вещь. Большое спасибо.