Как я могу объединить два файла в интеграции данных Pentaho (чайник)

Я работаю с Pentaho Data Integration (Kettle) и у меня есть вопрос.

У меня есть два входных файла file1.txt а также file2.txt с тем же заголовком:

  • file1.txt

    NAME;AGE
    alberto;22
    angela;22
    madelaine;23
    
  • file2.txt

    NAME;AGE
    carlos;56
    fernando;30
    ana;16
    

и я хочу объединить оба файла в один, files_together.txt

NAME;AGE
alberto;22
angela;22
madelaine;23
carlos;56
fernando;30
ana;16

Я все перепробовал (думаю) и не знаю как это сделать. Я искал в Google, Youtube... без положительного соответствия.

Большое спасибо.

3 ответа

Решение

Ответ; Просто поместите вывод каждого файла, который вы хотите объединить, как ввод окончательного.

Я лично нашел, что "Добавить поток" более полезен, поскольку он объединяет потоки. Направляя два входа в один выход, они работают параллельно, поэтому результаты будут чередоваться в зависимости от различных факторов. Использование Append Stream даст вам результаты из файла file1, а затем из файла file2 в выводе.

Вы должны "Выбрать значения" шаг. Название полей должно быть одинаковым.

Я пытался что-то подобное с файлами.csv. Попробовал донг, что вы предложили, но у меня это не сработало. Во многих других блогах говорилось: "Лучше использовать сценарии Excel, чем использовать Pentaho Data Integration (Kettle) для этого". что не соответствует действительности.

Вы можете использовать шаг "Добавить поток", который относится к категории потока преобразования. Который занимает два входных слияния, он предоставляет вам ожидаемый объединенный файл. Попробуйте, если это поможет. Вы также можете этот шаг, чтобы объединить большее количество файлов друг с другом.

ура

Другие вопросы по тегам