Как я могу объединить два файла в интеграции данных Pentaho (чайник)
Я работаю с Pentaho Data Integration (Kettle) и у меня есть вопрос.
У меня есть два входных файла file1.txt
а также file2.txt
с тем же заголовком:
file1.txt
NAME;AGE alberto;22 angela;22 madelaine;23
file2.txt
NAME;AGE carlos;56 fernando;30 ana;16
и я хочу объединить оба файла в один, files_together.txt
NAME;AGE
alberto;22
angela;22
madelaine;23
carlos;56
fernando;30
ana;16
Я все перепробовал (думаю) и не знаю как это сделать. Я искал в Google, Youtube... без положительного соответствия.
Большое спасибо.
3 ответа
Ответ; Просто поместите вывод каждого файла, который вы хотите объединить, как ввод окончательного.
Я лично нашел, что "Добавить поток" более полезен, поскольку он объединяет потоки. Направляя два входа в один выход, они работают параллельно, поэтому результаты будут чередоваться в зависимости от различных факторов. Использование Append Stream даст вам результаты из файла file1, а затем из файла file2 в выводе.
Вы должны "Выбрать значения" шаг. Название полей должно быть одинаковым.
Я пытался что-то подобное с файлами.csv. Попробовал донг, что вы предложили, но у меня это не сработало. Во многих других блогах говорилось: "Лучше использовать сценарии Excel, чем использовать Pentaho Data Integration (Kettle) для этого". что не соответствует действительности.
Вы можете использовать шаг "Добавить поток", который относится к категории потока преобразования. Который занимает два входных слияния, он предоставляет вам ожидаемый объединенный файл. Попробуйте, если это поможет. Вы также можете этот шаг, чтобы объединить большее количество файлов друг с другом.
ура