Как заказать входные файлы на шаге Excel в Пентахо

Я использую шаг ввода Excel в преобразовании; Мне нужно обработать много файлов Excel в каталоге; проблема в том, что чайник обрабатывает их произвольным образом, так что результат не всегда соответствует ожиданиям. Есть ли способ указать порядок обработки файлов? Мне нужна ложка, чтобы обработать их по дате, начиная от самой старой до самой новой. Спасибо.

2 ответа

Решение

Поздний ответ, но я все еще могу помочь.

Вы можете сначала использовать "Получить имена файлов" и получить список файлов в каталоге. Затем вы используете "Sort Rows" и сортируете по "lastmodifiedtime" (не думайте, что доступно "filecreated time", так что это риск). Затем вы пишете результат в журнал. После этого вы читаете этот журнал, обрабатывая файл один за другим.

Я не знаю, есть ли надежный способ заставить PDI обрабатывать файлы в определенном порядке на уровне работы.

Но вы можете перейти на вкладку "Дополнительные поля вывода" в шаге ввода Excel и указать имя поля для имени файла ("Поле полного имени файла" или "Поле короткого имени файла"). Это приведет к тому, что имя вашего файла будет добавлено в виде столбца при выводе шага ввода Excel с указанным вами именем. Затем просто пропустите это через Sort rows шаг и сортировка по этому столбцу.

Другие вопросы по тегам