Как читать файлы следов Golden Gate, используя интеграцию данных Pentaho

Я пытаюсь прочитать файл следа Golden Gate, используя интеграцию данных Pentaho (KETTLE), но я не знаю, как это сделать? Любой, пожалуйста, помогите мне, как прочитать файл следа Золотых Ворот.

Заранее спасибо.

С уважением, Сентил.

1 ответ

Тропа Золотые Ворота имеет нетривиальную структуру:

https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm

Должно быть возможно проанализировать это с помощью PDI, но такое решение будет довольно сложным. Вот несколько возможных подходов:

1) Попробуйте разделить файл на различные "области" и обработайте области одну за другой, возможно, с помощью суб-преобразований, чтобы сохранить его модульным и организованным.

2) Если вы ищете текст в файле (файлах), вы можете использовать плагин "Загрузить текст из файла" в PDI Marketplace. Он использует Apache Tika для извлечения текста из документов.

3) Если вы захотите написать код для этого, он станет отличным плагином для PDI:). Когда я сталкиваюсь со сложными файловыми структурами, я обычно пишу грамматику ANTLR для анализа, затем я пишу плагин PDI для вызова анализатор и преобразование значений в формат строки (т.е. табличный) PDI.

Другие вопросы по тегам