Как читать файлы следов Golden Gate, используя интеграцию данных Pentaho
Я пытаюсь прочитать файл следа Golden Gate, используя интеграцию данных Pentaho (KETTLE), но я не знаю, как это сделать? Любой, пожалуйста, помогите мне, как прочитать файл следа Золотых Ворот.
Заранее спасибо.
С уважением, Сентил.
1 ответ
Тропа Золотые Ворота имеет нетривиальную структуру:
https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm
Должно быть возможно проанализировать это с помощью PDI, но такое решение будет довольно сложным. Вот несколько возможных подходов:
1) Попробуйте разделить файл на различные "области" и обработайте области одну за другой, возможно, с помощью суб-преобразований, чтобы сохранить его модульным и организованным.
2) Если вы ищете текст в файле (файлах), вы можете использовать плагин "Загрузить текст из файла" в PDI Marketplace. Он использует Apache Tika для извлечения текста из документов.
3) Если вы захотите написать код для этого, он станет отличным плагином для PDI:). Когда я сталкиваюсь со сложными файловыми структурами, я обычно пишу грамматику ANTLR для анализа, затем я пишу плагин PDI для вызова анализатор и преобразование значений в формат строки (т.е. табличный) PDI.