Процесс Pentaho Kettle не закончится в Ubuntu

Я использую интеграцию данных Pentaho на сервере Ubuntu. У меня есть несколько заданий, которые выполняются в разное время с использованием Дженкинса в качестве организатора. Я заметил, что иногда задание PDI никогда не заканчивается (я не получаю код выхода и журналы замирают в середине процесса без исключений), и когда я проверяю память сервера, она полностью выделяется. Это поднимает следующие вопросы:

  1. Разве Pentaho не должен выдавать исключение OutOfMemory Java, когда память сервера полностью распределена?
  2. Почему запускается Pentago biserver-ee, если у меня нет процесса, который запускает сервер? Я запускаю Джобса только с помощью kitchen.sh.
  3. Почему у меня всегда работает постоянный процесс Pentaho (см. Процесс № 2 на рисунке)? Это должен быть процесс Pentaho, так как параметры Java такие же, как и у моей конфигурации spoon.sh, но должен ли он быть постоянным, если все задания завершены?
  4. Запускает ли Spoon/kettle/PDI/Pentago постоянный процесс для выделения памяти, указанной параметром Xms?
  5. Почему мой постоянный процесс в Пентахо использует 1 ядро ​​на все 100%?

Это не имеет смысла, так как в данный момент ничего не работает. Я хочу знать, как определить проблемы, так как журналы перестают печатать результаты, поэтому я не знаю, с чего начать, чтобы решить эту проблему.

Я прикрепляю изображение трех процессов, которые занимают память на моем сервере (Jenkins, Pentaho BI Server и Spoon) и спецификации моего сервера, настройки Java и Pentaho.

Спецификации сервера (это виртуальная машина, созданная с помощью VmWare):

  1. ОС: Ubuntu 14.04.4
  2. RAM: 12 ГБ
  3. Ядер: 4

Моя версия Java "1.8.0_101"

Я изменил параметры памяти в spoon.sh следующим образом:

  1. Xms: 1024 м
  2. Xmx: 7 ГБ
  3. XX:MaxPermSize=2 Гб

введите описание изображения здесь

1 ответ

Как вы установили инструменты Pentaho? Если вы установили пробную версию Pentaho Enterprise Edition, то она установит и настроит сервер и клиент PDI (включая кухню).

Если тогда вы запустите ctlscript.sh start скрипт, он запустит сервер Pentaho, базу данных хранилища (по умолчанию postgres) и все, что с этим связано.

Если вы работаете только через кухню и не хотите использовать репозиторий Pentaho, тогда вы можете полностью остановить сервер Pentaho и запустить задания PDI и преобразования из файловой системы.

Что касается ошибки ООО: да, это должно бросить это. Иногда случается, что PDI останавливается внезапно и не выдает никаких ошибок, но в большинстве случаев вы будете видеть сообщение OOO в журналах, и сбой будет правильно обнаружен.

Другие вопросы по тегам