Узел отсутствующего значения KNIME не работает
Я использую KNIME для подготовки некоторых наборов данных ML. Речь идет о транзакциях электронной коммерции, где анализ правил ассоциации должен быть сделан позже. Но моя текущая проблема довольно проста, я нахожусь на "этапе подготовки данных", когда узел отсутствующего значения в KNIME не работает.
Я использую KNIME 3.5.2 на Mac OSX
Пример рабочего процесса примитивен и выглядит следующим образом:
Конфигурация первого узла, который читает файл Excel (XLSX)
Конфиг второго узла, который должен заменить отсутствующие значения:
Но досадный результат:
Отображаемое предупреждение:
ПРЕДУПРЕЖДЕНИЕ Отсутствует значение 2:2 В текущих настройках используются методы обработки> пропущенных> значений, которые не могут быть представлены в PMML 4.2
Отображаемое предупреждение как раз о возможной проблеме повторного использования узла KNIME в контексте машинного обучения, как с R oder Spark/MLLIB, из-за проблем несовместимости моделей. Это можно игнорировать здесь.
Должен сказать, вчера это сработало. Я в основном изменил настройку XMX в KNIME.ini, перезапустил KNIME и запустил несколько других рабочих процессов. Когда я вернулся, он больше не работал.
Я думаю, что у KNIME есть какое-то состояние в этом узле, по крайней мере, очевидно, в рабочей области eclipse. Я начал KNIME уже mit -clean, ничего не помогает. Выполнение этого примера на той же версии KNIME на компьютере коллеги работает нормально.
Есть идеи? THX (кстати: я знаю, что я мог бы легко сделать ту же работу с несколькими строками в R oder spark...)
2 ответа
В KNIME только правильное значение пропущено, если вы видите "?" в таблице Knime.
"Решение": я перешел с программы чтения файлов Excel на программу чтения CSV. Файл Excel явно содержал какое-то "значение" в ячейках, которые показаны как пустые.