WEKA, используя значения классов для решения дерева решений?
Я новичок в WEKA и ML, поэтому прошу прощения за мое невежество следующим. Я потратил впустую несколько часов, пытаясь понять это, так что, надеюсь, кто-то может указать мне правильное направление:
Я пытаюсь запустить дерево решений J48 по данным для USDJPY. Данные были загружены через файл.csv, и значение класса имеет номинальный тип, точнее значение TRUE или FALSE, если USDJPY торгуется более чем на 1% выше после 20 сессий. Проблема в том, что когда я запускаю алгоритм, дерево решений просто использует значение класса для решения проблемы, что бесполезно. Есть *22 атрибута, отличных от атрибута класса, из которого я ищу, чтобы предсказать атрибут класса.
Сравнивая мой набор данных с примером "стеклянного" набора данных, я не могу найти никакой разницы между этими двумя, которые могли бы объяснить мою проблему. "glass.arff" работает, как и ожидалось, когда я запускаю J48 (с идентичными настройками), пытаясь предсказать значение класса (тип стекла) с помощью других атрибутов (то есть некоторые догадки ошибочны).
Что мне здесь не хватает? вот список атрибутов:
@ATTRIBUTE date NUMERIC
@ATTRIBUTE open NUMERIC
@ATTRIBUTE high NUMERIC
@ATTRIBUTE low NUMERIC
@ATTRIBUTE close NUMERIC
@ATTRIBUTE 1daypctchg NUMERIC
@ATTRIBUTE smavg50onclose NUMERIC
@ATTRIBUTE smavg100onclose NUMERIC
@ATTRIBUTE smavg200onclose NUMERIC
@ATTRIBUTE ubb2 NUMERIC
@ATTRIBUTE bollma2 onclose NUMERIC
@ATTRIBUTE lbb2 NUMERIC
@ATTRIBUTE bollwjpybgn NUMERIC
@ATTRIBUTE %bjpybgn NUMERIC
@ATTRIBUTE rsi NUMERIC
@ATTRIBUTE ma50>100 {FALSE,TRUE}
@ATTRIBUTE ma50>200 {FALSE,TRUE}
@ATTRIBUTE ma100>200 {FALSE,TRUE}
@ATTRIBUTE up1pct5d? {FALSE,TRUE}
@ATTRIBUTE up1pct20d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct5d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct20d? {FALSE,TRUE}
1 ответ
Weka (и его реализация J48) должны иметь возможность классифицировать ваши данные, если класс базовых правдивости постоянно находится в том же столбце вашего CSV-файла.