Как объявить класс при загрузке набора данных из базы данных в Weka

Я пытаюсь понять, как следующий файл.arff может быть выражен в Weka при загрузке данных из базы данных вместо файла. Файл.arff имеет следующую форму:

@relation sample
@attribute expression string
@attribute tone {postive,negative}

@data
'this is a happy message', positive
'this is an unhappy message', negative

В случае загрузки данных из базы данных, состоящей из одной таблицы с двумя полями - выражением и тоном - как я могу сообщить weka, что тон поля получает только два возможных значения, положительное или отрицательное?

Оба поля являются строками. Я хочу применить фильтр NominalToString к выражению, чтобы преобразовать его в String, и применить фильтр StringToWord. Однако из-за атрибута тона это не может быть сделано... Какие-нибудь решения?

2 ответа

Решение

Я задавал тот же вопрос раньше. Вы можете увидеть подробный ответ и необходимый код в этом вопросе.

краткий ответ: вы объединяете правильный заголовок arff из внешнего файла с данными из базы данных.

"Однако из-за атрибута тона это не может быть сделано..." - я не понимаю, почему. Вы можете обработать только поле "выражение". Вы можете применять NominalToString избирательно к любым атрибутам, которые вы хотите. Проверьте функцию setAttributeIndexes.

Другие вопросы по тегам