Преобразование в weka arff формат
Я хочу преобразовать файл по этой ссылке: http://archive.ics.uci.edu/ml/datasets/Credit+Approval чтобы соответствовать файлу weka.arff и открыть его там.
я знаю, что нам нужно определить файл как:
@связь
@attribute
@данные
Я нашел данные, но не нашел атрибутов! также отношение имя файла верно?
и последнее, как сделать расширение файла.arff?
пожалуйста помоги. Спасибо огромное!!
2 ответа
Если вы хотите следовать подходу на основе GUI, то
1) открыть crx.data
в любом редакторе.
2) Добавьте заголовок столбца в первой строке, например:
A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13,A14,A15,Class
3) Сохраните файл как crx.csv
4) Открыть Weka
-> Explorer
5) В preprocess
вкладка -> нажмите на Open file
6) Изменить тип файла csv
7) Найдите файл 'crx.csv`
8) Нажмите на Save
9) Укажите имя файла crx.arff
,
Это сделано
В файле crx.names из папки с данными говорится: все имена и значения атрибутов были изменены на бессмысленные символы для защиты конфиденциальности данных.
Но они дают вам ценности, которые они используют:
Информация об атрибутах:
A1: b, a. A2: continuous. A3: continuous. A4: u, y, l, t. A5: g, p, gg. A6: c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff. A7: v, h, bb, j, n, z, dd, ff, o. A8: continuous. A9: t, f. A10: t, f. A11: continuous. A12: t, f. A13: g, p, s. A14: continuous. A15: continuous. A16: +,- (class attribute)
Вы можете дать этой информации то значение, которое вам нужно.
Для создания этого файла arff вы пишете что-то вроде этого:
%Test Data set
@relation Credit Approval Data Set
@attribute attribute_name {a,b}
@attribute ...
@data
b,30.83,0,u,g,w,v,1.25,t,t,01,f,g,00202,0,+
Добавьте следующий атрибут, читающий credit.lisp, вам нужно 16 атрибутов. Сохраните файл как: имя file.arff. Вы можете создать этот файл в текстовом редакторе по вашему выбору.