Преобразование в weka arff формат

Я хочу преобразовать файл по этой ссылке: http://archive.ics.uci.edu/ml/datasets/Credit+Approval чтобы соответствовать файлу weka.arff и открыть его там.

я знаю, что нам нужно определить файл как:

@связь

@attribute

@данные

Я нашел данные, но не нашел атрибутов! также отношение имя файла верно?

и последнее, как сделать расширение файла.arff?

пожалуйста помоги. Спасибо огромное!!

2 ответа

Если вы хотите следовать подходу на основе GUI, то

1) открыть crx.data в любом редакторе.

2) Добавьте заголовок столбца в первой строке, например:

A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13,A14,A15,Class

3) Сохраните файл как crx.csv

4) Открыть Weka -> Explorer

5) В preprocess вкладка -> нажмите на Open file

6) Изменить тип файла csv

7) Найдите файл 'crx.csv`

8) Нажмите на Save

9) Укажите имя файла crx.arff,

Это сделано

В файле crx.names из папки с данными говорится: все имена и значения атрибутов были изменены на бессмысленные символы для защиты конфиденциальности данных.

Но они дают вам ценности, которые они используют:

Информация об атрибутах:

A1:   b, a.
A2:   continuous.
A3:   continuous.
A4:   u, y, l, t.
A5:   g, p, gg.
A6:   c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff.
A7:   v, h, bb, j, n, z, dd, ff, o.
A8:   continuous.
A9:   t, f.
A10:  t, f.
A11:  continuous.
A12:  t, f.
A13:  g, p, s.
A14:  continuous.
A15:  continuous.
A16: +,-         (class attribute)

Вы можете дать этой информации то значение, которое вам нужно.

Для создания этого файла arff вы пишете что-то вроде этого:

%Test Data set

@relation Credit Approval Data Set 

@attribute attribute_name {a,b}
@attribute ...



@data
b,30.83,0,u,g,w,v,1.25,t,t,01,f,g,00202,0,+

Добавьте следующий атрибут, читающий credit.lisp, вам нужно 16 атрибутов. Сохраните файл как: имя file.arff. Вы можете создать этот файл в текстовом редакторе по вашему выбору.

Другие вопросы по тегам