WEKA Прогнозирование

Я надеюсь, что кто-нибудь может мне помочь. Я новичок в Weka, и у меня есть некоторые проблемы при программировании Java-программы.

Моя цель - прогнозировать показатели продаж на следующий период / квартал, пока я подключаю их к сгенерированному пользователем контенту, который я собрал.

Поэтому я хотел использовать прогнозиста WEKA?!

У меня следующий вопрос:

1. какие настройки я должен использовать, чтобы идентифицировать образец соответственно влиянию атрибутов

2. полезные советы?

Спасибо!

Это файл.arff, который я сгенерировал:

@relation Sales_total_Apple

%Sales: total sold apple products in quarter yyyy-qq
%Volume: number of user generated content (e.g. review rating) in quarter yyyy-qq
%Reviewrating: average value of reviewrating (e.g. amazon stars) in quarter yyyy-qq
%Valence: avarage value of user generated content valence (used sentiment analysis) in yyyy-qq
%Date: should be year-quarter

@attribute Sales numeric
@attribute Volume numeric
@attribute REVIEWRATING numeric
@attribute VALENCE numeric
@attribute Date date 'yyyy-mm'

@data
22672000,133.0,3.7954545454545454,0.25172045454545455,2007-01
12066000,84.0,3.8674698795180724,0.19313253012048195,2007-02
11579000,48.0,3.7872340425531914,0.11405957446808514,2007-03
13483000,24.0,3.9565217391304346,0.2705391304347826,2007-04
26755000,202.0,4.039800995024875,0.09474179104477576,2008-01
14636000,227.0,4.243362831858407,0.1526902654867257,2008-02
13507000,202.0,4.039800995024875,0.1419736318407955,2008-03
20555000,226.0,4.288888888888889,0.11981422222222161,2008-04
29614000,467.0,4.008583690987124,-0.0031933476394850266,2009-01
17022000,376.0,4.1226666666666665,0.009081333333333313,2009-02
18026000,206.0,4.058536585365854,0.03965170731707281,2009-03
20597000,248.0,3.866396761133603,0.055700809716599034,2009-04
33069000,738.0,4.150610583446404,-0.061250881953867,2010-01
22580000,743.0,4.063342318059299,-0.0537954177897575,2010-02
24546000,475.0,4.090717299578059,-0.050239240506329344,2010-03
31226000,491.0,4.189795918367347,-0.062333469387755164,2010-04
47146000,848.0,4.128689492325856,0.08620141676505302,2011-01
36118000,1201.0,4.31,0.030831249999999866,2011-02
41066000,512.0,4.039138943248532,-0.026479256360078324,2011-03
39910000,647.0,4.139318885448916,-0.02018513931888557,2011-04
73073000,1463.0,4.272913816689466,0.17992134062927442,2012-01
58552000,2038.0,4.3460972017673045,0.1778528718703978,2012-02
53841000,1808.0,4.348644161593802,0.1730128942999446,2012-03
51213000,1570.0,4.293180369662205,0.19067469725940053,2012-04
87389000,1463.0,4.272913816689466,0.17992134062927442,2013-01
66492000,1484.0,4.226567768037762,0.16101463250168524,2013-02
54181000,2012.0,4.193436101442068,0.16231909497762292,2013-03
55948000,867.0,4.094688221709007,0.21768198614318673,2013-04

3 ответа

Если вы используете 3.7.11 или новее, вы можете установить пакет временных рядов из менеджера пакетов (см. Прикрепленные изображения).

введите описание изображения здесь введите описание изображения здесь

Во время использования перейдите на вкладку "Прогноз" и перейдите на дополнительную вкладку "Конфигурация". Вы можете сначала попробовать создание лагов, чтобы реализовать модель ARMA.

введите описание изображения здесь

У Weka есть несколько алгоритмов для анализа временных рядов, я думаю, это то, что вы можете использовать для начала.

Запишитесь на бесплатный онлайн-курс " Advanced Data Mining with Weka" и прочитайте лекцию 1 о временных рядах. (Курс был перезапущен во время публикации в июле 2016 года.) Нет лекции по встраиванию weka.jar или других jar-файлов в вашу java-программу, но есть лекция по написанию скриптов Weka на языке Groovy. (диалект Java).

Другие вопросы по тегам