Диапазоны мер в функции InterestMeasure в пакете arules, R не совпадают с описанием в мануале пакета

Я использую пакет artules, R, чтобы найти положительно связанные продукты. Я использую некоторые меры, предоставляемые функцией InterestMeasure, для оценки правил. Однако я обнаружил, что диапазоны для мер kappa и наименьшего противоречия отличаются от руководства по пакету. Вот пример, код в пояснении к InterestMeasure в руководстве по пакету:

data("Income")
rules <- apriori(Income)
quality(rules)$kappa <- interestMeasure(rules,measure='kappa',transactions = Income)
quality(rules)$leastContradiction <- interestMeasure(rules,measure='leastContradiction',transactions = Income)
try <- as(rules,'data.frame')

Я немного изменился для удобства. В этом примере диапазоны наименьшего противоречия и каппа:

> summary(try$leastContradiction)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
0.08794 0.13920 0.17000 0.18930 0.22170 0.90460 
> summary(try$kappa)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
-43160000 -20510000 -19140000 -17660000 -12220000  -8042000 

Я попробовал эти две меры на моих собственных данных, резюме:

> summary(myData1$kappa)
          Min.        1st Qu.         Median           Mean        3rd Qu.           Max. 
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000 
> summary(myData1$leastContradiction)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
-218.9000   -5.4530   -2.0120   -4.9540   -1.1050    0.8824 

Однако в руководстве по пакету эти две меры объясняются следующим образом:

Видно, что диапазоны очень разные. Итак, я должен сам сузить диапазоны для таких мер до [-1,1]?

1 ответ

Решение

Это действительно было ошибкой. Решение: добавлены недостающие скобки в расчете каппа и фиксированное уравнение для наименьшего противоречия. Это исправление теперь доступно в версии для разработчиков на github и станет частью следующего выпуска (arules 1.2-3).

Другие вопросы по тегам