Какое значение имеет значение t-stats при применении ttest_ind к двум сериям панд?
Какой вывод можно сделать из полученного значения t-stats, когда ttest_ind применяется к двум независимым сериям?
1 ответ
Решение
Как вы можете прочитать здесь, scipy.stats.ttest_ind
имеет два выхода
- Рассчитанная т-статистика.
- Двусторонняя р-величина.
Очень интуитивно, вы можете прочитать t-статистику как нормализованную разницу средних значений в обеих популяциях, учитывая их дисперсию и размеры:
- Чем больше выборка, тем серьезнее разница в средних значениях, потому что у нас больше доказательств для этого.
- Чем больше дисперсия, тем менее серьезна разница средних значений, потому что абсолютная разница может быть задана только случайностью.
Чем выше значение t-статистики, тем серьезнее разница.
Значение р делает эту интуицию более явной: это вероятность того, что разность средних может рассматриваться как ноль. Если значение р ниже порогового значения, например 0,05, мы говорим, что разница не равна нулю.