Какое значение имеет значение t-stats при применении ttest_ind к двум сериям панд?

Какой вывод можно сделать из полученного значения t-stats, когда ttest_ind применяется к двум независимым сериям?

1 ответ

Решение

Как вы можете прочитать здесь, scipy.stats.ttest_ind имеет два выхода

  • Рассчитанная т-статистика.
  • Двусторонняя р-величина.

Очень интуитивно, вы можете прочитать t-статистику как нормализованную разницу средних значений в обеих популяциях, учитывая их дисперсию и размеры:

  • Чем больше выборка, тем серьезнее разница в средних значениях, потому что у нас больше доказательств для этого.
  • Чем больше дисперсия, тем менее серьезна разница средних значений, потому что абсолютная разница может быть задана только случайностью.

Чем выше значение t-статистики, тем серьезнее разница.

Значение р делает эту интуицию более явной: это вероятность того, что разность средних может рассматриваться как ноль. Если значение р ниже порогового значения, например 0,05, мы говорим, что разница не равна нулю.

Другие вопросы по тегам