Потенциальный недостаток - необоснованные результаты Firebase при тестировании AAB

Question

Потенциальный недостаток - необоснованные результаты Firebase при тестировании AAB

Я запускаю тест AAB, что означает, что в тесте есть две контрольные группы, чтобы убедиться в правильности распределения населения. И результаты говорят мне, что дублированная контрольная группа показывает положительные результаты, чем исходная группа.

Я дублировал тест несколько раз, на двух приложениях, но результаты между исходными группами и дублированными контрольными группами все еще различны.

Есть ли какая-либо возможная причина для этого?

0

firebase ab-testing firebase-ab-testing abtest

Источник

user10143108 13 дек '18 в 07:25

1 ответ

Другие вопросы по тегам firebase ab-testing firebase-ab-testing abtest

user3473097 07 фев '19 в 02:02 2019-02-07 02:02 · Answer 1 · 2019-02-07 02:02

Некоторый процент полевых экспериментов онлайн между идентичными контрольными группами покажет статистических победителей. Это называется ложным срабатыванием. Поддержка Firebase охватывает эту тему.

Различные статистические структуры имеют разные способы управления частотой ошибок (и ложных положительных результатов), например:

Leanplum

Optimizely

Если вы несколько раз получаете ложное срабатывание, это статистически маловероятно и обычно указывает на ошибку реализации или программную ошибку.

Отказ от ответственности: я работаю в Optimizely.