Верхний предел продолжительности для анализа выживания
У меня есть модель спасательных кругов, которая мне подходит, используя следующее:
model = WeibullAFTFitter()
model.fit(train, 'duration', event_col='y', show_progress=True)
Однако длительность, которую он предсказывает для моего набора тестов, чрезвычайно велика (с помощью predicted_time = model.predict_expectation(test)
). Фактически в случае без цензуры средняя ошибка между продолжительностью теста и прогнозируемой продолжительностью составляет 2289,3773 +/- 7584,9916.
Единственная проблема заключается в том, что максимально возможная продолжительность составляет 1500 (предположим, что машины заменяются каждые 5 лет). Итак, мои вопросы:
- Есть ли способ установить верхний предел по времени?
- Если бы я нормализовал продолжительность, чтобы иметь среднее значение 0 и стандартное отклонение 1, улучшились бы оценки продолжительности?