Как я могу построить модель логистической регрессии, если мои объяснительные переменные меняются со временем?

Допустим, я пытаюсь предсказать, будет ли аккаунт дефолт в ближайшие 3 месяца, а мои объясняющие переменные - это доход и кредитный рейтинг. Моя целевая переменная фиксирует, действительно ли аккаунт был дефолтным в следующие 3 месяца или нет. Я пытаюсь соответствовать модели логистической регрессии, используя кредитный рейтинг и доход. Допустим, у нас есть эти данные для 2 учетных записей..

Account     Month     Income    Score   DFLT_1YR
123          Jan      10000     550        0
123          Feb      7000      600        1
123          Mar      15000     570        1
444          Jan      20000     700        0
444          Feb      8000      625        0
444          Mar      1000      565        1

Итак, данные для учетной записи меняются со временем. Таким образом, при вводе пояснительных переменных для логистической модели, какой месяц данных я считаю. Я могу построить одну модель на основе данных за январь, другую на основе данных за февраль и другую на основе данных за март.

Я выбираю тот с самой низкой ошибкой? Должен ли я взять среднее значение объясняющих переменных и построить только одну модель? Какие есть варианты?

0 ответов

Другие вопросы по тегам