Как я могу построить модель логистической регрессии, если мои объяснительные переменные меняются со временем?
Допустим, я пытаюсь предсказать, будет ли аккаунт дефолт в ближайшие 3 месяца, а мои объясняющие переменные - это доход и кредитный рейтинг. Моя целевая переменная фиксирует, действительно ли аккаунт был дефолтным в следующие 3 месяца или нет. Я пытаюсь соответствовать модели логистической регрессии, используя кредитный рейтинг и доход. Допустим, у нас есть эти данные для 2 учетных записей..
Account Month Income Score DFLT_1YR
123 Jan 10000 550 0
123 Feb 7000 600 1
123 Mar 15000 570 1
444 Jan 20000 700 0
444 Feb 8000 625 0
444 Mar 1000 565 1
Итак, данные для учетной записи меняются со временем. Таким образом, при вводе пояснительных переменных для логистической модели, какой месяц данных я считаю. Я могу построить одну модель на основе данных за январь, другую на основе данных за февраль и другую на основе данных за март.
Я выбираю тот с самой низкой ошибкой? Должен ли я взять среднее значение объясняющих переменных и построить только одну модель? Какие есть варианты?