Поиск худшего мобильного телефона по статистической модели (слишком много фиктивных переменных)

У нас в базе данных около 50000 моделей мобильных телефонов, а объем данных составляет около 3 миллионов.

Мы хотим найти мобильные телефоны с наименьшей частотой успешных вызовов (количество успешных вызовов, деленное на общее количество вызовов). Мы хотим использовать модель регрессии, чтобы определить влияние мобильного телефона на показатель успешности вызовов, поэтому каждый мобильный телефон с наименьшим коэффициентом является худшим мобильным телефоном. Зависимая переменная - это показатель успешности вызова, а независимая переменная - это мобильные телефоны, номера абонентов и тип сотовой связи (вышка сотовой связи). мы используем фиктивную переменную, потому что мобильные телефоны являются номинальными, так что в модели есть 49999 фиктивных переменных.

Фиктивные переменные слишком много.

Является ли регрессия хорошей моделью? Кто-нибудь знает другие статистические модели для решения этой проблемы?

Я приложил картинку, которая показывает образец данных

Образ

0 ответов

Другие вопросы по тегам