Функция дискретизации MDLP для создания интервалов для непрерывных переменных

Может кто-нибудь, пожалуйста, помогите с рабочим примером использования функции mdlp из пакета дискретизации.

По сути, я хочу, чтобы для моей непрерывной переменной были определены интервалы. Я сталкивался с этой функцией, которая на основании документа, кажется, соответствовала бы требованию, но, поскольку у меня нет примера, я затрудняюсь его реализовать. Может кто-нибудь помочь!!

Предложите, если вы думаете, что есть какой-то другой лучший метод, который можно использовать для создания интервалов для непрерывных переменных. Мотив должен иметь однородные множества и не более 5-7 интервалов

Ниже приведены мои примеры данных, так как мои данные большие, я использую data.table -

library("data.table")
set.seed(1200)
id <- 1:100
bill <- sample(1:3,100,replace = T)
nos <- sample(1:80,100,replace = T)
stru <- sample(c("A","B","C","D"),100,replace = T)
type <- sample(1:7,100,replace = T)
value <- sample(100:1000,100,replace = T)

df1 <- as.data.table(data.frame(id,bill,nos,stru,type,value))

Поэтому я хочу, чтобы для каждой переменной "stru" были определены интервалы для переменных "nos" и "value". Поэтому можно иметь разные интервалы для stru=A и разные интервалы для stru=B и т. Д. Для C и D.

Пожалуйста помоги!!

0 ответов

Другие вопросы по тегам