Ранжированный выбор в R: анализ результатов

Пожалуйста, рассмотрите следующий примерный набор данных:

a <- c(1, 2, 3, 1, 4, 1968, 2, 1)
b <- c(2, 1, 2, 4, 3, 1984, 2, 0)
c <- c(3, 3, 4, 2, 1, 1945, 1, 0)
d <- c(4, 1, 4, 3, 2, 1975, 3, 1)
df <- data.frame(rbind(a,b,c,d))
names(df) <- c("ID", "OptionW", "OptionX", "OptionY", "OptionZ", "yearofBirth", "education", "sex")


ID OptionW OptionX OptionY OptionZ yearofBirth education sex
1       2       3       1       4        1968         2   1
2       1       2       4       3        1984         2   0
3       3       4       2       1        1945         1   0
4       1       4       3       2        1975         3   1

Двести людей, которых попросили оценить Варианты W до Z от 1 до 4 по эффективности, чтобы снизить уровень преступности в их сообществе. Их возраст, высшая академическая степень и пол также аннотированы. Я хочу узнать:

  • какие варианты предпочитают большинство граждан?
  • Существуют ли существенные различия в том, во что верят мужчины или женщины, пожилые или молодые, хорошо или менее образованные граждане?
  • насколько вероятно изменение порядка ранжирования, если человек старше / моложе, имеет более или менее формальное образование и является мужчиной или женщиной?

Я читал, что может оказаться правильным использование многочленной логистической регрессии, но мне сложно адаптировать найденные примеры к моему набору данных. Часто они допускают выбор только одной опции, делая каждый выбор (W, X Y Z) уровнем одной переменной (Опции). Но в моем случае у меня есть несколько переменных (OptionW, OptionX, OptionY, OptionZ), где ранжирование занимает уровень (1,2,3,..10). Или я смотрю на это неправильно?

Какая функция из какой упаковки подойдет? И есть ли другие методы, помимо полиномиальной логистической регрессии? Могу ли я сделать кластерный анализ на 200 образцах?

Я использую R в основном для пространственного анализа и не очень хорошо разбираюсь в статистике. Надеюсь, вы можете помочь мне здесь.

0 ответов

Другие вопросы по тегам