Как заставить R читать данные как категориальные, а не непрерывные (для моделей S4)
Я использую немаркированную модель занятости, и одна из моих ковариат - защищенный статус. Эта ковариата имеет 3 уровня 0, 1 и 2. Мне нужно взять усредненную по модели оценку влияния ковариаты и занятости. В настоящее время R считывает ковариату как непрерывную, а не категориальную переменную, поэтому мне нужно скорректировать свой код. К сожалению, все методы, которые я могу найти в R для категориальных, а не непрерывных данных, предназначены для "моделей S3", а это "модель S4". Я также попытался сообщить R, что данные являются фактором, как показано в приведенном ниже коде.
Site.Covs.Wolves2 <- read.csv("wolftotcovars40.csv", header = T, colClasses = c("factor", "factor", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric"))
Но когда я попытался сделать оценку, усредненную по модели, я получил сообщение об ошибке
Some models include more than one instance of the parameter of interest.
This may be due to the presence of interaction/polynomial terms, or variables
with similar names:
see "?modavg" for details on variable specification and "exclude" argument
In addition: Warning message:
In modavg.AICunmarkedFitOccu(M.listTOT3, "Prot_Stat", parm.type = "psi") :
Model names have been supplied automatically in the table
Данные 111 сайтов, помеченных как "TN1", "TN2", "TN3" и т. Д., Хотя они удаляются перед формированием кадра занятости, поэтому не связаны с этим. Я предполагаю, что проблема в том, что существует несколько сайтов с одним и тем же защищенным статусом и поэтому они имеют одинаковое "значение коэффициента", но я не уверен, как это решить.