В r, как мне запустить двустороннюю ANOVA, которая использует ошибки типа III и смотрит на парные сравнения?
У меня есть набор данных, с которым я хотел бы сравнить влияние вида и среды обитания на размер зоны обитания - используя ошибки типа III и попарные сравнения в пределах вида и среды обитания.
Вот подмножество данных:
species<- c("a","b","c","c","b","c","b","b","a","b","c","c","a","a","b","b","a","a","b","c")
habitat<- c("x","x","x","y","y","y","x","x","y","z","y","y","z","z","x","x","y","y","z","z")
homerange<-c(6,5,7,8,9,4,3,5,6,9,3,6,6,7,8,9,5,6,7,8)
data1<-data.frame(cbind(species, habitat, homerange))
data1$homerange<-as.numeric(as.character(data1$homerange))
В настоящее время я делю данные по трем видам, а затем запускаю отдельные ANOVA для каждого, но я считаю, что имеет больше смысла спрашивать о видах и среде обитания одновременно с одним ANOVA. Вот пример ANOVA, который я использовал для одного вида:
data.species.a<-subset(data1, species=="a")
fit<-aov(homerange ~ habitat, data=data.species.a)
summary(fit)
TukeyHSD(fit)
aov () использует ошибки типа I.,, который я не считаю уместным; плюс я считаю, что критерий Тьюки может быть слишком консервативным подходом для парных сравнений. Может ли кто-нибудь помочь мне с подходом, позволяющим мне запустить одну ANOVA, которая учитывает как влияние вида, так и среды обитания на домашний ландшафт, с ошибками типа III, что также позволяет проводить менее консервативные попарные сравнения видов и среды обитания?
1 ответ
Вы можете настроить Anova
в пакете "машина" сообщить тип III суммы квадратов и есть HSD.test
в пакете 'Agricolae', который должен быть в состоянии взять этот модельный объект в качестве входных данных. Я не думаю, что вы можете законно использовать aov() с несбалансированными данными, поэтому я делаю это с подгонкой lm().
fit<-lm(homerange ~ habitat, data=data.species.a)
require(car)
Anova(fit, type="III")
require(agricolae)
comparison <- HSD.test(fit, "habitat", group=TRUE,
main="Yield of sweetpotato\nDealt with different virus")
Обратите внимание, что по умолчанию SAS для квадратов сумм типа III рассматривается с пренебрежением (а иногда даже с прямой насмешкой) авторами базового пакета R (подробнее об этом читайте здесь). Представление этого метода в пакете "автомобиль" в основном для целей сравнения, а не для рекомендации относительно статистической правильности.
Чтобы добавить цитаты к причинам очень осторожного принятия стандарта SAS: комментарии Фрэнка Харрелла относительно потери мощности и более поздние комментарии Билла Венейблса в той же теме на r-help