Филогенетические обобщенные линейные модели без. успехов / неудач как ответ в г
У меня есть набор данных о растениях, содержащий информацию о том, как часто каждый вид растений (n=550) добивается или не может что-то сделать, т. Е. Количество успехов и количество неудач. Набор данных также содержит данные о характеристиках каждого вида растений, таких как размер семян, конкурентоспособность, максимальное расстояние рассеивания и т. Д. Большинство объясняющих переменных являются непрерывными, но одна является бинарной (наличие микоризы или нет). Обычно для анализа степени, в которой число раз, когда растение преуспевает в выполнении чего-либо, связано с его характеристиками, я предполагаю, что вы бы использовали GLM с семейным биномом следующим образом:
my.model <- glm(cbind(no.of.successes,no.of.failures) ~ seed.size + max.dispersal.distance
+ competitive.ability, data=data, family="binomial")
Однако, поскольку некоторые из этих признаков могут быть связаны с эволюционной историей растений, я хотел бы принять во внимание предвзятость, которая может возникнуть в результате этого. Поэтому я хотел бы включить филогенетическую информацию в мои модели. Когда у вас есть непрерывный ответ, вы можете использовать PGLS (пакет caper), но для моей цели я думаю, что логистическая регрессия, подобная приведенной выше, более уместна. Одним из методов может быть использование функции phyloglm в пакете phylolm. Существуют также альтернативы, но общим для всех них является то, что они требуют, чтобы ваш ответ был двоичной переменной. Мой нет, но я мог бы создать бинарный с несколькими входами для каждого вида. Однако, если я сделаю это, я, скорее всего, столкнусь с проблемой, заключающейся в том, что число строк в моем наборе данных анализа намного больше, чем число подсказок в моем филогенетическом дереве! Теперь, каковы мои варианты сделать этот анализ правильно?
Короче говоря, мне нужна филогенетическая логистическая регрессия, принимающая в качестве ответа двухколоночную переменную (число успехов, количество неудач), которая поддерживает как непрерывные, так и категориальные объяснительные переменные.
Буду очень признателен за любую помощь!
1 ответ
Большинство филогенетических сравнительных методов (в том числе метод, реализованный в phyloglm
) предназначены для борьбы с видами средств. Вот два варианта, которые вы могли бы рассмотреть:
Превратите ваши подсчеты успехов и неудач в вектор пропорций и смоделируйте их с помощью PGLS или phyloglm (в зависимости от того, как распределены пропорции, может работать один из этих вариантов). Было бы неплохо, если бы была возможность взвешивания видов в зависимости от размера выборки, но, к сожалению, я так не думаю.
Использовать филогенетические обобщенные линейные смешанные модели. Это может быть предпочтительным, так как сохраняет всю информацию в ваших данных, а не стирает информацию о размере выборки, как первый вариант.