Как интерпретировать CCA веганский вывод

Я выполнил канонический анализ соответствий в R с использованием пакета vegan, но нахожу вывод очень трудным для понимания. Триплот понятен, но все числа, которые я получаю из резюме (cca), сбивают меня с толку (так как я только начал изучать техники рукоположения), я хотел бы знать, сколько из дисперсии в Y объясняется X (в данном случае переменные среды) и какие из независимых переменных важны в этой модели?

мой вывод выглядит так:

Partitioning of mean squared contingency coefficient:
              Inertia Proportion
Total           4.151     1.0000
Constrained     1.705     0.4109
Unconstrained   2.445     0.5891

Eigenvalues, and their contribution to the mean squared contingency coefficient 

Importance of components:
                        CCA1   CCA2    CCA3    CCA4    CCA5    CCA6      CCA7
Eigenvalue            0.6587 0.4680 0.34881 0.17690 0.03021 0.02257 0.0002014
Proportion Explained  0.1587 0.1127 0.08404 0.04262 0.00728 0.00544 0.0000500
Cumulative Proportion 0.1587 0.2714 0.35548 0.39810 0.40538 0.41081 0.4108600

                         CA1    CA2     CA3     CA4     CA5     CA6     CA7
Eigenvalue            0.7434 0.6008 0.36668 0.33403 0.28447 0.09554 0.02041
Proportion Explained  0.1791 0.1447 0.08834 0.08047 0.06853 0.02302 0.00492
Cumulative Proportion 0.5900 0.7347 0.82306 0.90353 0.97206 0.99508 1.00000

Accumulated constrained eigenvalues

Importance of components:
                        CCA1   CCA2   CCA3   CCA4    CCA5    CCA6      CCA7
Eigenvalue            0.6587 0.4680 0.3488 0.1769 0.03021 0.02257 0.0002014
Proportion Explained  0.3863 0.2744 0.2045 0.1037 0.01772 0.01323 0.0001200
Cumulative Proportion 0.3863 0.6607 0.8652 0.9689 0.98665 0.99988 1.0000000

Scaling 2 for species and site scores
* Species are scaled proportional to eigenvalues
* Sites are unscaled: weighted dispersion equal on all dimensions

Species scores

                 CCA1     CCA2    CCA3      CCA4      CCA5       CCA6
S.marinoi     -0.3890  0.39759  0.1080 -0.005704 -0.005372 -0.0002441
C.tripos       1.8428  0.23999 -0.1661 -1.337082  0.636225 -0.5204045
P.alata        1.6892  0.17910 -0.3119  0.997590  0.142028  0.0601177
P.seriata      1.4365 -0.15112 -0.8646  0.915351 -1.455675 -1.4054078
D.confervacea  0.2098 -1.23522  0.5317 -0.089496 -0.034250  0.0278820
C.decipiens    2.2896  0.65801 -1.0315 -1.246933 -0.428691  0.3649382
P.farcimen    -1.2897 -1.19148 -2.3562  0.032558  0.104148 -0.0068910
C.furca        1.4439 -0.02836 -0.9459  0.301348 -0.975261  0.4861669

Biplot scores for constraining variables

                CCA1    CCA2     CCA3     CCA4     CCA5     CCA6
Temperature  0.88651  0.1043 -0.07283 -0.30912 -0.22541  0.24771
Salinity     0.32228 -0.3490  0.30471  0.05140 -0.32600  0.44408
O2          -0.81650  0.4665 -0.07151  0.03457  0.20399 -0.20298
Phosphate    0.22667 -0.8415  0.41741 -0.17725 -0.06941 -0.06605
TotP        -0.33506 -0.6371  0.38858 -0.05094 -0.24700 -0.25107
Nitrate      0.15520 -0.3674  0.38238 -0.07154 -0.41349 -0.56582
TotN        -0.23253 -0.3958  0.16550 -0.25979 -0.39029 -0.68259
Silica       0.04449 -0.8382  0.15934 -0.22951 -0.35540 -0.25650

Какие из этих цифр важны для моего анализа? /Анна

1 ответ

Решение

Сколько вариаций объясняется X?

В CCA дисперсия не является дисперсией в обычном смысле. Мы выражаем это как "среднеквадратичный коэффициент непредвиденных обстоятельств" или "инерция". Вся информация, необходимая вам для выяснения того, насколько "вариация" в Y объясняется X, содержится в разделе вывода, который я воспроизвожу ниже:

Partitioning of mean squared contingency coefficient:
              Inertia Proportion
Total           4.151     1.0000
Constrained     1.705     0.4109
Unconstrained   2.445     0.5891

В этом примере полная инерция 4.151 и ваши X-переменные (это "Ограничения") объясняют в общей сложности 1.705 бит инерции, что составляет около 41%, оставляя около 59% необъяснимыми.

Следующий раздел, относящийся к собственным значениям, позволяет увидеть как с точки зрения объясненной инерции, так и с точки зрения соотношения, какие оси вносят существенный вклад в объяснительную "силу" ОСО (Constrained часть таблицы выше) и необъяснимую "дисперсию" (Unconstrained часть таблицы выше.

Следующий раздел содержит баллы за рукоположение. Думайте о них как о координатах точек в тройке. По какой-то причине вы показываете результаты сайта в выводе выше, но они обычно будут там. Обратите внимание, что они были масштабированы - по умолчанию это использует scaling = 2 - таким образом, баллы сайта находятся на их средневзвешенном значении по оценкам видов IIRC и т. д.

Баллы "Biplot" - это расположение наконечников стрелок или меток на стрелках - я точно забыл, как нарисован график.

Какие из этих цифр важны для моего анализа?

Все они важны - если вы считаете, что триплет важен для интерпретации, он полностью основан на информации, сообщаемой summary(), Если у вас есть конкретные вопросы о данных, то, возможно, только некоторые разделы будут иметь для вас первостепенное значение.

Тем не менее, Stackru не место, чтобы задавать такие вопросы статистического характера.

У меня нет возможности комментировать. Но в ответ на интерпретацию первых ответов на интерпретацию первых ответов о баллах по видам и участкам в масштабе 2, я полагаю, что их объяснение обратное.

В книге "Числовая экология с R" Боркара, Жилле и Лежандра они четко утверждают, что при оценке по двум видам являются средневзвешенными значениями площадок.

Это может быть подтверждено при использовании функции ordihull в CCA.

Также в выходных данных ОП указывается, что баллы видов масштабируются, а баллы площадей не масштабируются. что я считаю, подтверждает то, что говорится в книге.

"Масштабирование 2 для оценок видов и участков * Виды масштабируются пропорционально собственным значениям * Участки не масштабируются: взвешенная дисперсия одинакова по всем измерениям"

Другие вопросы по тегам