R строк, если имена столбцов соответствуют двум аргументам во второй таблице атрибутов
Я хочу вычислять суммы строк только в том случае, если имена столбцов (то есть виды) моего фрейма данных соответствуют двум аргументам во второй таблице атрибутов. Это означает, что он должен сначала соответствовать имени в столбце таблицы атрибутов И иметь определенную запись в другом столбце таблицы атрибутов. Однако в таблице атрибутов содержится больше видов, чем в исходном фрейме данных.
Я старался:
# Species data from vegan package:
data(varespec, package = "vegan")
# create attributes table
attributes <- matrix(NA, length(varespec), 2)
attributes[,1] <- colnames(varespec)
attributes[,2] <- c(rep("MI",14),rep("PI",30))
# add species to the attribute table
x <- c("spec1","MI")
y <- c("spec2","PI")
attributes <- rbind(attributes, x, y)
row.names(attributes) <- c(1:46)
# calculate rowsums only for species contained in the attributes table
# and having the entry "MI" in the attributes table
for (i in 1:44){
for (j in 1:46){
if ((colnames(varespec)[i] == attributes[j,1]) & (attributes[j,2] == "MI")) {
apply(varespec,1,sum)
}
}}
Но это всегда подводило итог целым рядам, а не только МИ - видам.
1 ответ
Решение
Это легко решить, если вы преобразуете набор данных в длинный формат
library(dplyr)
library(tidyr)
data(varespec, package = "vegan")
attributes <- data.frame(
Species = c(colnames(varespec), "spec1", "spec2"),
Attribute = c(rep(c("MI", "PI"), c(14, 30)), "MI", "PI")
)
varespec %>%
add_rownames("ID") %>%
gather(Species, Value, -ID) %>% #convert to long format
inner_join(attributes, by = "Species") %>%
filter(Attribute == "MI") %>%
group_by(ID) %>%
summarise(Total = sum(Value))