Объединяет кадры данных таким образом, что обновляет строки с одинаковым row.name
Я хочу сделать объединение двух фреймов данных, которые совместно используют несколько строк с одинаковым rowName. Для тех строк, которые имеют общие имена строк, я хотел бы принять во внимание значения второго кадра, а не первого. Например:
df1 <- data.frame(col1 = c(1,2), col2 = c(2,4), row.names = c("row_1", "row_2"))
df1
# col1 col2
# row_1 1 2
# row_2 2 4
df2 <- data.frame(col1 = c(3,6), col2 = c(10,99), row.names = c("row_3", "row_2"))
df2
# col1 col2
# row_3 3 6
# row_2 10 99
Результат, который я хотел бы получить, будет таким:
someSpecificRBind(df1,df2, takeIntoAccount=df2)
# col1 col2
# row_1 1 2
# row_2 10 99
# row_3 3 6
Функция rbind не выполняет эту работу, фактически она обновляет rowNames для общих.
2 ответа
Решение
Мы получаем индекс duplicated
элементы и использовать это для filter
rbind(df2, df1)[!duplicated(c(row.names(df2), row.names(df1))),]
Я хотел бы осмыслить это как только добавление к df2
строки в df1
которые еще не там:
rbind(df2, df1[setdiff(rownames(df1), rownames(df2)), ])