Получение дубликатов в Group_by() в R

Question

Получение дубликатов в Group_by() в R

Я получаю дубликаты в моих результатах group_by() в R. Скажем, я пытаюсь сгруппировать следующий фрейм данных по имени:

name <- c("John", "Sally", "Sally", "Sue")
sales <- c(10, 20, 5, 30)
example <- data.frame(name, sales)
print(example)

Поэтому я хотел создать таблицу, которая показывает все продажи для каждого продавца, используя следующий код:

library(dplyr)

example %>% group_by(name) %>% select(name, sales)

Тем не менее, я продолжаю получать список "Салли" дважды. Вместо этого я хочу получить Салли только один раз с ее общими продажами (25). Как получить разные значения в моем столбце "имя"? Я весь день гуглил, потому что я думал, что group_by должен был это сделать.

Я использую Different()? Я видел похожий пост для Python ЗДЕСЬ, и главный участник сказал, что пользователь должен попробовать использовать sort. Я на самом деле попробовал, но R Studio внезапно говорит, что не может найти "имена" объектов, когда я добавляю его, чтобы получить этот код:

example %>% sort(name) group_by(name) %>% select(name, sales)

Но когда я удалил функцию sort(), R удалось прочитать "group_by(name)" просто отлично. Что мне не хватает?

Спасибо

1

r dataframe dplyr group-by distinct-values

Источник

user10096409 29 окт '18 в 23:31

1 ответ

Другие вопросы по тегам r dataframe dplyr group-by distinct-values

user3732271 29 окт '18 в 23:34 2018-10-29 23:34 · Answer 1 · 2018-10-29 23:34

Мы можем использовать summarise в sum "продажи" сгруппированы по "имени"

example %>% 
    group_by(name) %>% 
    summarise(sales = sum(sales))

1

Источник

user3732271 29 окт '18 в 23:34