Описание тега summarize
1
ответ
Объединение нескольких предложений в одну текстовую строку в Python
Я пытаюсь объединить отдельные предложения в один текстовый объект, чтобы я мог запустить его через генератор Gensim. Чтобы это работало, должно быть как минимум 2 предложения. Согласно моим выводам, у меня больше двух предложений, но говорится, что…
21 апр '18 в 01:09
1
ответ
Как суммировать числовые значения и значения уровня фактора одновременно в R
Я пытаюсь суммировать набор данных, группируя по одному столбцу (F1) и получая среднее значение по другим столбцам, за исключением того, что остальные столбцы разделены между числовым и факторным уровнями. Я могу использовать ddply для суммирования …
30 ноя '16 в 08:47
3
ответа
Суммировать самые низкие значения в Dataframe?
Мой фрейм данных выглядит так: View(df) Product Value a 2 b 4 c 3 d 10 e 15 f 5 g 6 h 4 i 50 j 20 k 35 l 25 m 4 n 6 o 30 p 4 q 40 r 5 s 3 t 40 Я хочу найти 9 самых дорогих продуктов и резюме остальных. Это должно выглядеть так: Product Value d 10 e …
04 мар '17 в 01:48
1
ответ
Динамическое агрегирование по категориям в R
У меня есть следующий датафрейм a <- c(rep("CGR", 6), rep("AUS", 6), rep("ROW", 6) ) b <- c("AUT", "CH", "ROW", "ROW", "ROW", "ROW", "AUT", "CH", "ROW", "ROW", "ROW", "ROW", "AUT", "CH", "ROW", "ROW", "ROW", "ROW" ) v <- 1:18 category <-…
12 дек '17 в 14:35
2
ответа
Как сгруппировать фрейм данных, а затем посчитать различные значения в R
У меня есть датафрейм в R, который имеет 43 переменных и более 80 строк. Я хотел бы сгруппировать данные, основанные на одной переменной - географическом регионе, а затем подсчитать различные значения переменной (сколько 0, 1, 2, 3 и NA и т. Д.). Я …
24 янв '18 в 15:08
1
ответ
Группировка по 2 столбцам и использование значений последующих групп в расчетах
Предположим, у меня есть df с 3 столбцами, group1, group2 и variable set.seed(1) group1 = c(rep(1,5),rep(2,5),rep(3,5),rep(4,5)) group2 = c("A","B","C","D","B","C","C","B","C","A","B","D") variable = c(as.integer(rnorm(20,2)**3)) df=data.frame(group…
01 дек '16 в 16:30
1
ответ
Функция стандартного отклонения в ddplyr не возвращает значение в расплавленном кадре данных
У меня есть набор данных, который состоит из 3 значений положения (XYZ) и 3 значений вращения (Омега, Фи, Каппа). голова (pos.df) выглядит так Batch PhotoID X Y Z Omega Phi Kappa 1 1 DSC_7120 -269.6995 -359.33126 2390.522 -2.78643779 0.03288689 49.4…
14 июл '17 в 16:25
1
ответ
Суммируйте, используя условие для одного столбца
Пример данных: df <- data.frame(HELP = c("Yes", "Yes", "Yes", "No", "Yes", "No")) Я сделал: cdata <- ddply(df, c("HELP"), summarise, Total = sum(df$HELP == 'No'), Probability = Total/nrow(df) ) но до значения "Да" остается то же значение, что …
20 июн '17 в 17:10
2
ответа
Power BI: добавление столбцов и подведение итогов
Я пытаюсь получить количество голосов в зависимости от удовлетворенности наших клиентов. Например: 20 записей голосования за 5/10 10 записей голосования за 2/10 5 записей голосования за 9/10 Это часть моего набора данных: Я хочу иметь для каждого Op…
11 сен '18 в 18:35
2
ответа
Суммируйте одно и то же имя ключа в многомерном массиве php
У меня есть такой массив: [0] => Array ( [id_station] => 2397 [hour] => 12 [data] => Array ( [cameraon] => 355654 [cameraoff] => 4532 [camerabroken] => 76745 ... ) ) [1] => Array ( [id_station] => 2399 [hour] => 13 [dat…
28 дек '17 в 09:50
0
ответов
Суммирование и сумма не возвращает значений в R
tenancy <- main_tenant%>% group_by(`Tenancy Type`)%>% summarise(num = length(`Tenancy Type`), total = sum(`Number of Works Order`)) Я пытаюсь получить этот код для подсчета количества различных типов арендных площадей и для каждого суммиров…
10 май '17 в 13:33
0
ответов
Использование функции weighted.mean внутри функции lapply с data.table
У меня есть следующий набор данных: # A tibble: 450 x 546 matchcode idstd year country wt region income industry sector ownership exporter c201 c202 c203a c203b c203c c203d c2041 c2042 c205a c205b1 c205b2 c205b3 c205b4 c205b5 c205b6 c205b7 <chr+l…
13 сен '18 в 10:01
3
ответа
R: Очистка широкого и неопрятного кадра данных
У меня есть фрейм данных, который выглядит следующим образом: d<-data.frame(id=(1:9), grp_id=(c(rep(1,3), rep(2,3), rep(3,3))), a=rep(NA, 9), b=c("No", rep(NA, 3), "Yes", rep(NA, 4)), c=c(rep(NA,2), "No", rep(NA,6)), d=c(rep(NA,3), "Yes", rep(NA,…
19 ноя '17 в 18:42
2
ответа
Использование dplyr для суммирования и сохранения одинакового имени переменной
Я обнаружил, что data.table и dplyr имеют разные результаты при попытке сделать то же самое. Я хотел бы использовать синтаксис dplyr, но рассчитать его так, как это делает data.table. Вариант использования: я хочу добавить промежуточные итоги в табл…
20 янв '18 в 15:32
1
ответ
Агрегирование при конкатенации в R с использованием dplyr-трубопровода
Как мне сгруппировать и суммировать данные из DF1 в DF4? Я хочу распространить данные таким образом, чтобы мои строки были объединены. Я могу добраться до DF3 используя Пример: DF1 <- data.frame(Owner = c("Owner A","Owner B","Owner C","Owner B","…
23 янв '18 в 03:01
1
ответ
Как построить показатель числа арестов (%) для 20 самых популярных типов преступлений (преступления из набора данных Чикаго)?
Я работаю с R в RStudio и хотел бы построить через пакет highchart графику, которая включает в себя по оси X тип преступления и по оси Y уровень арестов в%. Таким образом, чтобы увидеть, по какому типу преступления был произведен высший арест. Я раб…
27 дек '18 в 18:10
2
ответа
Сумма строк (с NA) в R
У меня есть data.frame "data" со столбцами "var1" ... "var3". Теперь я хотел бы вычислить новый столбец "сумма" из трех столбцов var. К сожалению, в каждой строке значение имеет только одна переменная из трех: var1 var2 var3 sum NA NA 300 300 20 NA …
01 ноя '17 в 15:05
0
ответов
Итоговые значения в кратных каталогах
Я изучаю Python... очень новичок, чтобы быть искренним... Я прошел некоторый курс о Python, поэтому я немного знаю теорию, но когда мне нужно написать код, я просто "застрял" и не могу думать, используя логика питона. Например... Сейчас я работаю на…
19 фев '19 в 20:21
1
ответ
Синтаксис для использования group_by() в summaze()
Как я могу использовать функцию group_by() в summaze(), как показано ниже: summarize(group_by(product),sum(Sales))
08 ноя '16 в 05:13
3
ответа
Р: Как суммировать несколько переменных с разными функциями?
У меня есть фрейм данных, в котором для каждой переменной группировки есть два типа переменных: один набор, для которого мне нужно среднее значение в каждой группе, другой, для которого мне нужна сумма в каждой группе. То есть я хочу применить две р…
23 фев '19 в 23:59