Описание тега pandas-groupby
To be used for grouping variables together based on a given condition. And only to be used with relevance to `pandas` library
2
ответа
Как найти и добавить столбец частоты для идентификатора?
Я новичок в питоне, так что терпите меня! Мой набор данных от Excel, и мне было интересно, как найти и добавить столбец частоты для моего идентификатора. Сначала я выполнил функцию группировки для идентификатора и даты, выполнив: dfcount = dfxyz.gro…
19 апр '18 в 22:54
0
ответов
Как мне использовать ffill с мультииндексом
Я задал (и ответил) вопрос здесь. Pandas ffill преобразовал данные, сгруппированные по столбцам, где я хотел знать, как заполнить диапазон дат для каждой уникальной записи для столбца (мой столбец активов). Мое решение требует, чтобы "идентификатор"…
09 апр '18 в 10:46
1
ответ
Группировка DataFrame по N столбцам или N строкам
Я хотел бы найти общее решение для группировки DataFrame по указанному количеству строк или столбцов. Пример DataFrame: df = pd.DataFrame(0, index=['a', 'b', 'c', 'd', 'e', 'f'], columns=['c1', 'c2', 'c3', 'c4', 'c5', 'c6', 'c7']) c1 c2 c3 c4 c5 c6 …
28 сен '17 в 21:21
3
ответа
Как мне выполнить суммирование `n` строк за раз в пандах?
Учитывая фрейм данных A 0 14 1 59 2 38 3 40 4 99 5 89 6 70 7 64 8 84 9 40 10 30 11 94 12 65 13 29 14 48 15 26 16 80 17 79 18 74 19 69 Этот фрейм данных имеет 20 столбцов. Я бы хотел группу n=5 строки и суммировать их. Итак, мой вывод будет выглядеть…
05 авг '17 в 19:17
1
ответ
AttributeError: Невозможно получить доступ к вызываемому атрибуту groupby объектов DataFrameGroupBy
У меня есть датафрейм, который имеет 3 столбца - Я хочу сгруппировать столбцы на основе Chopstick Length, выполнив что-то вроде этого: meansByCL = df_chopstick.groupby('Chopstick.Length')['Food.Pinching.Efficiency'].mean().reset_index() но это выдае…
21 ноя '18 в 05:58
1
ответ
Как преобразовать в бин отфильтрованные данные панд?
Все, Заголовок моего набора данных выглядит следующим образом. Я отфильтровал столбцы "Возраст" и "Время прогулов в часах" и рассчитал среднее значение часов. Теперь я хотел бы, чтобы бен на основе столбца возраста. Как я могу это сделать? Я хотел б…
02 дек '18 в 03:26
2
ответа
Как перебрать колонку с помощью панд?
Мой фрейм данных такой Numbers, user_id, time_stamp 1 2 2013-11-15 03:45:04 2 2 2013-11-29 03:45:04 3 2 2013-12-09 03:45:04 4 2 2013-12-25 03:45:04 5 2 2013-12-31 03:45:04 6 3 2014-01-08 03:45:04 7 3 2014-02-03 03:45:04 7 4 2014-02-03 03:45:04 Я дол…
04 мар '18 в 00:17
0
ответов
Пользовательская функция + групповые панды с различными условиями на сгруппированные по переменным
Я хочу сгенерировать некоторые веса, используя groupby, для данных, которые изначально выглядят так: V1 V2 MONTH CHOICES PRIORITY X T1 M1 C1 1 X T1 M1 C2 0 X T1 M1 C3 0 X T2 M1 C1 1 X T2 M1 C5 0 X T2 M1 C6 0 X T2 M1 C2 1 X T1 M2 C1 1 X T1 M2 C2 0 X …
29 авг '18 в 12:15
1
ответ
Получить первый и последний вхождение строки в группе Python
У меня есть Python Dataframe со следующими столбцами (данные посещаемости) Empcode T01 T01 T02 T03 T04 TranDate 10/09/2018 10/09/2018 10/09/2018 10/09/2018 10/09/2018 Trn Time 09.29 17.54 13.52 10.01 18.01 Я хочу получить первое вхождение Trn Time к…
01 окт '18 в 07:16
1
ответ
Как pandas groupby определенное значение в столбце?
У меня есть датафрейм с несколькими столбцами, используя добавленный новый столбец для возрастных интервалов. # Create Age Intervals bins = [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100] df['age_intervals'] = pd.…
11 сен '18 в 04:56
2
ответа
Получить n-ую строку после применения лямбды к групповому в python
Поэтому мне нужно сгруппировать фрейм данных по его SessionId, а затем мне нужно отсортировать каждую группу по созданному времени, после чего мне нужно извлечь n-ую строку только для каждой группы. но я обнаружил, что после применения лямбды он ста…
06 апр '18 в 04:16
0
ответов
Python: Как реализовать многопроцессорную обработку в Pandas GroupBy Apply?
Проблема: По сути, я запрашиваю у SQL запрос набора данных, затем я хочу разделить этот набор данных по группам по номеру автонумера, а затем применить немного логики, содержащейся в функции get_currentdate, для возврата даты последней транзакции ка…
09 фев '18 в 17:29
2
ответа
Python Pandas Выборка / агрегация данных
У меня есть дата и время, разделенные запятыми, unique_id набор данных, который выглядит как ниже. datetime, unique_id 2016-09-01 19:50:01, bca8ca1c91d283212faaade44c6185956265cc09 2016-09-01 19:50:02, ddd20611d47597435412739db48b0cb04599e340 2016-0…
20 сен '16 в 02:43
2
ответа
Панды: Как получить все значения для столбца, где значение другого столбца является конкретным значением
У меня есть dataframe, который содержит sample_id и мутацию: каждый образец содержит несколько мутаций sample_id mutation sample1 mutation_A sample1 mutation_B sample1 mutation_D sample2 mutation_C sample2 mutation_D sample3 mutation_A sample3 mutat…
13 фев '18 в 13:13
1
ответ
Панды и фильтрация
У меня ошибка **'ufunc 'bitwise_and' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe'** когда я пытаюсь фильтровать по моему коду: (xls[xls['DisabilityFriendly…
28 окт '18 в 13:28
4
ответа
Pandas update column с массивом
Итак, я изучаю панды, и у меня есть эта проблема. Предположим, у меня есть Dataframe, как это: A B C 1 x NaN 2 y NaN 3 x NaN 4 x NaN 5 y NaN Я пытаюсь создать это: A B C 1 x [1,3,4] 2 y [2,5] 3 x [1,3,4] 4 x [1,3,4] 5 y [2,5] Based on B similarities…
19 июл '17 в 16:02
3
ответа
Python Pandas Sum Значения в столбцах Если дата между 2 датами
У меня есть датафрейм df который может быть создан с этим: data={'id':[1,1,1,1,2,2,2,2], 'date1':[datetime.date(2016,1,1),datetime.date(2016,1,2),datetime.date(2016,1,3),datetime.date(2016,1,4), datetime.date(2016,1,2),datetime.date(2016,1,4),dateti…
04 янв '18 в 21:28
1
ответ
Как сгруппировать по трем столбцам, используя условия в Pandas(Python)?
Привет, поэтому я в настоящее время работаю с фреймом данных, который имеет следующие столбцы: User_id (имеет более 30 типов повторяющихся идентификаторов пользователя):1,22,33,3,1,222,1,3 и т. Д. Столбец 1(имеет две категории):A,B,A,B и т. Д. Столб…
13 июл '18 в 21:31
1
ответ
Панды: переиндексация с датами в группе, заполнение / поддержание значений по мере необходимости
У меня есть следующий DataFrame. >>> df = pd.DataFrame(data={'date': ['2010-05-01', '2010-07-01', '2010-06-01', '2010-10-01'], 'id': [1,1,2,2], 'val': [50,60,70,80], 'other': ['uno', 'uno', 'dos', 'dos']}) >>> df['date'] = df['date…
26 сен '17 в 12:13
6
ответов
Сгруппируйте данные по пандам и выберите последние в каждой группе
Как сгруппировать значения pandas dataframe и выбрать самые последние (по дате) из каждой группы? Например, с учетом данных, отсортированных по дате: id product date 0 220 6647 2014-09-01 1 220 6647 2014-09-03 2 220 6647 2014-10-16 3 826 3380 2014-1…
07 янв '17 в 20:03