Описание тега pandas

Pandas- это библиотека Python для обработки и анализа данных, например фреймов данных, многомерных временных рядов и перекрестных наборов данных, обычно используемых в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas- одна из основных библиотек науки о данных в Python.
0 ответов

Matplotlib - общий источник для двойной оси без данных резки

Я хочу построить временной ряд на двойной оси y с помощью matplotlib и изменить масштаб оси так, чтобы начало координат (y=0) было выровнено для обеих осей. Я посмотрел на этот вопрос, но предлагаемые решения могут вырезать некоторые данные из сюжет…
09 авг '18 в 11:40
0 ответов

Как преобразовать извлеченный текст из PDF в формат JSON в Python

Я разбираю pdf файлы и извлекаю текст из pdf с помощью пакета python. Я хочу преобразовать извлеченные данные в формат JSON. Ниже приведены моя программа и извлеченный текст. Вот так выглядит мой извлеченный текст. Это моя программа для извлечения т…
05 дек '17 в 13:09
1 ответ

Обновление фрейма данных с использованием значений другого фрейма данных - python

Допустим, у меня есть кадры данных df1 а также df2, c1 = np.repeat(['a','b'], [8, 8], axis=0) c2 = list('xxxxyyyyxxxxyyyy') c3 = ['G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2'] c4 = [1,2]*8 val1 = np.random.rand(16)…
18 апр '16 в 18:02
0 ответов

Создание процентного графического участка в Python с пандами

Я хочу создать гистограмму в python, похожую на следующую гистограмму. Однако вместо абсолютных значений я хотел бы иметь процентные значения по оси Y. В общем, я хотел бы написать функцию, которая проходит через мой фрейм данных и для каждой "цели"…
29 июн '17 в 18:45
0 ответов

Вставьте или замените аналогичную операцию для Pandas HDFStore (таблица)

Я пытаюсь выяснить, как выполнить операцию "Вставить или заменить", как в магазине handas pandas (формат таблицы). Есть ли эффективный способ сделать это? Я только рассматриваю соответствие по индексу.
03 дек '13 в 03:29
1 ответ

Панды и стата 13 файлов

У меня установлены панды 0.13.1, но pandas.read_stata() не может прочитать файлы .dta, созданные в формате Stata 13, с ошибкой TypeError: cannot concatenate 'str' and 'NoneType' objects Нет проблем с тем же набором данных, сохраненным в формате Stat…
05 июн '14 в 07:00
2 ответа

Передать имена в список и использовать "содержит" для каждого

У меня есть датафрейм, который называется один из его столбцов proj есть предложение в каждой строке, и в этом предложении упоминается название города. Я хочу сделать if при условии, что при передаче пароля будут доступны данные другого города. proj…
17 сен '18 в 08:21
1 ответ

Pandas dataframe не может преобразовать тип данных столбцов из объекта в строку для дальнейшей работы

Это мой рабочий код, который загружает файл Excel с веб-сайта. Это займет около 40 секунд. Запустив этот код, вы заметите, что столбцы Key1, Key2 и Key3 являются объектными dtypes. Я очистил фрейм данных таким образом, чтобы ключи key1 и key2 имели …
18 авг '17 в 03:05
0 ответов

Python Pandas Timeseries Sum Ежедневные данные столбца

Я застрял, пытаясь выяснить, как суммировать один из столбцов в моем фрейме данных на основе дня / месяца / года и т. Д. Я не хочу выполнять агрегирование для других столбцов. Поскольку датафрейм станет короче, я бы хотел использовать минимальное зн…
19 фев '15 в 23:00
1 ответ

Как сохранить результат для цикла for

Я пытаюсь создать отчет, используя python, где цикл for повторяется для каждого местоположения, но как только я запускаю этот код, он дает данные только для последнего местоположения. Как я могу сохранить результат из этого цикла. import inflect imp…
26 июн '18 в 16:04
3 ответа

Как сохранить новый фрейм данных после использования на нем собственной функции?

Я только начинаю использовать пользовательские функции, так что это, наверное, не очень сложный вопрос, простите меня. У меня есть несколько фреймов данных, у всех из которых есть столбец с именем 'interval_time' (например), и я хотел бы переименова…
4 ответа

Сплит панды колонка питон

Я работаю над Python 3.4, и у меня есть столбец данных pandas, содержащий: 0 [0.3785766661167145, -0.449486643075943, -0.15...] 1 [0.204025000333786, -0.3685399889945984, 0.231...] 2 [0.684576690196991, -0.5823000073432922, 0.269...] 3 [-0.023005001…
29 май '17 в 09:38
1 ответ

Форматирование выходных данных панд

У меня есть датафрейм, и я хочу, чтобы вывод был отформатирован для экономии бумаги для печати. GameA GameB Country London 5 20 London 5 10 London 3 5 London 3 6 London 8 London 40 France 2 20 France 2 22 France 3 France 3 France 3 USA 10 Есть ли сп…
16 апр '16 в 06:50
1 ответ

Spyder, исследователь переменных, xpt

Я прихожу на Python с опытом SAS. Я импортировал транспортный файл SAS версии 5 (XPT) в python, используя: df = pd.read_sas(r'C:\mypath\myxpt.xpt') Этот файл представляет собой простой транспортный файл SAS, преобразованный из набора данных SAS, соз…
19 ноя '18 в 14:06
1 ответ

Value_Counts, Mapping, GroupBy и Plotting

Я работаю над личным проектом с использованием данных IMDB и в настоящее время исчерпал все возможности. Краткая информация: Я пытаюсь найти топ-10 кассовых режиссеров и актеров Я могу сделать это, но хотел бы сделать еще один шаг вперед и найти топ…
22 июл '17 в 12:49
1 ответ

Как разделить столбец панд данных в разных строках в зависимости от некоторых условий?

Я пытаюсь разделить один столбец DataFrame панды на несколько строк. ДАННЫЕ: входной фрейм данных будет выглядеть ниже: sports_name,player_name,player_country,player_average football,XYZ,US,"[['1', '62.58'], ['2', '25.34'],['3', '88.35'],['4', '59.3…
09 май '18 в 06:39
1 ответ

Слияние двух временных рядов в пандах

Извиняюсь, если это где-то задокументировано, но у меня возникают проблемы с обнаружением. У меня есть два TimeSeries с несколькими перекрывающимися датами / индексами, и я хотел бы объединить их. Я предполагаю, что мне нужно будет указать, в какой …
05 июн '13 в 16:28
1 ответ

Как найти рабочие дни между датами с помощью Pandas CDay?

Я определил панд CDay() объект, который хранит праздники. Как я могу использовать это, чтобы найти количество рабочих дней между двумя датами? Я в курсе np.busday_count, но мой календарь случается, что панды CDay,
14 мар '17 в 15:08
1 ответ

Выберите многоиндексные столбцы на основе нескольких меток второго уровня во фрейме данных Pandas

Я хотел бы выбрать столбцы во фрейме данных Pandas, который был построен с мультииндексом. В частности, я хотел бы выбрать столбцы на основе более чем одной метки второго уровня. Пример: В следующем фрейме данных панд: bar bar baz baz foo foo qux on…
24 апр '18 в 18:46
1 ответ

Панды: несоответствие частоты TimeGrouper

У меня есть следующий DataFrame: df = pd.DataFrame({ 'Buyer': 'Carl Mark Carl Joe Joe Carl'.split(), 'Quantity': [1,3,5,8,9,3], 'Date' : [ DT.datetime(2013,9,1,13,0), DT.datetime(2013,9,1,13,5), DT.datetime(2013,10,1,20,0), DT.datetime(2013,10,3,10,…
07 июн '13 в 14:52