Описание тега pandasql

NonePandasql позволяет запрашивать кадры данных pandas с использованием синтаксиса SQL. Он работает аналогично sqldf в R.
2 ответа

Изменение текста с параметром в Python

Если я хочу изменить запрос с параметром. я не хочу запускать Sql с этим запросом. Я хочу написать запрос в текстовом файле и поделиться запросом с другими людьми. Но Pandas.text_sql, Pandas.read_sql_query эта функция будет запускаться с использован…
28 мар '17 в 06:40
1 ответ

Использование пользовательских переменных ввода в PandaSQL

Я пытаюсь использовать pandaSQL на имеющемся у меня фрейме данных, и мне интересно, есть ли способ использовать переменные или есть другой способ сделать это. Я пытаюсь установить пользовательский ввод как переменную и затем попытаться использовать …
07 апр '15 в 21:44
2 ответа

Pandasql: sqldf ошибка выполнения

Я хочу выполнить sql-запрос "SELECT 1", используя pandasql. Но есть ошибка: Traceback (most recent call last): File "C:\Users\AdminVAIO\Documents\Visual Studio 2013\Projects\crm\crm\crm.py", line 47, in <module> print(ps.sqldf(s, locals())) Fi…
04 апр '16 в 14:09
0 ответов

pandasql int слишком велик, чтобы преобразовать ошибку

У меня есть данные, как пример данных ниже. Когда я запускаю приведенный ниже код, чтобы получить количество разных идентификаторов продукта по prod cat, я получаю сообщение об ошибке ниже. Похоже, что у панды группового с nunique нет никаких пробле…
09 апр '18 в 03:05
1 ответ

Как сравнить одно значение с несколькими значениями в Python с библиотекой Pandas?

В настоящее время у меня есть следующий сценарий. Excel Data Frame = SQL Data Frame = ________ ________ _______ ___________ _________ |sector| |sector| | hour| | value_cs| value_ps| -------- -------- ------- ----------- --------- AXYZ AXYZ 0 78.90 8…
24 июл '17 в 18:11
1 ответ

Как преобразовать оператор SQL select с определенными полями и оператором where в pandas dataframe

Я пытаюсь преобразовать следующее выражение SQL в pandas dataframe в python SELECT sum(money) from df where sex='female' Я не могу получить это в пандах заранее спасибо
1 ответ

Запрос panda df для фильтрации строк, где столбец не является Nan

Я новичок в питоне и использую панд. Я хочу запросить фрейм данных и отфильтровать строки, где один из столбцов не NaN, Я пытался: a=dictionarydf.label.isnull() но населен true или же false, Пробовал это dictionarydf.query(dictionarydf.label.isnull(…
26 сен '16 в 05:59
1 ответ

pandasql не будет импортировать: ImportError: не может импортировать имя to_sql

Я установил pandasql с pip в командной строке linux и запустил ноутбук ipython: felix@xanadu ~ $ sudo pip install pandasql [sudo] password for felix: Downloading/unpacking pandasql Downloading pandasql-0.6.2.tar.gz Running setup.py (path:/tmp/pip_bu…
20 апр '15 в 18:17
0 ответов

Создание столбца данных Pandas с помощью условия группировки и где

У меня есть таблица с именами столбцов:user_id, status_type Где status_type может принимать два разных значения: удалить или добавить только. Я хочу создать таблицу со столбцами: user_id, status_type_add_count, status_type_delete_count. Например для…
07 янв '19 в 11:28
1 ответ

Обновление оператора таблицы не работает в pandasql

У меня есть набор данных с некоторыми нулевыми значениями, которые я хотел обновить, чтобы прочитать отсутствующие вместо нулевых Я просмотрел все форумы и документацию и не могу найти ответ from pandasql import sqldf pysqldf = lambda q: sqldf(q, gl…
19 янв '19 в 18:58
0 ответов

Столбец SQL-запроса не существует

Я видел много ответов о похожих SQL-запросах, но по какой-то причине ни одно из решений не работает с моим запросом. Я пытаюсь прочитать мой запрос во фрейме данных pandas, сопоставляя их с моими (списочными) переменными из ранее. Спасибо за любое п…
16 фев '19 в 12:04
1 ответ

Что эквивалентно для LISTAGG в Pandas?

У меня есть следующие агрегаты: def my_agg(x): names = { 'first_seen': x['first_seen'].min(), 'last_seen': x['last_seen'].max(), 'md5s': x['md5s'].tolist(), } return pd.Series(names, index=['first_seen', 'last_seen', 'md5s']) Но в моих результатах у…
1 ответ

Панды - Использование 'ffill' для значений, отличных от Na

Есть ли способ использовать ffill метод значений, которые не являются NaN? я имею NaN в моем фрейме данных, но я добавил эти NaN с помощью addNan = sample['colA'].replace(['A'], 'NaN') Так что это то, что мой DataFrame, df похоже ColA ColB ColC ColD…
12 авг '16 в 10:07
0 ответов

cx_freeze - exe возвращает неописуемую ошибку на sqldf

Пытаясь создать exe для моего скрипта, я использую pandasql и sqldf для создания запросов sql к 2 файлам csv для сопоставления. После сборки, когда я запускаю файл.exe, экран с перечнем ошибок возвращается согласно предоставленному изображению. Ваша…
11 окт '18 в 08:17
2 ответа

Как мне соединить оракул с моим скриптом Python?

У меня есть требование соединить оракул БД с python и скрыть их как Dataframe. Хотите узнать, какие легкие пакеты доступны и как их установить? Я использую Anaconda 3(Python 3.5.2), я пытался с cx_oracle, но не смог установить из-за зависимостей. Сл…
17 фев '17 в 06:33
1 ответ

Фильтровать данные панд по конкретному индексу

Я хотел бы отфильтровать фрейм данных на основе индекса специфики. Я прочитал что-то о запросе, но у меня ничего не получается. Вот код, который создает мою сводную таблицу. Я хотел бы фильтровать по конкретным участникам df = pd.DataFrame(my_datafr…
25 фев '18 в 10:25
1 ответ

Необходимо редактировать подмножество строк из таблицы MySQL, используя Pandas Dataframe

Я пытаюсь изменить таблицу в моей базе данных. Однако мне трудно использовать метод to_sql, предоставленный Pandas. мой price_data Датафрейм выглядит примерно так: Начальный кадр данных (как строки в базе данных): Код, используемый для изменения дан…
17 сен '16 в 17:41
1 ответ

Строки GROUP BY в DataFrame/ таблице в записной книжке Pandas/iPython (Jupyter)?

У меня есть таблица, которая выглядит так: Текущий DataFrame/Table: 'original_table' col_1 col_2 col_3 0 Non-Saved www.google.com 10 1 Non-Saved www.facebook.com 20 2 Non-Saved www.linkedin.com 20 3 Saved www.Quora.com 30 4 Saved www.gmail.com 40 Мо…
2 ответа

Использование pd.read_sql() для извлечения больших данных (>5 миллионов записей) из базы данных Oracle, что делает выполнение SQL очень медленным

Первоначально пытался использовать pd.read_sql(). Затем я попытался использовать sqlalchemy, объекты запросов, но ни один из этих методов не полезен, так как sql выполняется долго и никогда не заканчивается. Я пытался использовать подсказки. Я предп…
05 авг '18 в 10:36
2 ответа

Преобразование столбцов панд в списки, разделенные запятыми, для использования в инструкциях sql

У меня есть датафрейм, и я пытаюсь превратить столбец в список через запятую. Конечная цель - передать этот разделенный запятыми список как список отфильтрованных элементов в запросе SQL. Как мне это сделать? > import pandas as pd > > mydat…
24 май '17 в 22:01