Описание тега dataframe

Описание тега Вопросы с тегом

Фрейм данных - это табличная структура данных. Обычно он содержит данные, где строки представляют собой наблюдения, а столбцы - переменные различных типов. Хотя "фрейм данных" или "фрейм данных" является термином, используемым для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "таблица" - это термин, используемый в MATLAB и SQL.

1 ответ

Обновление фрейма данных с использованием значений другого фрейма данных - python

Допустим, у меня есть кадры данных df1 а также df2, c1 = np.repeat(['a','b'], [8, 8], axis=0) c2 = list('xxxxyyyyxxxxyyyy') c3 = ['G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2'] c4 = [1,2]*8 val1 = np.random.rand(16)…

python pandas dataframe

18 апр '16 в 18:02

1 ответ

Что не так с этим кодом Reshape?

Я пытаюсь изменить этот фрейм данных: ID tag stemID spcode x y blk plotnum trt date1 dbh1 hom1 codes1 height1 canpos1 liana1 obs1 date2 dbh2 hom2 codes2 height2 canpos2 liana2 obs2 date3 dbh3 hom3 codes3 height3 canpos3 liana3 obs3 date4 dbh4 hom4 c…

r dataframe reshape

30 апр '13 в 15:56

3 ответа

Как сохранить новый фрейм данных после использования на нем собственной функции?

Я только начинаю использовать пользовательские функции, так что это, наверное, не очень сложный вопрос, простите меня. У меня есть несколько фреймов данных, у всех из которых есть столбец с именем 'interval_time' (например), и я хотел бы переименова…

python pandas dataframe user-defined-functions

06 июл '18 в 10:08

1 ответ

PySpark: несоответствие в преобразовании метки времени в целое число в кадре данных

python dataframe datetime pyspark bigdata

08 сен '17 в 18:48

1 ответ

Как разделить столбец панд данных в разных строках в зависимости от некоторых условий?

Я пытаюсь разделить один столбец DataFrame панды на несколько строк. ДАННЫЕ: входной фрейм данных будет выглядеть ниже: sports_name,player_name,player_country,player_average football,XYZ,US,"[['1', '62.58'], ['2', '25.34'],['3', '88.35'],['4', '59.3…

python pandas dataframe

09 май '18 в 06:39

2 ответа

Объединить по row.name и столбцу

Это должно быть просто, и я, вероятно, просто глуп, но... Мне нужно объединить два фрейма данных по именам строк df1 и столбцу в df2, т.е. df1<-data.frame(x=1:3,y=4:6) rownames(df1)<-c("a","b","c") df1 x y a 1 4 b 2 5 c 3 6 df2<-data.frame(…

r dataframe merge

11 сен '12 в 09:44

2 ответа

Соответствующие индексы в python для категоризации столбца

У меня есть столбец в кадре данных длиной 1083 с 143 уникальными значениями. Чтобы проиллюстрировать мой вопрос, 6 из них: пекарня больница Гостиница зубной врач Университет ресторан Я создал еще один фрейм данных, 2x1. Первый столбец содержит 143 у…

python dataframe match

21 ноя '15 в 16:57

1 ответ

Эффективное создание дополнительных столбцов в панде DataFrame с помощью.map()

Я анализирую набор данных, который по форме похож на следующий пример. У меня есть два разных типа данных (abc data и xyz data): abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3 1 2 1 1 1 1 4 1 1 2 1 2 1 Я хочу создать функц…

python pandas dataframe

15 май '13 в 22:12

1 ответ

Расплавить datafarame с определенным порядком в R

Я пытаюсь расплавить этот набор данных: raw1 <- c("Alpha", "2018-04-01", "566.0", "647.75", "669.08", "673.08", "675.00") raw2 <- c("Alpha", "2018-04-02", "563.3", "651.08", "670.67", "684.58", "671.17") mydf <- as.data.frame(rbind(raw1, ra…

r dataframe reshape melt

15 май '18 в 10:11

2 ответа

Сравнение фреймов данных с циклами for

Извините, если это основной вопрос. Я везде искал помощи и не могу найти ответ. В основном у меня есть два фрейма данных, один из них - "Ключ ответа", ответы на который начинаются в столбце 3. и фрейм основных данных с ответами пятидесяти студентов.…

r dataframe

23 фев '18 в 10:12

0 ответов

Чтение XML-файла в Pandas и преобразование в фрейм данных

Привет, я работаю с огромным XML-файлом. Я хочу извлечь значения из всех абстрактных тегов и нужно преобразовать в фрейм данных. Я пытался с помощью следующего кода: root=file1.getroot() print(root) for child in root: if(child.tag=='Abstract'): prin…

python-3.x pandas xml dataframe

02 май '18 в 07:56

0 ответов

Одо не передает содержимое таблицы Hive в CSV-файл?

Я использую Python 3.6 и у меня есть table A в какой-то базе данных. Я запускаю следующую команду: odo('hive://pp1.company.abcde:10000/db::A', 'data.csv') Однако я получаю следующую ошибку: KeyError: <class 'sqlalchemy.engine.base.Engine'> Мне…

python sql database dataframe hive

22 мар '18 в 12:53

3 ответа

Как объединить фреймы данных, где column1 является подстрокой column2

У меня есть фрейм данных, и я хотел бы классифицировать каждую строку на основе значения столбца df $ name. Для классификации у меня есть фрейм данных с двумя столбцами tl с столбцом tl $ name и tl $ type. Я хотел бы объединить два фрейма данных с о…

r dataframe merge

07 май '17 в 10:04

1 ответ

Условное объединение Pandas DataFrames в Python

У меня есть 2 DataFrames, которые в настоящее время выглядят так: raw_data = {'SeriesDate':['2017-03-10','2017-03-13','2017-03-14','2017-03-15','2017-03-16','2017-03-17']} import pandas as pd df1 = pd.DataFrame(raw_data,columns=['SeriesDate']) df1['…

python pandas dataframe python-2.7

20 апр '17 в 11:23

4 ответа

Удаление строк во фрейме данных с помощью функции get

Предположим, у меня есть следующий фрейм данных: mydataframe <- data.frame(ID=c(1,2,NA,4,5,NA),score=11:16) Я хочу получить следующий кадр данных в конце: mydataframe[-which(is.na(mydataframe$ID)),] Мне нужно сделать этот вид очистки (и другие по…

r dataframe

29 май '13 в 04:37

1 ответ

Как преобразовать последние несколько столбцов в целое число из строкового типа в пандах

У меня есть df под названием df, Я хочу преобразовать последние 10 столбцов этого кадра данных из строкового типа в целые числа. Как я могу сделать это питонским способом?

python pandas dataframe

07 янв '15 в 19:01

2 ответа

Свернуть переменные в длинном формате кадра данных R

У меня есть датафрейм в длинном формате, как id varA varB 1 'a' 112 1 'b' 212 1 'c' 308 2 'a' 99 2 'b' 123 2 'c' 452 Я хочу рухнуть за id значения в varB за varA == 'a' а также varA == 'b', В широком кадре данных, как: id varBa varBb varBc 1 112 212…

r dataframe

15 авг '16 в 10:58

1 ответ

Конвертировать pandas dataframe в список кортежей

У меня есть примерный фрейм данных >>> df a b 0 1 2 1 3 4 Я хочу преобразовать это в список кортежей. Я пытался с помощью itertuples() для того же >>> list(df.T.itertuples()) [('a', 1, 3), ('b', 2, 4)] Но я хочу, чтобы результат им…

python pandas dataframe numpy

24 июн '15 в 08:15

1 ответ

Объединение строк даты и времени и их значений

Здравствуйте, я хотел бы изменить временной интервал моего столбца datetime и добавить сгруппированные значения. Прямо сейчас мои datetime увеличиваются на 10 минут с каждым datetime, имеющим значение, но я хотел бы, чтобы вместо этого он увеличился…

python pandas dataframe time-series

06 апр '18 в 22:58

3 ответа

Удалите все знаки препинания из кадра данных, кроме некоторых символов

Я пытаюсь удалить все знаки пунктуации с кадра данных, кроме символов "<" и ">" Я старался: def non_punct(df): df['C'] = df['C'].str.replace('[^\w\s]' | ~(<) | ~(>),' ') return df Выход: File "<ipython-input-292-ac8369672f62>", line 3 df…

python pandas dataframe

07 ноя '18 в 14:07