Описание тега dataframe
Фрейм данных - это табличная структура данных. Обычно он содержит данные, где строки представляют собой наблюдения, а столбцы - переменные различных типов. Хотя "фрейм данных" или "фрейм данных" является термином, используемым для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "таблица" - это термин, используемый в MATLAB и SQL.
1
ответ
Обновление фрейма данных с использованием значений другого фрейма данных - python
Допустим, у меня есть кадры данных df1 а также df2, c1 = np.repeat(['a','b'], [8, 8], axis=0) c2 = list('xxxxyyyyxxxxyyyy') c3 = ['G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2','G1','G1','G2','G2'] c4 = [1,2]*8 val1 = np.random.rand(16)…
18 апр '16 в 18:02
1
ответ
Что не так с этим кодом Reshape?
Я пытаюсь изменить этот фрейм данных: ID tag stemID spcode x y blk plotnum trt date1 dbh1 hom1 codes1 height1 canpos1 liana1 obs1 date2 dbh2 hom2 codes2 height2 canpos2 liana2 obs2 date3 dbh3 hom3 codes3 height3 canpos3 liana3 obs3 date4 dbh4 hom4 c…
30 апр '13 в 15:56
3
ответа
Как сохранить новый фрейм данных после использования на нем собственной функции?
Я только начинаю использовать пользовательские функции, так что это, наверное, не очень сложный вопрос, простите меня. У меня есть несколько фреймов данных, у всех из которых есть столбец с именем 'interval_time' (например), и я хотел бы переименова…
06 июл '18 в 10:08
1
ответ
PySpark: несоответствие в преобразовании метки времени в целое число в кадре данных
У меня есть датафрейм с грубой структурой, подобной следующей: +-------------------------+-------------------------+--------+ | timestamp | adj_timestamp | values | +-------------------------+-------------------------+--------+ | 2017-05-31 15:30:48…
08 сен '17 в 18:48
1
ответ
Как разделить столбец панд данных в разных строках в зависимости от некоторых условий?
Я пытаюсь разделить один столбец DataFrame панды на несколько строк. ДАННЫЕ: входной фрейм данных будет выглядеть ниже: sports_name,player_name,player_country,player_average football,XYZ,US,"[['1', '62.58'], ['2', '25.34'],['3', '88.35'],['4', '59.3…
09 май '18 в 06:39
2
ответа
Объединить по row.name и столбцу
Это должно быть просто, и я, вероятно, просто глуп, но... Мне нужно объединить два фрейма данных по именам строк df1 и столбцу в df2, т.е. df1<-data.frame(x=1:3,y=4:6) rownames(df1)<-c("a","b","c") df1 x y a 1 4 b 2 5 c 3 6 df2<-data.frame(…
11 сен '12 в 09:44
2
ответа
Соответствующие индексы в python для категоризации столбца
У меня есть столбец в кадре данных длиной 1083 с 143 уникальными значениями. Чтобы проиллюстрировать мой вопрос, 6 из них: пекарня больница Гостиница зубной врач Университет ресторан Я создал еще один фрейм данных, 2x1. Первый столбец содержит 143 у…
21 ноя '15 в 16:57
1
ответ
Эффективное создание дополнительных столбцов в панде DataFrame с помощью.map()
Я анализирую набор данных, который по форме похож на следующий пример. У меня есть два разных типа данных (abc data и xyz data): abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3 1 2 1 1 1 1 4 1 1 2 1 2 1 Я хочу создать функц…
15 май '13 в 22:12
1
ответ
Расплавить datafarame с определенным порядком в R
Я пытаюсь расплавить этот набор данных: raw1 <- c("Alpha", "2018-04-01", "566.0", "647.75", "669.08", "673.08", "675.00") raw2 <- c("Alpha", "2018-04-02", "563.3", "651.08", "670.67", "684.58", "671.17") mydf <- as.data.frame(rbind(raw1, ra…
15 май '18 в 10:11
2
ответа
Сравнение фреймов данных с циклами for
Извините, если это основной вопрос. Я везде искал помощи и не могу найти ответ. В основном у меня есть два фрейма данных, один из них - "Ключ ответа", ответы на который начинаются в столбце 3. и фрейм основных данных с ответами пятидесяти студентов.…
23 фев '18 в 10:12
0
ответов
Чтение XML-файла в Pandas и преобразование в фрейм данных
Привет, я работаю с огромным XML-файлом. Я хочу извлечь значения из всех абстрактных тегов и нужно преобразовать в фрейм данных. Я пытался с помощью следующего кода: root=file1.getroot() print(root) for child in root: if(child.tag=='Abstract'): prin…
02 май '18 в 07:56
0
ответов
Одо не передает содержимое таблицы Hive в CSV-файл?
Я использую Python 3.6 и у меня есть table A в какой-то базе данных. Я запускаю следующую команду: odo('hive://pp1.company.abcde:10000/db::A', 'data.csv') Однако я получаю следующую ошибку: KeyError: <class 'sqlalchemy.engine.base.Engine'> Мне…
22 мар '18 в 12:53
3
ответа
Как объединить фреймы данных, где column1 является подстрокой column2
У меня есть фрейм данных, и я хотел бы классифицировать каждую строку на основе значения столбца df $ name. Для классификации у меня есть фрейм данных с двумя столбцами tl с столбцом tl $ name и tl $ type. Я хотел бы объединить два фрейма данных с о…
07 май '17 в 10:04
1
ответ
Условное объединение Pandas DataFrames в Python
У меня есть 2 DataFrames, которые в настоящее время выглядят так: raw_data = {'SeriesDate':['2017-03-10','2017-03-13','2017-03-14','2017-03-15','2017-03-16','2017-03-17']} import pandas as pd df1 = pd.DataFrame(raw_data,columns=['SeriesDate']) df1['…
20 апр '17 в 11:23
4
ответа
Удаление строк во фрейме данных с помощью функции get
Предположим, у меня есть следующий фрейм данных: mydataframe <- data.frame(ID=c(1,2,NA,4,5,NA),score=11:16) Я хочу получить следующий кадр данных в конце: mydataframe[-which(is.na(mydataframe$ID)),] Мне нужно сделать этот вид очистки (и другие по…
29 май '13 в 04:37
1
ответ
Как преобразовать последние несколько столбцов в целое число из строкового типа в пандах
У меня есть df под названием df, Я хочу преобразовать последние 10 столбцов этого кадра данных из строкового типа в целые числа. Как я могу сделать это питонским способом?
07 янв '15 в 19:01
2
ответа
Свернуть переменные в длинном формате кадра данных R
У меня есть датафрейм в длинном формате, как id varA varB 1 'a' 112 1 'b' 212 1 'c' 308 2 'a' 99 2 'b' 123 2 'c' 452 Я хочу рухнуть за id значения в varB за varA == 'a' а также varA == 'b', В широком кадре данных, как: id varBa varBb varBc 1 112 212…
15 авг '16 в 10:58
1
ответ
Конвертировать pandas dataframe в список кортежей
У меня есть примерный фрейм данных >>> df a b 0 1 2 1 3 4 Я хочу преобразовать это в список кортежей. Я пытался с помощью itertuples() для того же >>> list(df.T.itertuples()) [('a', 1, 3), ('b', 2, 4)] Но я хочу, чтобы результат им…
24 июн '15 в 08:15
1
ответ
Объединение строк даты и времени и их значений
Здравствуйте, я хотел бы изменить временной интервал моего столбца datetime и добавить сгруппированные значения. Прямо сейчас мои datetime увеличиваются на 10 минут с каждым datetime, имеющим значение, но я хотел бы, чтобы вместо этого он увеличился…
06 апр '18 в 22:58
3
ответа
Удалите все знаки препинания из кадра данных, кроме некоторых символов
Я пытаюсь удалить все знаки пунктуации с кадра данных, кроме символов "<" и ">" Я старался: def non_punct(df): df['C'] = df['C'].str.replace('[^\w\s]' | ~(<) | ~(>),' ') return df Выход: File "<ipython-input-292-ac8369672f62>", line 3 df…
07 ноя '18 в 14:07