Описание тега wrangle
Wrangle - это предметно-ориентированный язык, используемый для создания рецептов преобразования в Cloud Dataprep.
0
ответов
Каковы лучшие веб-инструменты с открытым исходным кодом для обработки данных или подготовки данных
Я нашел CDAP (данные бочки), которые соответствуют всем моим требованиям, но для работы в нем требовался кластер hadoop. Существуют ли другие подобные инструменты для cdap или trifacta (только на веб-основе)
20 ноя '18 в 12:50
1
ответ
В DataPrep, суммируйте множество столбцов или значений в объекте
У меня есть набор данных DataPrep, который содержит серию ~10 столбцов, каждый из которых указывает, была ли выбрана конкретная брошюра: BRO_AF BRO_SAF BRO_SE ... 1 1 1 1 1 Я хотел бы суммировать / считать эти значения в BrochuresSelected колонка. Я…
22 ноя '17 в 09:33
2
ответа
Отметьте время суток утром, днем и вечером в R
Как я могу пометить время суток (утром, днем и вечером) для заданных временных отметок? Начальные данные Id Time_stamp 3083188c 2016-08-29 13:10:51 924d500e 2016-08-29 09:22:33 ad4dd7ff 2016-08-25 20:29:35 Конечные данные Id Time_stamp Time_of_day…
12 май '18 в 08:09
2
ответа
Разделить фрейм данных в список на основе идентичного последовательного элемента
Существует ли эффективный способ разбить фрейм данных на основе идентичного последовательного элемента в столбце в список (и сохранить порядок элемента фрейма в списке) следующим образом? Фрейм данных: X__1 S003 S003 S003 S006 S006 S011 S007 S007 S0…
04 янв '18 в 14:43
1
ответ
Я хочу сделать аккуратные данные
Я хочу сделать распространение данных на основе дубликатов данных. Я хочу накапливать столбцы на основе перекрывающихся строк. Например, столбец X2 повторяется 5 раз. Похоже на использование функции распространения в пакете tidyr, но немного по-друг…
19 фев '19 в 09:57
2
ответа
Как преобразовать все переменные таблицы данных одной строки в единичные значения
Я создал DT, поместив значения в таблицу: a <- 2 b <- 20 c <- 0.3 DT <- data.table(a, b, c) давайте предположим, что у меня есть только DT сгенерированный. Как можно из DT сгенерировать a, b, c (отдельные значения) Спасибо и всего наилуч…
17 май '19 в 21:49
1
ответ
Как добавить столбец к фреймам данных в списке?
У меня есть список фреймов данных. Я хочу добавить новый столбец в каждый фрейм данных. Например, у меня есть три кадра данных следующим образом: a = data.frame("Name" = c("John","Dor")) b = data.frame("Name" = c("John2","Dor2")) c = data.frame("Nam…
15 июл '19 в 05:45
3
ответа
Как убрать очки на основе их атрибутов в Гудини?
Я создал кривую с несколькими точками. Теперь я хочу удалить некоторые точки на основе одного из их атрибутов (will_be_removed). [img] https://imgur.com/T9DLpk6 [/ img] Как показано на рисунке выше, те точки с i@will_be_removed, установленным в 1, б…
06 авг '19 в 12:08
0
ответов
Как преобразовать из таблицы в формат данных?
Сначала я усреднил данные игрока и уменьшил их. player <- player %>% group_by(NM) %>% summarise_all(funs(mean(., na.rm = TRUE))) И это результат. head(player) # A tibble: 6 x 26 NM NO MIN `2PTM` `2PTA` `2PT(%)` `3PTM` `3PTA` `3PT(%)` FGM FG…
17 май '19 в 11:01
1
ответ
Фрейм данных Wrangle в R, возможно, с dcast
У меня data.frame довольно большой, и мне нужно немного его повозить. текущая структура: V1 V2 V3 V4 V5 V6 V7 V8 ... Vn Vn+1 chr1 1 A T sample_1 value_1 sample_2 value_4 ... sample_n value_7 chr1 40 T C sample_1 value_2 sample_2 value_5 ... sample_n…
23 мар '20 в 15:56
1
ответ
Есть ли функция R, которая может преобразовать существующую метрику в новую логическую метрику?
У меня есть набор данных, полученный из статистики покемонов, содержащий множество числовых и категориальных данных. Моя конечная цель - создать модель или систему рекомендаций, в которой пользователь может ввести список покемонов, и модель найдет п…
09 ноя '19 в 20:44
2
ответа
Как я могу рассчитать продолжительность времени для заданных временных точек в R
Я пытаюсь найти посылку или R code это может помочь рассчитать продолжительность различных временных точек для нескольких субъектов. Вот как выглядят данные ------------------------------------ SubjectID | Task |Duration ----------------------------…
14 ноя '19 в 20:37
2
ответа
Data Wrangling в R с использованием tidyverse?
Итак, у меня есть этот набор данных. Основной переход - это поворот таблицы, поэтому имена населения находятся в первом столбце, имена - это заголовки для каждого столбца (и они переименованы, поэтому, например, хлорофилл переименован в CHLa). Друго…
27 фев '20 в 19:49
4
ответа
Данные Wrangle в R
Я хотел бы перейти от левой таблицы к правой таблице на изображении ниже, но, похоже, не могу найти логику кодирования, чтобы достичь результата с помощью R. Столы Ваша помощь очень ценится!
26 ноя '19 в 11:37
1
ответ
Есть ли в R функция, которая позволит мне преобразовать набор данных в "длинный формат", но также объединить столбцы?
У меня есть набор данных, полученный из статистики покемонов, содержащий множество числовых и категориальных данных. Моя конечная цель - создать модель или систему рекомендаций, в которой пользователь может ввести список покемонов, и модель найдет п…
10 ноя '19 в 05:46
0
ответов
Преобразование набора данных даты в шкалу времени в R
У меня сложная проблема с использованием дат в наборе данных. Опишу проблему и приведу пример. Данные - это данные больницы, где у нас есть информация о том, когда человеку поставили окончательный диагноз (key_date), и данные о событиях, когда челов…
26 ноя '20 в 11:57
1
ответ
Распаковать столбцы json в фрейм данных
У меня есть строки json внутри столбца фрейма данных. Я хочу перенести все эти новые столбцы json в фрейм данных. # Input JsonID <- as.factor(c(1,2,3)) JsonString1 = "{\"device\":{\"site\":\"Location1\"},\"tags\":{\"Engine Pressure\":\"150\",\"ti…
08 фев '21 в 05:56
1
ответ
изменить определенные столбцы с помощью tidyverse
быстрый вопрос: может кто-нибудь сказать мне, как я делаю следующее в синтаксисе dplyr? p4[,1:5] <- lapply(p4[,1:5] , factor) Столбцы 1-5 были персонажами, и я хотел, чтобы они были факторами. Однако с dplyr я не справился. Мое предположение было…
10 июн '21 в 11:44
2
ответа
Как вычесть строки между двумя разными фреймами данных и заменить исходное значение?
У меня есть два фрейма данных, показанные ниже. Как я могу заменить данные Bank1, вычитая 10 на 3 и 55 на 2? import pandas as pd data = [['Bank1', 10, 55], ['Bank2', 15,65], ['Bank3', 14,54]] df1 = pd.DataFrame(data, columns = ['BankName', 'Value1',…
14 окт '21 в 06:22
0
ответов
Как отразить изменения, сделанные в файлах xlsx?
Я пытаюсь получить данные из общего файла Excel на одном диске. Я синхронизировал один диск с моим MacBook, поэтому я легко могу получить к нему доступ в r с помощью пути. У меня есть следующий код: my_data <- "Users/B.../Folder/my_file.xlsx" exc…
20 янв '22 в 18:58