Описание тега janitor
Пакет R, предоставляющий функции для проверки и очистки данных.
2
ответа
Как свернуть строки таблицы частот, чтобы добавить их значения в новый столбец?
У меня есть датафрейм с образцами классификаций: Seq_ID Family Father Mother Sex Role Type <chr> <dbl> <chr> <chr> <chr> <chr> <chr> 1 SSC02219 11000. 0 0 Male Father Parent 2 SSC02217 11000. 0 0 Female Moth…
28 апр '18 в 01:52
1
ответ
Количество столбцов не-NA в файле grouped_df dplyr
Я пытаюсь создать столбец в моем .df это дает значение на количество (не NA) столбцов. Это просто в тех случаях, когда данные не сгруппированы, как я могу использовать ncol() или же dim(df)[2], Моя проблема заключается в попытке использовать любую и…
12 янв '18 в 01:43
1
ответ
Определить структуру всех данных
Скажем, у вас есть следующие данные: data <- tibble::tribble(~Countries, ~States, ~Continents, "Country 1", 1L, "continent 1", "Country 1", 2L, "continent 1", "Country 1", 3L, "continent 1", "Country 1", 4L, "continent 1", "Country 2", 1L, "conti…
17 окт '18 в 05:41
1
ответ
Можно ли сделать функцию для извлечения значений столбцов из одной строки?
Я создал формулу формул. Идея в том, что я изучаю бейсбольную статистику и саберметрию. У меня есть ряд вычислений, которые помогают мне найти вероятность победы команды. Последняя формула, которая включает в себя несколько других формул, выглядит т…
18 окт '18 в 04:08
4
ответа
tidyverse: скрещивание таблиц одной переменной со всеми другими переменными в data.frame
Я хочу сделать кросс-таблицу переменной со всеми другими переменными в data.frame. library(tidyverse) library(janitor) humans <- starwars %>% filter(species == "Human") humans %>% janitor::tabyl(gender, eye_color) gender blue blue-gray brow…
26 янв '19 в 09:33
1
ответ
R: dplyr::group_by не удалось на фрейме данных pxR
dplyr::group_by() не удается сгруппировать переменные следующего data.frame, содержащегося в файле оси ПК: library("pacman") pacman::p_load(pxR, dplyr, janitor) px_file <- "https://www.pxweb.bfs.admin.ch/DownloadFile.aspx?file=px-x-1502040100_131…
09 авг '17 в 09:53
0
ответов
R: Как я могу помешать функциям украшения в janitor изменять столбец второстепенных символов?
Ниже приведен пример того, что я испытываю library(tidyverse) library(janitor) x <- data_frame(c1=c('a','a','b','b'), c2=c('a','b','c','d'), c3=runif(4,0,10), c4=runif(4,10,20), c5=runif(4,20,100)) x %>% adorn_totals(c('col')) %>% adorn_per…
05 окт '18 в 16:23
3
ответа
Преобразовать числовой Excel в дату
У меня есть вектор числовых дат Excel, т.е. date <- c(42963,42994,42903,42933,42964) Я ожидаю вывод при использовании excel_to_numeric_date функция от janitor пакет и as.yearmon функция от zoo пакет as.yearmon(excel_numeric_to_date(date)) [1] "Au…
03 ноя '17 в 10:14
1
ответ
Как использовать purrr для программной кошки и / или распечатки вывода janitor tabyl
Скажем, вы используете tidyverse вложить () выбранную группу категориальных переменных: library(tidyverse) library(janitor) nested_df <- mpg %>% select(manufacturer, class) %>% gather(variable, value) %>% group_by(variable) %>% nest()…
09 ноя '18 в 15:51
4
ответа
R: как получить фиктивные переменные только для верхних уровней категориальной переменной?
У меня есть датафрейм следующим образом, library(janitor) library(dplyr) set.seed(100) data <- data_frame(var = sample(c("A", "B", "C"), 20, replace = TRUE)) > data # A tibble: 20 × 1 var <chr> 1 A 2 A 3 B 4 A 5 B 6 B 7 C 8 B 9 B 10 A 11…
15 ноя '16 в 21:57
0
ответов
Лямбда, python boto3, удалить экземпляр старше x дней
Я очень новичок в Python. Однако мне удалось настроить скрипт Python для Lambda для поиска артефактов Packer Builder, оставшихся после запуска Terraform и Packer. Я пытаюсь найти правильную строку кода для моего скрипта, который будет удалять только…
25 сен '18 в 21:03
1
ответ
R: Экспорт вложенного списка фреймов данных
Я создал вложенный список фреймов данных, используя функцию tabyl в janitory и lapply. Поскольку функция tabyl с тремя переменными возвращает список фреймов данных, использование результатов lapply во вложенном списке. В этом случае я смотрю на разл…
30 апр '19 в 08:27
1
ответ
Двусторонняя таблица сопряженности с частотами и процентами
Я получил следующую двухстороннюю таблицу сопряженности с процентами клеток и частотами (в скобках). gender blue blue-gray brown dark hazel yellow female 33.33% (3) 0.00% (0) 55.56% (5) 0.00% (0) 11.11% (1) 0.00% (0) male 34.62% (9) 3.85% (1) 46.15%…
11 май '19 в 15:35
0
ответов
Построить функцию, которая динамически выдает таблицу процентного распределения переменной
Попытка показать, что я хочу, используя радужную оболочку для простоты понимания. Мне понадобятся два категориальных столбца, поэтому я сделаю один, используя ниже: Повторное кодирование iris$Species в species_rec только с двумя категориями и сохран…
09 авг '19 в 06:27
2
ответа
R: Разделить строки по сумме строк с помощью dplyr
Я видел множество постов, в которых подробно описывается, как выполнять аналогичную функцию, но мне еще не удалось найти ту, которая делит все строки на ссылочную строку, исключая при этом саму ссылочную строку. Вот пример набора данных с необходимы…
22 авг '19 в 21:48
1
ответ
Использовать lapply для функции, которая принимает df и column в качестве входных данных - переупорядочивать в процентах
У меня есть фрейм данных об образовании, содержащий около сорока функций, которые я хочу сопоставить с одним столбцом под названием "Репетитор" и получить проценты. Затем я хочу, чтобы строка была упорядочена в порядке убывания от процентного атрибу…
01 сен '19 в 06:37
1
ответ
Печать буквального имени столбца внутри функции R?
Я относительно новичок в R и пытаюсь создать функцию для применения к списку имен переменных, для которых я хотел бы создать частотные таблицы. Но функция, как я написал, печатает имя локальной переменной для функции, а не фактическое имя переменной…
10 май '20 в 22:15
0
ответов
пакет janitor, установленный вручную, выдает странную ошибку
Из-за проблемы с подключением к Интернету на каком-то сервере (Windows) я попытался вручную установить janitor package после передачи заархивированной версии на сервер. Я использовал команду: install.packages("janitor.zip", lib = the folder with all…
05 янв '20 в 14:43
1
ответ
суммировать итоговые числовые столбцы по отношению к категориальным столбцам с помощью dplyr
Я пытаюсь обобщить следующий набор данных.... вот dput structure(list(sentiment_desc = c("positive", "negative", "negative", "negative", "negative", "negative", "negative", "positive", "positive", "negative", "positive", "positive", "negative", "neg…
26 фев '20 в 20:30
3
ответа
хранить дубликаты с помощью make_clean_names в пакете R janitor
Я пытаюсь очистить столбец символов, используяmake_clean_names функционировать в janitorpackage в R. Мне нужно сохранить дубликат в этом случае и не добавлять к нему числовое значение. Это возможно? Мой код такой x <- c(' x y z', 'xyz', 'x123x', …
26 июн '20 в 15:29