Описание тега stringr

An R package for string manipulation.
1 ответ

str_extract: сопоставлять слова рядом друг с другом

Я хотел бы извлечь строку соответствия dog|cat (0-5 слов, \r, \n или пробелы между ними) 1. и еще немного текста, пока 2.появляется. myStrings <- c( "the dog says: 1. hello cat 2. I do not care", "the dog barks ba ba ba ba ba ba ba and says: 1. n…
28 окт '18 в 15:26
1 ответ

Заменить значения символьного столбца, используя другой столбец, с определением шаблона

У меня есть фрейм данных pedigrees образцов, разбитых на семьи: pedigrees %>% filter(Family %in% sample(pedigrees$Family, 5) Family_ID Sample_ID fatherID motherID sex status <chr> <chr> <chr> <chr> <int> <int> …
01 май '18 в 20:29
1 ответ

Как скопировать точное совпадение из данных B в данные A в r

Допустим, у меня есть два кадра данных A и B. products price apple 3.0 orange 2.5 avocado 4.0 banana 2.5 blueberry 1.5 В products Color price banana Yellow NA Apple Red NA Avocado Green NA Apricot Yellow NA Мой вопрос заключается в том, какой самый …
14 дек '17 в 03:21
2 ответа

Как я могу вернуть уникальное количество цифр в символьной строке в R?

У меня есть вектор строк с 24 цифрами в каждой. Каждая цифра представляет час, и если цифра равна "0", то применяется ставка с периода 0, а если цифра равна 1, то применяется ставка с периода 1. В качестве примера рассмотрим две строки ниже. Я хотел…
25 окт '17 в 22:29
3 ответа

Разделить столбец на две части

Мой DF выглядит так: Time Week End 07-01-10 Week End 07-02-10 Я хочу это как Column Time Week End 07-01-10 Week End 07-02-10 Я гуглил посылку stringr было бы полезно, но я не могу использовать его правильно, так как есть два пробела.
19 июл '16 в 14:58
1 ответ

Использование слова stringr () для повторения и группировки предложения

Вот веселый Я пытаюсь сделать именно то, что делает этот пост. То есть повторение и группировка слов. Уловка с этим вопросом заключается в том, что я хотел бы сделать это чисто с stringr"s word() функция с paste0 обертка. Возьмите следующее sentence…
23 авг '14 в 22:59
1 ответ

Как разделить строку в r разделителем и отбросить два последних элемента?

У меня есть строка, разделенная _ и я хочу избавиться от последних двух элементов. Например, из A_B_C_D я хочу вернуться A_B, и из A_B_C_D_E я хочу A_B_C, я пытался str_split_fixed от stringr: my_string <- "A_B_C_D" x <- str_split_fixed(my_str…
01 фев '13 в 15:08
1 ответ

Преобразовать HTML-сущность в правильный символ R

Кто-нибудь знает обобщенную функцию в r, которая может конвертировать ä в его юникодном характере â? Я видел некоторые функции, которые принимают âи преобразовать его в нормальный символ. Любая помощь будет оценена. Благодарю. Редактировать…
10 мар '17 в 17:59
2 ответа

Диапазон strptime и сделать столбец даты

У меня есть даты в следующей форме Date Value <chr> <dbl> [2014-1-24 - 2014-2-2] 1.1 [2014-2-3 - 2014-3-2] 2.2 . . . . . . Это продолжается в течение многих лет. Я хотел бы преобразовать это в длинный формат следующим образом Date Value …
09 ноя '17 в 18:46
1 ответ

Изменение шаблона, который встречается несколько раз в строке в R

У меня есть датафрейм с одним столбцом, где каждая строка представляет часть оператора выбора SQL, например, ниже: test <- bind_rows( data.frame(text = "spend_1 + spend_2", stringsAsFactors = FALSE), data.frame(text = "spend_1 + spend_2 + spend_3…
31 мар '16 в 18:56
1 ответ

Извлечь все до третьего периода в строке

У меня есть это Identifier колонка structure(list(Identifier = c("NC.1.OA", "NC.1.OA.0", "NC.1.OA.1", "NC.1.OA.1.a", "NC.1.OA.1.b", "NC.1.OA.1.c", "NC.1.OA.2", "NC.1.OA.2.0", "NC.1.OA.3", "NC.1.OA.4", "NC.1.OA.4.0", "NC.1.OA.9", "NC.1.OA.6", "NC.1.O…
14 ноя '18 в 17:54
2 ответа

Заменить несколько значений с помощью справочной таблицы

Я очищаю базу данных, одно из полей - "страна", однако названия стран в моей базе данных не соответствуют выводу, который мне нужен. Я хотя и использовал функцию str_replace, но у меня более 50 стран, которые нужно исправить, так что это не самый эф…
28 дек '17 в 06:15
2 ответа

Удалите последовательности точек с запятой разной длины с помощью Regex

Учитывая некоторые данные: test <- data.frame(strings = c('a;b;c;;;;;;;', 'd;e;f;g;h;i;j;k;l;m', 'n;o;p;q;r;;;;;', ';;;;;;;;;' )) Как мне удалить все конечные точки с запятой, чтобы получить: test <- data.frame(strings = c('a;b;c', 'd;e;f;g;h;…
06 ноя '17 в 01:53
1 ответ

Как заменить несколько слов в столбце фрейма данных одним словом?

Я пытаюсь очистить базу данных, где факторы были вменены разными словами, но означающими одни и те же вещи. Пример: от "Мурлыкающий кот с хвостом, 4 ногами и мехом" или "Европейский полосатый кот" или "Кошка кошка кошка" до "Кошка". Я смотрел в gsub…
18 янв '15 в 22:16
1 ответ

str_remove до конца многострочной строки

Как stringr можно удалить до конца многострочного документа? require(stringr) x = 'The quick brown fox jumps over the lazy dog' str_remove(x, regex('jumps.*', multiline = TRUE)) %>% cat #> The quick brown #> fox #> the lazy dog
03 дек '18 в 10:05
2 ответа

Возвращение маркеров Twitter для каждой строки данных

Учитывая следующие данные кадра: df <- as.data.frame(c("Testing @cspenn @test @hi","this is a tweet","this is a tweet with @mention of @twitter")) names(df)[1] <- "content" Я пытаюсь извлечь отдельные твиттерные дескрипторы для каждой строки, …
25 фев '19 в 18:33
1 ответ

Применить первый ряд текста, чтобы установить docvars

Я пытаюсь добавить документ, используя первую строку текста в файле. docvars(myCorpus, "Dept.") <- stri_sub(gnbtxts, 1, 8) возвращает первые 8 символов файла, но я не могу определить, как вернуть все содержимое первой строки, которое будет примен…
04 мар '18 в 13:05
1 ответ

R: извлечение биграмм с головами нулевой ширины

Я хочу извлечь биграммы из предложений, используя описанное здесь регулярное выражение, и сохранить результаты в новом столбце, который ссылается на оригинал. library(dplyr) library(stringr) library(splitstackshape) df <- data.frame(a =c("apple o…
22 янв '19 в 18:35
2 ответа

Извлекать только те символы, которые находятся между начальным и конечным параграфами в начале и конце строки в R

У меня есть много строк, которые имеют следующий формат: mystrings <- c( "(ABFUHIASH)THISISAVERYLONGSTRINGWITHOUTANYSPACES(ENDING)", "(SECONDSTR)YETANOTHERBORINGSTRINGWITHOUTSPACES(RANDOMENDING)", "(JOWERIC)THISPARTSHOULDNOTBEEXTRACTED(GETTHIS)",…
31 янв '18 в 19:15
2 ответа

Группы захвата регулярных выражений

Я пытаюсь извлечь широты, долготы и метку из строки в R (v3.4.1). Я думал, что регулярное выражение - это путь, и, поскольку у пакета stringr есть возможность извлекать группы захвата, я подумал, что это пакет для использования. Проблема в том, что …
29 сен '17 в 11:50