Описание тега stringr
An R package for string manipulation.
1
ответ
str_extract: сопоставлять слова рядом друг с другом
Я хотел бы извлечь строку соответствия dog|cat (0-5 слов, \r, \n или пробелы между ними) 1. и еще немного текста, пока 2.появляется. myStrings <- c( "the dog says: 1. hello cat 2. I do not care", "the dog barks ba ba ba ba ba ba ba and says: 1. n…
28 окт '18 в 15:26
1
ответ
Заменить значения символьного столбца, используя другой столбец, с определением шаблона
У меня есть фрейм данных pedigrees образцов, разбитых на семьи: pedigrees %>% filter(Family %in% sample(pedigrees$Family, 5) Family_ID Sample_ID fatherID motherID sex status <chr> <chr> <chr> <chr> <int> <int> …
01 май '18 в 20:29
1
ответ
Как скопировать точное совпадение из данных B в данные A в r
Допустим, у меня есть два кадра данных A и B. products price apple 3.0 orange 2.5 avocado 4.0 banana 2.5 blueberry 1.5 В products Color price banana Yellow NA Apple Red NA Avocado Green NA Apricot Yellow NA Мой вопрос заключается в том, какой самый …
14 дек '17 в 03:21
2
ответа
Как я могу вернуть уникальное количество цифр в символьной строке в R?
У меня есть вектор строк с 24 цифрами в каждой. Каждая цифра представляет час, и если цифра равна "0", то применяется ставка с периода 0, а если цифра равна 1, то применяется ставка с периода 1. В качестве примера рассмотрим две строки ниже. Я хотел…
25 окт '17 в 22:29
3
ответа
Разделить столбец на две части
Мой DF выглядит так: Time Week End 07-01-10 Week End 07-02-10 Я хочу это как Column Time Week End 07-01-10 Week End 07-02-10 Я гуглил посылку stringr было бы полезно, но я не могу использовать его правильно, так как есть два пробела.
19 июл '16 в 14:58
1
ответ
Использование слова stringr () для повторения и группировки предложения
Вот веселый Я пытаюсь сделать именно то, что делает этот пост. То есть повторение и группировка слов. Уловка с этим вопросом заключается в том, что я хотел бы сделать это чисто с stringr"s word() функция с paste0 обертка. Возьмите следующее sentence…
23 авг '14 в 22:59
1
ответ
Как разделить строку в r разделителем и отбросить два последних элемента?
У меня есть строка, разделенная _ и я хочу избавиться от последних двух элементов. Например, из A_B_C_D я хочу вернуться A_B, и из A_B_C_D_E я хочу A_B_C, я пытался str_split_fixed от stringr: my_string <- "A_B_C_D" x <- str_split_fixed(my_str…
01 фев '13 в 15:08
1
ответ
Преобразовать HTML-сущность в правильный символ R
Кто-нибудь знает обобщенную функцию в r, которая может конвертировать &#228; в его юникодном характере â? Я видел некоторые функции, которые принимают âи преобразовать его в нормальный символ. Любая помощь будет оценена. Благодарю. Редактировать…
10 мар '17 в 17:59
2
ответа
Диапазон strptime и сделать столбец даты
У меня есть даты в следующей форме Date Value <chr> <dbl> [2014-1-24 - 2014-2-2] 1.1 [2014-2-3 - 2014-3-2] 2.2 . . . . . . Это продолжается в течение многих лет. Я хотел бы преобразовать это в длинный формат следующим образом Date Value …
09 ноя '17 в 18:46
1
ответ
Изменение шаблона, который встречается несколько раз в строке в R
У меня есть датафрейм с одним столбцом, где каждая строка представляет часть оператора выбора SQL, например, ниже: test <- bind_rows( data.frame(text = "spend_1 + spend_2", stringsAsFactors = FALSE), data.frame(text = "spend_1 + spend_2 + spend_3…
31 мар '16 в 18:56
1
ответ
Извлечь все до третьего периода в строке
У меня есть это Identifier колонка structure(list(Identifier = c("NC.1.OA", "NC.1.OA.0", "NC.1.OA.1", "NC.1.OA.1.a", "NC.1.OA.1.b", "NC.1.OA.1.c", "NC.1.OA.2", "NC.1.OA.2.0", "NC.1.OA.3", "NC.1.OA.4", "NC.1.OA.4.0", "NC.1.OA.9", "NC.1.OA.6", "NC.1.O…
14 ноя '18 в 17:54
2
ответа
Заменить несколько значений с помощью справочной таблицы
Я очищаю базу данных, одно из полей - "страна", однако названия стран в моей базе данных не соответствуют выводу, который мне нужен. Я хотя и использовал функцию str_replace, но у меня более 50 стран, которые нужно исправить, так что это не самый эф…
28 дек '17 в 06:15
2
ответа
Удалите последовательности точек с запятой разной длины с помощью Regex
Учитывая некоторые данные: test <- data.frame(strings = c('a;b;c;;;;;;;', 'd;e;f;g;h;i;j;k;l;m', 'n;o;p;q;r;;;;;', ';;;;;;;;;' )) Как мне удалить все конечные точки с запятой, чтобы получить: test <- data.frame(strings = c('a;b;c', 'd;e;f;g;h;…
06 ноя '17 в 01:53
1
ответ
Как заменить несколько слов в столбце фрейма данных одним словом?
Я пытаюсь очистить базу данных, где факторы были вменены разными словами, но означающими одни и те же вещи. Пример: от "Мурлыкающий кот с хвостом, 4 ногами и мехом" или "Европейский полосатый кот" или "Кошка кошка кошка" до "Кошка". Я смотрел в gsub…
18 янв '15 в 22:16
1
ответ
str_remove до конца многострочной строки
Как stringr можно удалить до конца многострочного документа? require(stringr) x = 'The quick brown fox jumps over the lazy dog' str_remove(x, regex('jumps.*', multiline = TRUE)) %>% cat #> The quick brown #> fox #> the lazy dog
03 дек '18 в 10:05
2
ответа
Возвращение маркеров Twitter для каждой строки данных
Учитывая следующие данные кадра: df <- as.data.frame(c("Testing @cspenn @test @hi","this is a tweet","this is a tweet with @mention of @twitter")) names(df)[1] <- "content" Я пытаюсь извлечь отдельные твиттерные дескрипторы для каждой строки, …
25 фев '19 в 18:33
1
ответ
Применить первый ряд текста, чтобы установить docvars
Я пытаюсь добавить документ, используя первую строку текста в файле. docvars(myCorpus, "Dept.") <- stri_sub(gnbtxts, 1, 8) возвращает первые 8 символов файла, но я не могу определить, как вернуть все содержимое первой строки, которое будет примен…
04 мар '18 в 13:05
1
ответ
R: извлечение биграмм с головами нулевой ширины
Я хочу извлечь биграммы из предложений, используя описанное здесь регулярное выражение, и сохранить результаты в новом столбце, который ссылается на оригинал. library(dplyr) library(stringr) library(splitstackshape) df <- data.frame(a =c("apple o…
22 янв '19 в 18:35
2
ответа
Извлекать только те символы, которые находятся между начальным и конечным параграфами в начале и конце строки в R
У меня есть много строк, которые имеют следующий формат: mystrings <- c( "(ABFUHIASH)THISISAVERYLONGSTRINGWITHOUTANYSPACES(ENDING)", "(SECONDSTR)YETANOTHERBORINGSTRINGWITHOUTSPACES(RANDOMENDING)", "(JOWERIC)THISPARTSHOULDNOTBEEXTRACTED(GETTHIS)",…
31 янв '18 в 19:15
2
ответа
Группы захвата регулярных выражений
Я пытаюсь извлечь широты, долготы и метку из строки в R (v3.4.1). Я думал, что регулярное выражение - это путь, и, поскольку у пакета stringr есть возможность извлекать группы захвата, я подумал, что это пакет для использования. Проблема в том, что …
29 сен '17 в 11:50