Как заменить несколько слов в столбце фрейма данных одним словом?
Я пытаюсь очистить базу данных, где факторы были вменены разными словами, но означающими одни и те же вещи.
Пример: от "Мурлыкающий кот с хвостом, 4 ногами и мехом" или "Европейский полосатый кот" или "Кошка кошка кошка" до "Кошка".
Я смотрел в gsub
тип команд и stringr
команды, но не смог достичь своей цели.
Любое предложение?
РЕДАКТИРОВАТЬ: Извините за непонятность, это мой первый пост.
Я хотел бы заменить несколько слов только одним. Если в записи появляется "кошка", я хочу, чтобы вся запись была переименована в "кошка". До сих пор мне удавалось только заменить некоторую часть записи чем-то другим, но не удалить лишние слова.
1 ответ
Решение
Попробуй это
x <- c("Purring cat with tail, 4 legs and fur", "European tabby cat",
"dog", "Cat CAT cat", "bird")
replace(x, grepl("(?i)cat", x, perl=TRUE), "Cat")
# [1] "Cat" "Cat" "dog" "Cat" "bird"