Renamng и удаление конкретных NA в наборе данных в R
Я довольно новичок в этом, и я мог бы использовать некоторую помощь. Мне нравится достигать двух вещей в R. На данный момент у меня есть набор данных, называемый "исследовательские данные".
1. Мне нравится манипулировать данными в одном конкретном столбце.
Допустим, я хочу изменить текст "Нью-Йорк" на "Нью-Йорк" в столбце / переменной "Город". (поэтому не весь набор данных сразу) Я не уверен, что команда отличается, но я также хотел бы сделать это с числом, например, измените "-1" на "NA".
2. Удаление определенного значения в определенном столбце
Как удалить NA или отсутствующие значения или вообще любое значение или строку для определенного столбца. Допустим, я хочу удалить оба значения "NA" и "-1" для столбца / переменной города.
Я пробовал некоторые команды, но я не мог заставить их работать, они были не тем, что я искал. Я надеюсь, что вы, ребята, можете помочь, заранее спасибо.
1 ответ
1. Чтобы манипулировать данными в определенном столбце, посмотрите на dplyr::mutate
:
df <- data.frame(A = 1:5, B = 1:5)
library(dplyr)
df %>% mutate(A=ifelse(A==3,NA,A))
2. Чтобы удалить NA из ваших данных, вы можете сделать:
df1 <- df %>% mutate(A=ifelse(A==3,NA,A))
df1[complete.cases(df1),]
или использовать dplyr::filter
:
df2 <- df
df2 %>% filter(!is.na(A))
Обратите внимание, что эти операции удаляют всю строку, где A==NA
,
(Похоже, вы просто пытаетесь учиться, но чтобы получить лучшую помощь, лучше предоставить небольшой набор данных и конкретную проблему (с ожидаемым результатом).)