Renamng и удаление конкретных NA в наборе данных в R

Я довольно новичок в этом, и я мог бы использовать некоторую помощь. Мне нравится достигать двух вещей в R. На данный момент у меня есть набор данных, называемый "исследовательские данные".

1. Мне нравится манипулировать данными в одном конкретном столбце.

Допустим, я хочу изменить текст "Нью-Йорк" на "Нью-Йорк" в столбце / переменной "Город". (поэтому не весь набор данных сразу) Я не уверен, что команда отличается, но я также хотел бы сделать это с числом, например, измените "-1" на "NA".

2. Удаление определенного значения в определенном столбце

Как удалить NA или отсутствующие значения или вообще любое значение или строку для определенного столбца. Допустим, я хочу удалить оба значения "NA" и "-1" для столбца / переменной города.

Я пробовал некоторые команды, но я не мог заставить их работать, они были не тем, что я искал. Я надеюсь, что вы, ребята, можете помочь, заранее спасибо.

1 ответ

1. Чтобы манипулировать данными в определенном столбце, посмотрите на dplyr::mutate:

df <- data.frame(A = 1:5, B = 1:5)
library(dplyr)
df %>% mutate(A=ifelse(A==3,NA,A))

2. Чтобы удалить NA из ваших данных, вы можете сделать:

df1 <- df %>% mutate(A=ifelse(A==3,NA,A))
df1[complete.cases(df1),]

или использовать dplyr::filter:

df2 <- df
df2 %>% filter(!is.na(A))

Обратите внимание, что эти операции удаляют всю строку, где A==NA,

(Похоже, вы просто пытаетесь учиться, но чтобы получить лучшую помощь, лучше предоставить небольшой набор данных и конкретную проблему (с ожидаемым результатом).)

Другие вопросы по тегам