R: удалить скрытые символы разрыва строки из текстовых строк внутри фрейма данных
Я обнаружил, что некоторые строки в моем фрейме данных содержат скрытые символы разрыва строки, хотя я не могу точно сказать, какие именно (при загрузке в gVim они просто отображаются как разрывы строк). Следующий код:
gsub ("[\ r \ n]", "", x)
успешно удаляет разрывы строк из строк. Однако он также удаляет разрывы строк, разделяющие ячейки, делая мой фрейм данных атомарным, а не рекурсивным. Как я могу настроить таргетинг только на разрывы строк в строках, сохранив при этом мой фрейм данных?
Вот образец данных:
1 ответ
Копируя комментарии выше, чтобы закрыть вопрос,
dataframe <- data.frame(ID = 1:2, Name = 'XX',
string_column = c('Hi \r\nyou\r\n', 'Always \r\nshare\r\n some \r\nsample\r\n data!'))
dataframe$string_column
#> [1] Hi \r\nyou\r\n
#> [2] Always \r\nshare\r\n some \r\nsample\r\n data!
#> Levels: Always \r\nshare\r\n some \r\nsample\r\n data! Hi \r\nyou\r\n
dataframe$string_column <- sapply(dataframe$string_column,
function(x) { gsub("[\r\n]", "", x) })
dataframe$string_column
#> [1] "Hi you" "Always share some sample data!"