R: удалить скрытые символы разрыва строки из текстовых строк внутри фрейма данных

Я обнаружил, что некоторые строки в моем фрейме данных содержат скрытые символы разрыва строки, хотя я не могу точно сказать, какие именно (при загрузке в gVim они просто отображаются как разрывы строк). Следующий код:

gsub ("[\ r \ n]", "", x)

успешно удаляет разрывы строк из строк. Однако он также удаляет разрывы строк, разделяющие ячейки, делая мой фрейм данных атомарным, а не рекурсивным. Как я могу настроить таргетинг только на разрывы строк в строках, сохранив при этом мой фрейм данных?

Вот образец данных:

образец кадра данных

1 ответ

Копируя комментарии выше, чтобы закрыть вопрос,

dataframe <- data.frame(ID = 1:2, Name = 'XX',
  string_column = c('Hi \r\nyou\r\n', 'Always \r\nshare\r\n some \r\nsample\r\n data!'))
  dataframe$string_column  
#> [1] Hi \r\nyou\r\n                                
#> [2] Always \r\nshare\r\n some \r\nsample\r\n data!
#> Levels: Always \r\nshare\r\n some \r\nsample\r\n data! Hi \r\nyou\r\n

dataframe$string_column <- sapply(dataframe$string_column,
                                    function(x) { gsub("[\r\n]", "", x) })
dataframe$string_column
#> [1] "Hi you"                         "Always share some sample data!"
Другие вопросы по тегам