Как убрать пунктуацию внутри скобок в R
Я пытался разбить документы на предложения, но есть некоторые странные результаты из-за пунктуации в скобках. Так что я хотел бы удалить любую пунктуацию.
Пример ввода:
A <- c('How to remove all punctuations(like this?) in side it?')
хотел вывод:
"How to remove all punctuations(like this) in side it?"
1 ответ
Решение
Возможно, что-то подобное, используя позитивный взгляд?
gsub("[?!;,.](?=\\))", "", A, perl = T)
#[1] "How to remove all punctuations(like this) in side it?"
Или используя классы символов POSIX
gsub("[[:punct:]](?=\\))", "", A, perl = T)
Или если вам нужно сопоставить другие типы закрывающих скобок (например, фигурные, квадратные)
gsub("[[:punct:]](?=[)\\]}])", "", A, perl = T)