Хранение строк с числом меньше, чем реальное число в R
У меня большие наборы данных, и переменная включает в себя другой формат, такой как 2, 3, >2, <4, "Я иду <> в школу". "Мне нужно <быть там".
Как я могу сделать подмножество наборов данных, которое просто включает строки, такие как < 2 или> 10 (меньше или больше, чем число)?
Subject Result
1 3
2 4
3 <4
4 <3
5 I need to go to school<>
6 I need to <> be there
7 2.3 need to be< there
1 ответ
Решение
df[grep("^\\s*[<>][0-9]+$", df$variable),]
Это даст подмножество df
со всеми строками, где данные в столбце variable
в формате числа, которому предшествует <или>, и после него только цифры.
я добавил \\s*
потому что из ваших данных видно, что в некоторых случаях перед числом стоят пробельные поля, поэтому все такие пробелы будут удалены.