Программирование R - сопоставление с образцом (только точное слово)
Я только начал изучать программирование на R.
Просьба прояснить вопрос ниже.
У меня есть файл (XLS), который содержит 1 столбец (with some keywords, i.e. data, data1, test, test1)
У меня есть другой файл (XLS), который содержит 2 столбца
(Column 1 : ID1, ID2, ID3, ID4
Column 2 : data, data_analyst, test, test_analyst)
Теперь, как мне использовать сопоставление с шаблоном, чтобы получить выходные данные для всех идентификаторов, которые имеют соответствующий шаблон, и отобразить имя шаблона
например. мой вывод должен быть следующим:
ID1 : pattern matching (data)
ID2 : pattern not matching
ID3 : pattern matching (test)
ID4 : pattern not matching
Ценю ваш ответ, так как я очень запутался
1 ответ
Первым шагом является импорт файлов XLS в R. Это импортирует их как фреймы данных, но может не иметь ожидаемых имен столбцов. Таким образом, вы должны также установить имена на то, что вы узнаете.
file1 = read.xls("file1", header=TRUE)
file2 = read.xls("file2", header=TRUE)
names(file1) = c("DATA")
names(file2) = c("ID","DATA")
Затем вы сделаете слияние на основе данных.
matched = merge(file1, file2, by="DATA")
На данный момент "соответствует" включает в себя все соответствующие строки. Таким образом, вам нужно использовать функцию соответствия, чтобы найти, какие из 'совпадающих' совпадают с теми, что в 'file1'.
a = match(file2$ID,matched$ID)
final = file2
names(final) = c("ID","MATCH")
final[which(is.na(a))],"DATA"] = "pattern does not match"
final[-which(is.na(a))],"DATA"] = "pattern matches"