Проверить, находится ли конкретный предмет в других столбцах и дублирует ли он в каждом столбце в r
Вот данные: Пример 1: завершено
complete <- c("A", "B", "C","J", "C1", "L", "J2", "D", "M", "N")
lst1 <- c(NA, NA, NA, "A", "N", NA,"A", "C", "D", NA )
lst2 <- c(NA, NA, NA,"A", "L", NA, "C1", "J2", "J2", "B")
datf <- data.frame (complete, lst1, lst2, stringsAsFactors = FALSE)
Пример 2: неполный и дублированный
complete <- c("A", "B", "C","J", "C1", "L", "C", "D", "M", "N")
lst1 <- c(NA, NA, NA, "A", "N", NA,"A", "C", "D1", NA )
lst2 <- c(NA, NA, NA,"A", "L", NA, "C1", "J2", "J2", "B2")
datf2 <- data.frame (complete, lst1, lst2, stringsAsFactors = FALSE)
Я хочу проверить: (1) члены lst1 и lst2, по крайней мере, один раз представлены по крайней мере один раз. Если нет, то сообщение о остановке скажет, что это "?" присутствует в lst1 или lst2 (как правильно), но не в полном объеме. Моё испытание: например 1
if (datf$lst1 %in% datf$complete | datf$lst2 %in% datf$complete) {
stop ("the subject in lst1 or lst2 must be complete list ")} else {
cat("I am fine")
}
I am fineWarning message:
In if (datf$lst1 %in% datf$complete | datf$lst2 %in% datf$complete) { :
the condition has length > 1 and only the first element will be used
Почему это сообщение об ошибке и как я могу подавить его?
Example 2:
if (datf2$lst1 %in% datf2$complete | datf2$lst2 %in% datf2$complete) {
stop ("the subject in lst1 or lst2 must be complete list ")} else {
cat("I am fine")
}
Although there is potential errors the error message is same:
I am fineWarning message:
In if (datf2$lst1 %in% datf2$complete | datf2$lst2 %in% datf2$complete) { :
the condition has length > 1 and only the first element will be used
Также есть способ предоставить имена, которые не совпадают как часть сообщения об ошибке.
(2) Если кто-либо из участников завершен.
Редактировать:
Expected answer:
Example1 <- all members of lst1 and lst2 are also member of complete
expacted message here is "I am fine"
Example2 <-
B2, J2, is member of lst2 but not complete, D1 is member of lst1 but not complete.
complete have two C, so C is duplicated.
The function will stop and print a message
"B2 and J2 are member of lst1, but not in complete
D1 is member of lst2, but not in complete,
check completeness"
"C is duplicated in complete"
1 ответ
Решение
> datf$lst1 %in% datf$complete | datf$lst2 %in% datf$complete
[1] FALSE FALSE FALSE TRUE TRUE FALSE TRUE TRUE TRUE TRUE
от ?'if'
аргументом для является логический вектор длины один, который не является NA.
> na.omit(datf2$lst1)[!na.omit(datf2$lst1)%in%datf2$complete]
[1] "D1"
> na.omit(datf2$lst2)[!na.omit(datf2$lst2)%in%datf2$complete]
[1] "J2" "J2" "B2"
> datf2$complete[duplicated(datf2$complete)]
[1] "C"
Вышесказанное должно помочь вам составить функцию для выполнения того, что вы предлагаете.