Термин частотной матрицы
У меня есть такая строка:
м<- "abcdabcdbcadacbddabcc..."
Я хотел бы создать такую матрицу:
Как я могу сделать это в r?
2 ответа
Решение
Это дает то, что я считаю, что вы после:
m <- "abcdabcdbcadacbddabcc"
library(qdap)
chars <- unique(unlist(strsplit(m, "")))
terms <- paste2(expand.grid(rep(list(chars), 3)), sep="")
t(counts(termco(m, match.list=sort(terms)))[, -c(1:2)])
Выход:
1
aaa 0
aab 0
aac 0
aad 0
aba 0
.
.
.
dcc 0
dcd 0
dda 1
ddb 0
ddc 0
ddd 0
Функция gregexpr
дает вам положение каждого совпадения шаблона.
Вы можете сделать это:
a <- c("a","b","c")
b <- matrix(outer(a,a,paste,sep=""),ncol=1)
patterns <- matrix(outer(a,b,paste,sep=""),ncol=1)
m<-"abcdabcdbcadacbddabcc..."
positions <- function(pattern, text)
gregexpr(pattern, text)[[1]][1]
sapply(patterns, positions, text=m)