Чтение симметричной матрицы из файла, в котором отсутствует верхняя треугольная часть

Question

Чтение симметричной матрицы из файла, в котором отсутствует верхняя треугольная часть

Используя R, это лучший способ прочитать симметричную матрицу из файла, в котором отсутствует верхняя треугольная часть. Например,

1.000
.505  1.000
.569  .422  1.000
.602  .467  .926  1.000
.621  .482  .877  .874  1.000
.603  .450  .878  .894  .937  1.000

я пытался read.table, но не увенчались успехом.

2

r matrix triangular

Источник

user1798104 13 дек '12 в 15:56

5 ответов

Решение

Я скопировал ваш текст, а затем использовал tt <- file('clipboard','rt') импортировать это. Для стандартного файла:

tt <- file("yourfile.txt",'rt')
a <- readLines(tt)
b <- strsplit(a,"  ") #insert delimiter here; can use regex
b <- lapply(b,function(x) {
  x <- as.numeric(x)
  length(x) <- max(unlist(lapply(b,length))); 
  return(x)
})
b <- do.call(rbind,b)
b[is.na(b)] <- 0
#kinda kludgy way to get the symmetric matrix
b <- b + t(b) - diag(b[1,1],nrow=dim(b)[1],ncol=dim(b)[2]

3

Источник

user697568 13 дек '12 в 16:02

Я пишу, но мне больше нравится подход Blue Magister. Но, может быть, в этом есть что-то полезное.

mat <- readLines(n=6)
1.000
.505  1.000
.569  .422  1.000
.602  .467  .926  1.000
.621  .482  .877  .874  1.000
.603  .450  .878  .894  .937  1.000

nmat <- lapply(mat, function(x) unlist(strsplit(x, "\\s+")))
lens <- sapply(nmat, length)
dlen <- max(lens) -lens
bmat <- lapply(seq_along(nmat), function(i) {
    as.numeric(c(nmat[[i]], rep(NA, dlen[i])))
})
mat <- do.call(rbind, bmat)
mat[upper.tri(mat)] <- t(mat)[upper.tri(mat)]
mat

1

Источник

user1000343 13 дек '12 в 16:20

Вот подход, который также работает, если размеры матрицы неизвестны.

# read file as a vector
mat <- scan("file.txt", what = numeric())

# calculate the number of columns (and rows)
ncol <- (sqrt(8 * length(mat) + 1) - 1) / 2

# index of the diagonal values
diag_idx <- cumsum(seq.int(ncol))

# generate split index
split_idx <- cummax(sequence(seq.int(ncol)))
split_idx[diag_idx] <- split_idx[diag_idx] - 1

# split vector into list of rows
splitted_rows <- split(mat, f = split_idx)

# generate matrix
mat_full <- suppressWarnings(do.call(rbind, splitted_rows))
mat_full[upper.tri(mat_full)] <- t(mat_full)[upper.tri(mat_full)]


   [,1]  [,2]  [,3]  [,4]  [,5]  [,6]
0 1.000 0.505 0.569 0.602 0.621 0.603
1 0.505 1.000 0.422 0.467 0.482 0.450
2 0.569 0.422 1.000 0.926 0.877 0.878
3 0.602 0.467 0.926 1.000 0.874 0.894
4 0.621 0.482 0.877 0.874 1.000 0.937
5 0.603 0.450 0.878 0.894 0.937 1.000

1

Источник

user1627235 13 дек '12 в 18:30

Это не сработает в случае OP, потому что диагональ равна 1, но если диагональ равна нулю или отсутствует, вы можете использоватьas.dist%>%as.matrixчтобы скопировать нижнюю диагональ в верхнюю диагональ и установить диагональ равной нулю:

      input=" Pop0    Pop1    Pop2
Pop0
Pop1    0.015
Pop2    0.079   0.083
Pop3    0.014   0.016   0.073"

as.matrix(as.dist(cbind(read.table(text=input,fill=T),NA)))

Результат:

            Pop0  Pop1  Pop2  Pop3
Pop0 0.000 0.015 0.079 0.014
Pop1 0.015 0.000 0.083 0.016
Pop2 0.079 0.083 0.000 0.073
Pop3 0.014 0.016 0.073 0.000

В моем случае ввод имел имена столбцов, поэтомуread.table(fill=T)автоматически смог определить количество столбцов и хитрость IRTFM по указаниюcol.names=1:4был не нужен.

0

Источник

user4669748 25 сен '22 в 21:06

Другие вопросы по тегам r matrix triangular

user1855677 13 дек '12 в 17:22 2012-12-13 17:22 · Accepted Answer · 2012-12-13 17:22

Вот решение для чтения и чтения без таблиц и * без применения:

txt <- "1.000
.505  1.000
.569  .422  1.000
.602  .467  .926  1.000
.621  .482  .877  .874  1.000
.603  .450  .878  .894  .937  1.000"
 # Could use clipboard or read this from a file as well.
mat <- data.matrix( read.table(text=txt, fill=TRUE, col.names=paste("V", 1:6))  )
mat[upper.tri(mat)] <- t(mat)[upper.tri(mat)]
> mat
        V1    V2    V3    V4    V5    V6 
[1,] 1.000 0.505 0.569 0.602 0.621 0.603
[2,] 0.505 1.000 0.422 0.467 0.482 0.450
[3,] 0.569 0.422 1.000 0.926 0.877 0.878
[4,] 0.602 0.467 0.926 1.000 0.874 0.894
[5,] 0.621 0.482 0.877 0.874 1.000 0.937
[6,] 0.603 0.450 0.878 0.894 0.937 1.000