Как создать функцию тепловой карты, заполненную корреляцией между двумя переменными из набора данных?

Я пытаюсь создать функцию, которая вычисляет коэффициент корреляции между 2 столбцами данных из имеющегося у меня набора данных и повторяет это для каждой комбинации столбцов.

Тогда я хочу построить все коэффициенты в тепловой карте.

Это схема набора данных и того, что я хочу включить в тепловую карту.

Как бы я отредактировал свою функцию так, чтобы она циклически проходила по набору данных и могла рассчитать коэффициент корреляции между всеми столбцами и отобразить значение в тепловой карте? Сначала я пытаюсь создать пустой фрейм данных со всеми нулями, а затем хочу, чтобы он заполнил все значения.

master <- read.table("~/Desktop/Heatmap Project/master.txt", sep = "\t", header = T, stringsAsFactors = F)

vector_a <- master$Median_A
vector_b <- master$Median_B

heatmap_prep <- function(vector_a,vector_b){
    dummy <- as.data.frame(matrix(0, ncol=length(vector_b), nrow=length(vector_a))
    for (i in 1:length(vector_a)){
        first_number <- vector_a[i]
        for(j in 1:length(vector_b)){
            second_number <- vector_b[j]
            result <- cor(vector_a,vector_b)
            dummy [i,j] <- result

        }
    }
    return(dummy)
}

heatmap_data_matrix <- as.matrix(heatmap_prep(vector_a,vector_b))

#Create heatmap:
library(stats)
library(gplots)
library(RColorBrewer)
heatmap(heatmap_data_matrix,Colv = NA, Rowv=NA, revC=T, scale='none', xlab= "B", ylab= "A", main = "Heatmap", col = rev(brewer.pal(11,"RdBu")))

Спасибо вам большое!

1 ответ

Решение

Следующий код должен предоставить минимальный рабочий пример из того, что вы предоставили.

df <- data.frame("A" = c(12,13,15),
                 "B" = c(15,34,15),
                 "C" = c(16,34,56),
                 "D" = c(455,55,45),
                 "E" = c(78,67,65),
                 "F" = c(67,67,56),
                 "G" = c(67,45,64),
                 "H" = c(56,54,56),
                 "I" = c(56,89,90))

library(reshape2)
melted_cor <- melt(cor(df))
library(ggplot2)
ggplot(data = melted_cor, aes(x=X1, y=X2, fill=value)) + 
  geom_tile()

кафельный участок

Здесь объясняется более подробно: http://www.sthda.com/english/wiki/ggplot2-quick-correlation-matrix-heatmap-r-software-and-data-visualization

Другие вопросы по тегам