Горизонтальная дендрограмма в R с метками
Я пытаюсь нарисовать дендрограмму из hclust
функция вывода. Я надеюсь, что дендрограмма расположена горизонтально вместо значения по умолчанию, которое можно получить (например)
require(graphics)
hc <- hclust(dist(USArrests), "ave")
plot(hc)
Я пытался использовать as.dendrogram()
функционировать как plot(as.dendrogram(hc.poi),horiz=TRUE)
но результат без значимых меток:
Если я использую plot(hc.poi,labels=c(...))
который без as.dendrogram()
Я могу передать labels=
аргумент, но теперь дендрограмма вертикальная, а не горизонтальная. Есть ли способ одновременно расположить дендрограмму по горизонтали и назначить пользовательские метки? Спасибо!
Обновление: в качестве примера из набора данных USArrests, предположим, что я хочу использовать сокращения двух первых букв названий состояний в качестве меток, так что я хочу как-то передать labs
в функцию построения графика:
labs = substr(rownames(USArrests),1,2)
который дает
[1] "Al" "Al" "Ar" "Ar" "Ca" "Co" "Co" "De" "Fl" "Ge" "Ha"
[12] "Id" "Il" "In" "Io" "Ka" "Ke" "Lo" "Ma" "Ma" "Ma" "Mi"
[23] "Mi" "Mi" "Mi" "Mo" "Ne" "Ne" "Ne" "Ne" "Ne" "Ne" "No"
[34] "No" "Oh" "Ok" "Or" "Pe" "Rh" "So" "So" "Te" "Te" "Ut"
[45] "Ve" "Vi" "Wa" "We" "Wi" "Wy"
2 ответа
Чтобы отобразить определенные вами метки в горизонтальной дендрограмме, одним из решений является установка имен строк фрейма данных для новых меток (все метки должны быть уникальными).
require(graphics)
labs = paste("sta_",1:50,sep="") #new labels
USArrests2<-USArrests #new data frame (just to keep original unchanged)
rownames(USArrests2)<-labs #set new row names
hc <- hclust(dist(USArrests2), "ave")
par(mar=c(3,1,1,5))
plot(as.dendrogram(hc),horiz=T)
РЕДАКТИРОВАТЬ - решение с использованием ggplot2
labs = paste("sta_",1:50,sep="") #new labels
rownames(USArrests)<-labs #set new row names
hc <- hclust(dist(USArrests), "ave")
library(ggplot2)
library(ggdendro)
#convert cluster object to use with ggplot
dendr <- dendro_data(hc, type="rectangle")
#your own labels (now rownames) are supplied in geom_text() and label=label
ggplot() +
geom_segment(data=segment(dendr), aes(x=x, y=y, xend=xend, yend=yend)) +
geom_text(data=label(dendr), aes(x=x, y=y, label=label, hjust=0), size=3) +
coord_flip() + scale_y_reverse(expand=c(0.2, 0)) +
theme(axis.line.y=element_blank(),
axis.ticks.y=element_blank(),
axis.text.y=element_blank(),
axis.title.y=element_blank(),
panel.background=element_rect(fill="white"),
panel.grid=element_blank())
С помощью dendrapply
Вы можете настроить свой дендро, как вам нравится.
colLab <- function(n) {
if(is.leaf(n)) {
a <- attributes(n)
attr(n, "label") <- substr(a$label,1,2) # change the node label
attr(n, "nodePar") <- c(a$nodePar, lab.col = 'red') # change the node color
}
n
}
require(graphics)
hc <- hclust(dist(USArrests), "ave")
clusDendro <- as.dendrogram(hc)
clusDendro <- dendrapply(clusDendro, colLab)
op <- par(mar = par("mar") + c(0,0,0,2))
plot(clusDendro,horiz=T)