Выберите конкретные объекты / строки из карты тепла в R
У меня смешанный тип данных, который содержит числовые и категориальные атрибуты, к которым я планирую применить кластерные алгоритмы.
В качестве первого шага я создал матрицу расстояний, используя функцию daisy() и меру расстояния Гауэра. Я отобразил матрицу расстояний, используя тепловую карту и функцию графика уровня в R.
Кажется, что между некоторыми объектами в моих данных есть сильное сходство, и я хочу проверить некоторые из похожих / разнородных объектов, чтобы убедиться, что мера хорошо работает с моими данными.
Как выбрать похожие / разнородные объекты из тепловой карты и связать их с исходным набором данных, чтобы можно было их оценить?
Вот как я строю свою тепловую карту, используя R. IDX - моя матрица расстояний.
new.palette=colorRampPalette(c("black","yellow","#007FFF","white"),space="rgb")
levelplot(IDX_as[1:ncol(IDX_as),ncol(IDX_as):1],col.regions=new.palette(20))
quartz(width=7,height=6) #make a new quartz window of a given size
par(mar=c(2,3,2,1)) #set the margins of the figures to be smaller than default
layout(matrix(c(1,2),1,2,byrow=TRUE),widths=c(7,1)) #set the layout of the quartz window. This will create two plotting regions, with width ratio of 7 to 1
image(IDX_as[1:ncol(IDX_as),ncol(IDX_as):1],col=new.palette(20),xaxt="n",yaxt="n") #plot a heat map matrix with no tick marks or axis labels
axis(1,at=seq(0,1,length=20),labels=rep("",20)) #draw in tick marks
axis(2,at=seq(0,1,length=20),labels=rep("",20))
#adding a color legend
s=seq(min(IDX_as),max(IDX_as),length=20) #20 values between minimum and maximum values of m
l=matrix(s,ncol=length(s),byrow=TRUE) #coerce it into a horizontal matrix
image(y=s,z=l,col=new.palette(20),ylim=c(min(IDX),max(IDX)),xaxt="n",las=1) #plot a one-column heat map
heatmap(IDX_as,symm=TRUE,col=new.palette(20))