Как рассчитать объем пересечения эллипсов в г
Мне было интересно, как рассчитать пересечение между двумя эллипсами, например, объем пересечения между версиколором и виргинской, как показано на этом графике: который построен с использованием следующего mwe на основе этого урока:
data(iris)
log.ir <- log(iris[, 1:4])
ir.species <- iris[, 5]
ir.pca <- prcomp(log.ir, center = TRUE, scale. = TRUE)
library(ggbiplot)
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1,
groups = ir.species, ellipse = TRUE,
circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal',
legend.position = 'top')
print(g)
Я получаю ковариации и центры для эллипсов следующим образом:
setosa.cov <- cov(ir.pca$x[ir.species=="setosa",])
versicolor.cov <- cov(ir.pca$x[ir.species=="versicolor",])
virginica.cov <- cov(ir.pca$x[ir.species=="virginica",])
setosa.centre <- colMeans(ir.pca$x[ir.species=="setosa",])
versicolor.centre <- colMeans(ir.pca$x[ir.species=="versicolor",])
virginica.centre <- colMeans(ir.pca$x[ir.species=="virginica",])
Но тогда я нахожусь в конце моего остроумия:-|
Изменить: Следуя указаниям @carl-witthoft ниже, вот пример использования siar:: overlap:
library(siar)
setosa <- ir.pca$x[ir.species=="setosa",]
versicolor <- ir.pca$x[ir.species=="versicolor",]
virginica <- ir.pca$x[ir.species=="virginica",]
overlap.fun <- function(data.1, data.2){
dimensions <- ncol(data.1)
for(i in 1:(dimensions-1)){
overlap.out <- overlap(data.1[,i], data.1[,i+1], data.2[,i], data.2[,i+1], steps = 5)
out$overlap[i] <- overlap.out$overlap
out$area1[i] <- overlap.out$area1
out$area2[i] <- overlap.out$area2
}
return(out)
}
overlap.fun(versicolor, virginica)
возвращает:
$overlap
[1] 0.01587977 0.48477088 0.08375927
$area1
[1]1.020596 1.04614461 0.08758691
$area2
[1] 1.028594 1.1535106 0.1208483
как ни странно, когда я делаю расчет в процентах, значения на самом деле не соответствуют эллипсоидам в ggbiplot PCA:
tmp <- overlap(versicolor[,1], versicolor[,2], virginica[,1], virginica[,2], steps = 5)
virginica.percentage <- round(x=(tmp$overlap/tmp$area2*100), digits = 2)
versicolor.percentage <- round(x=(tmp$overlap/tmp$area1*100), digits = 2)
> virginica.percentage [1] 1.54
> versicolor.percentage[1] 1.56
что намного меньше, чем указано на рисунке 1 выше. Но, возможно, лучше открыть еще одну тему по этому вопросу здесь.
1 ответ
Возможные инструменты:
spatstat::overlap.owin , geo::geointersect, siar::overlap .
Вы можете спросить - и вы должны спросить - "Как он получил эти ответы так быстро?
Получить тебе посылку sos
и введите ???overlap