Как рассчитать объем пересечения эллипсов в г

Мне было интересно, как рассчитать пересечение между двумя эллипсами, например, объем пересечения между версиколором и виргинской, как показано на этом графике: PCA на наборе данных радужной оболочки который построен с использованием следующего mwe на основе этого урока:

data(iris)
log.ir <- log(iris[, 1:4])
ir.species <- iris[, 5]
ir.pca <- prcomp(log.ir, center = TRUE, scale. = TRUE)

library(ggbiplot)
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1, 
          groups = ir.species, ellipse = TRUE,
          circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal', 
           legend.position = 'top')
print(g)

Я получаю ковариации и центры для эллипсов следующим образом:

setosa.cov <- cov(ir.pca$x[ir.species=="setosa",])
versicolor.cov <- cov(ir.pca$x[ir.species=="versicolor",])
virginica.cov <- cov(ir.pca$x[ir.species=="virginica",])
setosa.centre <- colMeans(ir.pca$x[ir.species=="setosa",])
versicolor.centre <- colMeans(ir.pca$x[ir.species=="versicolor",])
virginica.centre <- colMeans(ir.pca$x[ir.species=="virginica",])

Но тогда я нахожусь в конце моего остроумия:-|

Изменить: Следуя указаниям @carl-witthoft ниже, вот пример использования siar:: overlap:

library(siar)
setosa <- ir.pca$x[ir.species=="setosa",]
versicolor <- ir.pca$x[ir.species=="versicolor",]
virginica <- ir.pca$x[ir.species=="virginica",]

overlap.fun <- function(data.1, data.2){
   dimensions <- ncol(data.1)
   for(i in 1:(dimensions-1)){
      overlap.out <- overlap(data.1[,i], data.1[,i+1], data.2[,i], data.2[,i+1], steps = 5)
      out$overlap[i] <- overlap.out$overlap
      out$area1[i] <- overlap.out$area1
      out$area2[i] <- overlap.out$area2
   }
   return(out)
}

overlap.fun(versicolor, virginica)

возвращает:

$overlap
[1] 0.01587977 0.48477088 0.08375927
$area1
[1]1.020596 1.04614461 0.08758691                 
$area2
[1] 1.028594 1.1535106 0.1208483

как ни странно, когда я делаю расчет в процентах, значения на самом деле не соответствуют эллипсоидам в ggbiplot PCA:

tmp <- overlap(versicolor[,1], versicolor[,2], virginica[,1], virginica[,2], steps = 5)
virginica.percentage <- round(x=(tmp$overlap/tmp$area2*100), digits = 2)
versicolor.percentage <- round(x=(tmp$overlap/tmp$area1*100), digits = 2)
> virginica.percentage [1] 1.54
> versicolor.percentage[1] 1.56

что намного меньше, чем указано на рисунке 1 выше. Но, возможно, лучше открыть еще одну тему по этому вопросу здесь.

1 ответ

Решение

Возможные инструменты:

 spatstat::overlap.owin , geo::geointersect, siar::overlap .

Вы можете спросить - и вы должны спросить - "Как он получил эти ответы так быстро?

Получить тебе посылку sos и введите ???overlap

Другие вопросы по тегам