Рассчитайте расстояние перемещения Земли, используя ddply и столбец для весов в R

У меня есть данные по 163 выборам в разных странах с 9 строками для каждого из этих выборов, представляющими каждую из 9 основных политических партий, участвующих в них (обозначены буквами AI). Мне нужно сравнить распределения переменной ideolparty среди этих 9 строк, взвешенные по проценту голосов (переменная pcv) по сравнению с той же переменной, взвешенной по доле мест (pcseats) для каждой страны. Я хочу выполнить это сравнение с помощью EMD (Расстояние земного движителя).

Ранее я рассчитывал EMD для каждого выбора в наборе данных, используя ddply и пакет emdist. Для вышеприведенной задачи я нашел "грязное" решение, заключающееся в создании двух разных наборов данных, где я повторяю каждую строку столько раз, сколько мне говорят переменные pcv и pcseats, а затем я вычисляю EMD для каждой страны.

Но я считаю, что есть более чистый способ сделать это с меньшим количеством кода, сообщая только веса для каждого распределения, которое я хочу сравнить. Я не нашел этого, материала по расчетам EMD для R мало (здесь, в Stackru, есть только вопросы для python с тегом EMD), а сама ссылка на пакет emdist не привела меня к решению.

Мои данные можно скачать здесь.

0 ответов

Другие вопросы по тегам