Взвешенное населением искажение полигонов (картограммы)
Я пытаюсь создать карту в R, которая передает как форму базовой геометрии (то есть, физические границы), так и относительную важность объекта с точки зрения ассоциированного значения.
Для конкретности я хотел бы сосредоточиться на воспроизведении (версии) следующей карты * (формы, а не цвета, так как я не могу найти данные опроса):
Я также не хочу беспокоиться о том, чтобы Аляска и Гавайи появлялись под США, а не в их геодезически правильных местах.
Я только до тех пор, пока данные объединяются с весами, например, следующим образом:
1. Получить полигоны
library(maptools)
library(data.table) #not strictly necessary but I prefer it
#US states downloaded (500k resolution) from:
#https://www.census.gov/geo/maps-data/data/cbf/cbf_state.html
us.states<-
readShapePoly("~/Desktop/cb_2014_us_state_5m.shp")
setDT(us.states@data)
#for getting rid of territories, AK, HI
states<-sprintf("%02d",1:59)
ak.hi<-c("02","15")
us.states.contig<-
us.states[us.states@data$STATEFP %in%
setdiff(states,ak.hi),]
#Unadorned plot
plot(us.states.contig)
text(coordinates(us.states.contig),
us.states.contig@data[,paste0(STUSPS)],
cex=.7)
2. Добавить данные Коллегии выборщиков
#scraped from government page
library(rvest) #only necessary to scrape table
electoral.college.url<-
paste0("http://www.archives.gov/federal-register/",
"electoral-college/allocation.html")
electoral.college.dt<-
(html(electoral.college.url) %>%
html_nodes("table"))[[5]] %>%
html_table()
setDT(electoral.college.dt)
setnames(electoral.college.dt,c("State","Votes"))
#merge into geodata
us.states.contig@data<-
copy(us.states.contig@data)[
electoral.college.dt,electoral.votes:=i.Votes,
on=c(NAME="State")]
#plot, coloring each state by size
states.ranked<-
us.states.contig@data[,rank(electoral.votes,
ties.method="first")]
cols<-colorRampPalette(c("red","blue"))(51)[states.ranked]
plot(us.states.contig,col=cols)
Это все хорошо, и, взглянув на эту карту, мы можем сказать, какие штаты имеют высокую и низкую представленность в коллегии выборщиков. Но что, если (как в нашей целевой карте) мы хотим представить другую переменную с цветом состояния?
3. Добавить итоги выборов 2012 года
#scrape again
#2012 Election Results by State
election.wiki<-
paste0("https://en.wikipedia.org/wiki/",
"United_States_presidential_election,_2012")
results<-
html(election.wiki) %>%
html_node(xpath='//*[@id="mw-content-text"]/div[22]/table') %>%
html_table()
#eliminate second header row, delete final row,
# keep only the important columns
results.trim<-results[2:(nrow(results)-1),c(1,4,21)]
colnames(results.trim)<-c("name","pct","abbr")
results.dt<-setDT(results.trim)
#data idiosyncrasies, see Wiki page
results.dt<-results.dt[!grepl("–",abbr)|grepl("a",abbr)]
results.dt[grepl("–",abbr),abbr:=gsub("–.*","",abbr)]
results.dt[,"pct":=as.numeric(gsub("%","",pct))]
#merge
us.states.contig@data<-
copy(us.states.contig@data
)[results.dt,vote.pct:=i.pct,
on=c(STUSPS="abbr")]
pcts<-us.states.contig@data[,vote.pct]
cols<-c("red","blue")[(pcts>=50)+1L]
tx.col<-c("white","black")[(cols=="red")+1L]
plot(us.states.contig,col=cols)
text(coordinates(us.states.contig),
us.states.contig@data[,paste0(STUSPS)],
col=tx.col)
Этот последний график дает суть проблемы. Первый представленный график намного лучше в том смысле, что мы можем судить по процентному соотношению красного и синего на карте, выиграли ли республиканцы или демократы; эта последняя карта вводит в заблуждение, потому что большинство республиканских штатов также являются наиболее малонаселенными.
Есть ли способ создать искаженную версию этой карты, которая отражает относительную важность каждого штата в коллегии выборщиков? Я не мог найти какую-либо помощь онлайн, возможно, главным образом потому, что я не знаю, есть ли стандартное имя для этого типа графика.
* Эта карта была найдена здесь; Я видел подобные искаженные по размеру карты раньше, например, в The Economist. Похоже, что он основан на работе доктора Сэма Вана в Консорциуме по выборам в Принстоне и был подготовлен Дрю Талером.
1 ответ
Следуя совету сопровождающего пакета @chkaiser, я нашел и, наконец, нашел способ сделать это в R. Это сообщение в блоге было огромной помощью, и getcartr
пакет фантастический.
Во-первых, получить Rcartogram
а также getcartr
пакеты от GitHub:
library(devtools)
install_github("omegahat/Rcartogram")
install_github('chrisbrunsdon/getcartr', subdir='getcartr')
library(Rcartogram)
library(getcartr)
Теперь просто подключи и проверь:
us.states.contig.carto <-
quick.carto(us.states.contig,
us.states.contig@data$electoral.votes)
plot(us.states.contig.carto, col = cols)
text(coordinates(us.states.contig.carto),
us.states.contig@data[ , paste0(STUSPS)],
col = tx.col)
И вот так у нас есть наша картограмма: