Несоответствие длины dotsInPolys с использованием данных, загруженных с помощью tidycensus
Можете ли вы помочь найти лучший способ устранить ошибку несоответствия длины, генерируемую dotsInPolys? Я думаю, это потому, что в данных многоугольника есть NA, NULL или какой-то фанк, что делает его слишком длинным. Вот код, который воспроизводит ошибку. В конечном счете, я хочу построить несколько рас с использованием Leaflet, но я не могу произвести широту / долготу, необходимую для случайных точек в этой точке.
require(maptools)
require(tidycensus)
person.number.divider <- 1000
census_api_key("ENTER KEY HERE", install = TRUE)
racevars <- c(White = "B02001_002", #"P005003"
Black = "B02001_003", #Black or African American alone
Latinx = "B03001_003"
)
nj.county <- get_acs(geography = "county", #tract
year = 2015,
variables = racevars,
state = "NJ", #county = "Harris County",
geometry = TRUE,
summary_var = "B02001_001")
library(sf)
st_write(nj.county, "nj.county.shp", delete_layer = TRUE)
nj <- rgdal::readOGR(dsn = "nj.county.shp") %>%
spTransform(CRS("+proj=longlat +datum=WGS84"))
nj@data <- nj@data %>%
tidyr::separate(NAME,
sep =",",
into = c("county", "state")) %>%
dplyr::select(estimat,variabl, GEOID, county) %>%
spread(key = variabl, value = estimat) %>%
mutate(county = trimws(county))
black.dots <- dplyr::select(nj@data, Black) / person.number.divider #%>%
black.dots <- dotsInPolys(nj, as.integer(black.dots$Black), f="random")
# Error in dotsInPolys(nj, as.integer(black.dots$Black), f = "random") :
# different lengths
length(nj) # 63 This seems too many, because I believe NJ has 21 counties.
length(black.dots$Black) # 21
Этот пост ( Советы по устранению ошибок dotsInPolys (maptools)) был близок к тому, чтобы помочь мне, но я не мог понять, как применить его к моему делу.
I can change the length of the nj spatialpolygonsdataframe by removing NA's and counties with a black pop greater than 0, but then the map doesn't plot multiple counties (maybe there is something wrong with the census download?).
1 ответ
Похоже, вы могли понять это, но я хотел бы поделиться другим подходом, который использует sf::st_sample()
вместо maptools::dotsInPolys()
, Одним из преимуществ этого является то, что вам не нужно конвертировать sf
объект, который вы получаете от tidycensus
к sp
объект.
В следующем примере я разбил данные переписи по расе в список три sf
объекты затем выполняют st_sample()
на каждом элементе списка (каждой расе). Затем я объединяю выбранные точки в одну sf
объект с новой расовой переменной для каждой точки. Наконец, я использую tmap
сделать карту, хотя вы могли бы использовать ggplot2
или же leaflet
на карту, а также.
library(tidyverse)
library(tidycensus)
library(sf)
library(tmap)
person.number.divider <- 1000
racevars <- c(White = "B02001_002", #"P005003"
Black = "B02001_003", #Black or African American alone
Latinx = "B03001_003"
)
# get acs data with geography in "tidy" form
nj.county <- get_acs(geography = "county", #tract
year = 2015,
variables = racevars,
state = "NJ", #county = "Harris County",
geometry = TRUE,
summary_var = "B02001_001"
)
# split by race
county.split <- nj.county %>%
split(.$variable)
# randomly sample points in polygons based on population
points.list <- map(county.split, ~ st_sample(., .$estimate / person.number.divider))
# combine points into sf collections and add race variable
points <- imap(points.list, ~ st_sf(tibble(race = rep(.y, length(.x))), geometry = .x)) %>%
reduce(rbind)
# map!
tm_shape(nj.county) +
tm_borders(col = "darkgray", lwd = 0.5) +
tm_shape(points) +
tm_dots(col = "race", size = 0.01, pal = "Set2")
У меня недостаточно репутации, чтобы публиковать изображение карты напрямую, но вот оно.