Использование R для сравнения нескольких 5-летних оценок ACS в одной географии

Я сравниваю расовый состав и медианный доход по регионам с течением времени в одной области (можно провести перепись населения или ZCTA. Здесь я включу ZCTA, потому что МЧС не так велико).

В каком формате лучше всего размещать мои данные, чтобы я мог их визуализировать? Кроме того, как рассчитать каждую расовую / этническую группу как процент от общего числа и процентное изменение?

Я был в состоянии использовать dplyr (распространение) для ГОДА и ОЦЕНКИ, но я хочу также быть в состоянии сделать это для ГОДА и МО. Это даже правильный ход?

Я также хочу рассчитать процент каждой расовой / этнической группы и процентное изменение. Как мне это сделать?

Спасибо!

Здесь я выяснил, как получить данные за несколько лет:

library(tidyverse)
library(tidycensus)

years <- lst(2012, 2017)
race_ethnicity <- c(Total = "DP05_0070", Hispanic = "DP05_0071", White = "DP05_0077", Black = "DP05_0078")

multi_yearZCTA <- map_dfr(
  years,
  ~get_acs(
    geography = "zcta",
    variables = race_ethnicity,
    year = .x,
    survey = "acs5",
    geometry = FALSE
  ),
  .id = "years"
) %>%
  arrange(variable, NAME) %>%
  print()

И тогда я выбрал конкретный ZCTA...

# Select specific ZCTA
RundbergZCTA <- multi_yearZCTA %>%
  filter(NAME == "ZCTA5 78758")

Я могу распространяться, но это не несет МЧС...

RundbergZCTA2 <- RundbergZCTA %>%
  spread(years, estimate, sep = "_")

Но я не совсем уверен, куда идти дальше.

0 ответов

Другие вопросы по тегам