Сопоставьте эстетику с геометрией LINESTRING с помощью sf в R

Новый sf Пакет для R позволяет действительно легко работать с географическими данными в R, а также с развитой версией ggplot2 есть новый geom_sf() слой для построения географических данных в стиле sf.

В пределах sf парадигма работы с данными, можно ли сопоставить эстетику ggplot с LINESTRING геометрий?

Например, с помощью стандартного ggplot можно воссоздать знаменитый заговор выживших Минарда из Великой Армии Наполеона в 1812 году с помощью ggplot, и эти данные определяют размер армии по количеству выживших:

# Install the dev version of ggplot2 for geom_sf()
# devtools::install_github("tidyverse/ggplot2")
library(tidyverse)

troops <- read_csv("https://gist.githubusercontent.com/andrewheiss/69b9dffb7cca392eb7f9bdf56789140f/raw/3e2a48635ae44837955765b5e7747c429b0b5d71/troops.csv")

ggplot(troops) +
  geom_path(aes(x = long, y = lat, color = direction, 
                group = group, size = survivors),
            lineend = "round")

Мы можем работать с этими данными войск как sf объект путем создания нового geometry колонка, вот так:

library(sf)
#> Linking to GEOS 3.6.1, GDAL 2.1.3, proj.4 4.9.3

troops_with_geometry <- troops %>%
  st_as_sf(coords = c("long", "lat"))

head(troops_with_geometry)
#> Simple feature collection with 6 features and 3 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: 24 ymin: 54.5 xmax: 28 ymax: 55
#> epsg (SRID):    NA
#> proj4string:    NA
#> # A tibble: 6 x 4
#>   survivors direction group          geometry
#>       <int>     <chr> <int>  <simple_feature>
#> 1    340000         A     1 <POINT (24 54.9)>
#> 2    340000         A     1 <POINT (24.5 55)>
#> 3    340000         A     1 <POINT (25.5 ...>
#> 4    320000         A     1 <POINT (26 54.7)>
#> 5    300000         A     1 <POINT (27 54.8)>
#> 6    280000         A     1 <POINT (28 54.9)>

Если мы построим это с geom_sf, ggplot будет использовать точки:

ggplot(troops_with_geometry) +
  geom_sf(aes(color = direction, group = group))

Мы можем создавать строки строк для каждой из групп и направлений путем группировки, суммирования и приведения.

troops_lines <- troops_with_geometry %>%
  group_by(direction, group) %>% 
  summarize() %>% 
  st_cast("LINESTRING")

head(troops_lines)
#> Simple feature collection with 6 features and 2 fields
#> geometry type:  LINESTRING
#> dimension:      XY
#> bbox:           xmin: 24 ymin: 54.1 xmax: 37.7 ymax: 55.8
#> epsg (SRID):    NA
#> proj4string:    NA
#>   direction group                       geometry
#> 1         A     1 LINESTRING (24 54.9, 24.5 5...
#> 2         A     2 LINESTRING (24 55.1, 24.5 5...
#> 3         A     3 LINESTRING (24 55.2, 24.5 5...
#> 4         R     1 LINESTRING (24.1 54.4, 24.2...
#> 5         R     2 LINESTRING (28.3 54.2, 28.5...
#> 6         R     3 LINESTRING (24.1 54.4, 24.2...

Затем ggplot может построить эти шесть соединенных линий и правильно их раскрасить:

ggplot(troops_lines) +
  geom_sf(aes(color = direction, group = group))

Тем не менее, данные о выживших в настоящее время ушли, и нет никакой возможности отобразить эстетику размера в новые строки.

Есть ли способ связать другую эстетику (например, размер) с sf -основан LINESTRING данные? Или, другими словами, есть ли способ воссоздать ggplot(...) + geom_path(aes(x = long, y = lat, size = something)) с помощью geom_sf() а sf парадигма работы с географическими данными?

1 ответ

Решение

Вам необходимо создать линейную линию из каждой пары точек в каждой группе. Результат не такой красивый, потому что я не знаю, как сделать линии вокруг конечных точек.

# within each group repeat each point 
# then slice the first and last out and 
# add a variable called linegroup, which provides grouping for start and endpoints of each line
troops %<>% group_by(group) %>%
  slice(rep(1:n(), each = 2)) %>%
  slice(-c(1, n())) %>%
  mutate(linegroup = lapply(1:(n()/2), function(x) rep(x, 2)) %>% unlist) %>% 
  ungroup

# create linestring sf object by summarizing the points, 
# grab the last survivor and direction value of each group (i.e. the 'endpoint' value)
troops_line <- st_as_sf(troops, coords = c("long", "lat"), crs = 4326) %>%
  group_by(group, linegroup) %>%
  summarise(survivors = last(survivors), direction = last(direction), do_union = FALSE) %>%
  st_cast("LINESTRING")

gp <- ggplot(troops_line) +
  geom_sf(aes(color = direction, size = survivors), show.legend = "line") 
Другие вопросы по тегам