Построить множество линейных диаграмм в верхней части диаграммы Ганта, быстро / масштабируемо

Диаграмма цели: (Сделано с Photoshop)

Контролировать присутствие дворника в и из зала. Синий - это Дворник 1, Коричневый - это Дворник 2. Линия представляет количество гостей, присутствующих в зале (масштаб относительно себя, т.е. ymin=0, ymax=max.visitor.value, без явных осей). Цвет представляет (cum. janitor time)/(cum. # of guests)то есть, если беспорядок накапливается, линия начинает становиться красной.

Где я: (R с plotrix::gantt.chart)

Вопрос

Я стремлюсь достичь цели (добавление линии градиента в день) полностью с R. Я не уверен, как поступить - я подумываю либо: 1) добавить их с графикой нижнего рычага и расположить их вручную, так как plotrix основан на базовой графике или 2) отойти от plotrix и использовать пакет на основе сетки, который может быть более читабельным / более высокого уровня (?), чем предыдущий.

Проблемы

Я попытался найти пакет на основе сетки, глядя на SO поток, обсуждающий различные способы создания Гантс. Я попытался использовать заговор, но он не поддерживал "многократные временные блоки" для одной и той же "задачи". Я хотел сделать паузу, прежде чем уделять больше времени другим пакетам и, возможно, зайти в тупик (учитывая добавление всех линейных графиков), не зная при этом превосходных методов.

В качестве последнего средства я могу рассмотреть возможность создания линейных графиков один за другим и привязки их к диаграмме Ганта за пределами R.

Образец данных

Данные диаграммы Ганта (случайная выборка, только понедельник и вторник для краткости)

   janitor.type weekday    dummy.start.time      dummy.end.time
        <dbl>   <chr>              <dttm>              <dttm>
 1          1  Monday 1970-01-01 18:01:20 1970-01-01 18:06:50
 2          1  Monday 1970-01-01 18:08:10 1970-01-01 18:11:52
 3          1  Monday 1970-01-01 17:22:00 1970-01-01 17:23:00
 4          1  Monday 1970-01-01 11:39:40 1970-01-01 11:41:58
 5          2  Monday 1970-01-01 19:35:40 1970-01-01 19:40:40
 6          1  Monday 1970-01-01 15:23:00 1970-01-01 15:24:12
 7          1  Monday 1970-01-01 11:54:50 1970-01-01 12:00:20
 8          1 Tuesday 1970-01-01 17:23:00 1970-01-01 18:18:18
 9          2 Tuesday 1970-01-01 19:25:00 1970-01-01 19:39:18
10          1 Tuesday 1970-01-01 16:40:10 1970-01-01 17:09:10
11          1 Tuesday 1970-01-01 14:16:50 1970-01-01 14:19:38
12          2 Tuesday 1970-01-01 09:27:00 1970-01-01 09:30:30
13          1 Tuesday 1970-01-01 14:08:40 1970-01-01 14:13:40
14          1 Tuesday 1970-01-01 11:12:40 1970-01-01 11:13:40

> dput(gantt)

structure(list(asset.type = c(1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 
1, 1, 1), weekday = c("Monday", "Monday", "Monday", "Monday", 
"Monday", "Monday", "Monday", "Tuesday", "Tuesday", "Tuesday", 
"Tuesday", "Tuesday", "Tuesday", "Tuesday"), dummy.start.time = structure(c(82880, 
83290, 80520, 59980, 88540, 73380, 60890, 80580, 87900, 78010, 
69410, 52020, 68920, 58360), class = c("POSIXct", "POSIXt"), tzone = ""), 
    dummy.end.time = structure(c(83210, 83512, 80580, 60118, 
    88840, 73452, 61220, 83898, 88758, 79750, 69578, 52230, 69220, 
    58420), class = c("POSIXct", "POSIXt"), tzone = "")), row.names = c(NA, 
-14L), vars = "weekday", drop = TRUE, .Names = c("asset.type", 
"weekday", "dummy.start.time", "dummy.end.time"), indices = list(
    0:6, 7:13), group_sizes = c(7L, 7L), biggest_group_size = 7L, labels = structure(list(
    weekday = c("Monday", "Tuesday")), row.names = c(NA, -2L), class = "data.frame", vars = "weekday", drop = TRUE, .Names = "weekday"), class = c("grouped_df", 
"tbl_df", "tbl", "data.frame"))

Посетители

Monday          Tuesday 
9:00:00 AM  138 9:00:00 AM  153
10:00:00 AM 251 10:00:00 AM 299
11:00:00 AM 432 11:00:00 AM 479
12:00:00 PM 560 12:00:00 PM 453
1:00:00 PM  555 1:00:00 PM  535
2:00:00 PM  475 2:00:00 PM  383
3:00:00 PM  448 3:00:00 PM  416
4:00:00 PM  469 4:00:00 PM  417
5:00:00 PM  459 5:00:00 PM  519
6:00:00 PM  403 6:00:00 PM  384
7:00:00 PM  290 7:00:00 PM  278
8:00:00 PM  120 8:00:00 PM  116
9:00:00 PM  29  9:00:00 PM  34

dput (посетители)

structure(list(weekday = c("Monday", "Monday", "Monday", "Monday", 
"Monday", "Monday", "Monday", "Monday", "Monday", "Monday", "Monday", 
"Monday", "Monday", "Tuesday", "Tuesday", "Tuesday", "Tuesday", 
"Tuesday", "Tuesday", "Tuesday", "Tuesday", "Tuesday", "Tuesday", 
"Tuesday", "Tuesday", "Tuesday"), time = structure(c(50400, 54000, 
57600, 61200, 64800, 68400, 72000, 75600, 79200, 82800, 86400, 
90000, 93600, 50400, 54000, 57600, 61200, 64800, 68400, 72000, 
75600, 79200, 82800, 86400, 90000, 93600), class = c("POSIXct", 
"POSIXt"), tzone = ""), count = c(138L, 251L, 432L, 560L, 555L, 
475L, 448L, 469L, 459L, 403L, 290L, 120L, 29L, 153L, 299L, 479L, 
453L, 535L, 383L, 416L, 417L, 519L, 384L, 278L, 116L, 34L)), .Names = c("weekday", 
"time", "count"), row.names = c(NA, -26L), class = "data.frame")

plotrix:: код gantt.chart

# Set up variables for gantt chart

labels <- gantt$weekday
starts <- gantt$dummy.start.time
ends <- gantt$dummy.end.time
priorities <- as.numeric(gantt$asset.type)

Ymd.format <- "%Y/%m/%d %H:%M:%S"

# Feed variables to chart parameters

gantt.info <- list(
  labels = labels,
  starts = starts,
  ends = ends,
  priorities = priorities
)

# Define chart intervals

hours <- seq(
  as.POSIXct("1970/01/01 09:00:00", format = Ymd.format),
  as.POSIXct("1970/01/01 21:00:00", format = Ymd.format),
  by = "hour"
)

# Define labels for vgridlab

hourslab <- format(hours, format = "%H")

# Define vertical gridline

vgridpos <- as.POSIXct(hours, format = Ymd.format)
vgridlab <- hourslab

# Optional coloring

colfunc <- colorRampPalette(c("#00bff3", "#362f2d"))

# Define timeframe on x axis

timeframe <-
  as.POSIXct(c("1970/01/01 09:00:00", "1970/01/01 21:00:00"), format = Ymd.format)

# Create the chart

main = ""

test <- gantt.chart(
  gantt.info,
  taskcolors = colfunc(2),
  xlim = timeframe,
  main = main,
  priority.legend = F,
  vgridpos = vgridpos,
  vgridlab = vgridlab,
  hgrid = TRUE,
  half.height = 0.125,
  time.axis = 1
)

1 ответ

Решение

Я использовал ggplot2, Чтобы иметь возможность использовать 2 разные настройки цвета - одну для типа актива Ганта, а другую для количества посетителей, я выбрал два типа geom, один из которых может принимать цвет заливки: geom_rect, другой цвет линии: geom_line,

Я использую сетку, чтобы иметь возможность разделять дни недели, так как у Ганта и посетителей нет общей оси Y.

Цвет и палитра заливки могут быть установлены scale_colour_gradient (непрерывно) или scale_fill_manual (дискретный), или воспользоваться цветовой палитрой пивовара scale_colour_distiller (непрерывно) и scale_fill_brewer (Дискретный). Я использовал пример из каждого ниже, чтобы повторить цветовую схему из данного графика Ганта.

# factor weekdays and set levels to correct order
gantt$weekday <- factor(gantt$weekday, levels=c("Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"))
visitors$weekday <- factor(visitors$weekday, levels=c("Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"))

# factor gantt$asset.type as this represent categorical not continuous values 
gantt$asset.type <- factor(gantt$asset.type)


# gantt chart
library(ggplot2)
ggplot() +
  geom_line(data=visitors, aes(x=time, y=count, colour=count)) +
  geom_rect(data=gantt, aes(xmin=dummy.start.time, xmax=dummy.end.time, ymin=-100, ymax=0, fill=asset.type)) +
  facet_grid(weekday~.) +
  scale_colour_distiller("Visitor Count", type="div", palette="RdYlGn", direction = -1) + 
  scale_fill_manual("Asset Type", values=c("dodger blue", "black")) +  
  theme_bw() +
  theme(axis.title = element_blank())

Примечание. Вы можете отрегулировать толщину панелей актива, настроив ymin а также ymax из geom_rect, я имел ymax=0 а также ymin принимая отрицательное значение, чтобы оно отображалось ниже y-диапазона количества посетителей.

Я должен добавить, что вы также можете сделать диаграммы Ганта в ggplot2 с помощью geom_segment, но конкретная проблема с вашим графиком требует двух разных цветовых шкал, и geom_segment только занимает colour эстетика как geom_line,

Вот ggplot2 код для создания диаграмм Ганта:

ggplot(gantt) +
  geom_segment(aes(x=dummy.start.time, xend=dummy.end.time, y=weekday, yend=weekday, colour=asset.type), size=10) +
  scale_colour_manual("Asset Type", values=c("dodger blue", "black")) +  
  theme_bw() +
  theme(axis.title = element_blank())

Другие вопросы по тегам