R сюжетная цветовая легенда по фактору

Использование R 3.3.1 в Windows 10. Я делаю xy-график из 95 строк данных. Данные находятся в 6 различных группировках (фактор, называемый "группа"). Сам сюжет достаточно прост, но я не могу заставить легенду правильно учесть фактор и цвет правильно.

Вот данные в переменной v1:

v1 <- structure(list(group = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 
5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 
6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L), .Label = c("F9", "T26", "W37", 
"W40", "W41", "W42"), class = "factor"), point = c(1L, 2L, 3L, 
4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 1L, 
2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 
16L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 
14L, 15L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 
13L, 14L, 15L, 16L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 
11L, 12L, 13L, 14L, 15L, 16L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 
9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L), x = c(-7.064, -5.1681, 
-6.4866, -2.7522, -4.6305, -4.2957, -3.7552, -4.9482, -5.6452, 
-6.0302, -5.3244, -3.9819, -3.8123, -5.3085, -5.6096, -6.4557, 
-5.2549, -3.4893, -3.5909, -2.5546, -3.7247, -5.1733, -3.3451, 
-2.8993, -2.6835, -3.9495, -4.9649, -2.8438, -4.6926, -3.4768, 
-3.1221, -4.8175, -4.5641, -3.549, -3.08, -2.4153, -2.9882, -3.4045, 
-4.6394, -3.3404, -2.6728, -3.3517, -2.6098, -3.7733, -4.051, 
-2.9385, -4.5024, -4.59, -4.5617, -4.0658, -2.4986, -3.7559, 
-4.245, -4.8045, -4.6615, -4.0696, -4.6638, -4.6505, -3.7978, 
-4.5649, -5.7669, -4.519, -3.8561, -3.779, -3.0549, -3.1241, 
-2.1423, -3.2759, -4.224, -4.028, -3.3412, -2.8832, -3.3866, 
-0.1852, -3.3763, -4.317, -5.3607, -3.3398, -1.9087, -4.431, 
-3.7535, -3.2545, -0.806, -3.1419, -3.7269, -3.4853, -4.3129, 
-2.8891, -3.0572, -5.3309, -2.5837, -4.1128, -4.6631, -3.4695, 
-4.1045), y = c(7.76, 0.72, 4.1, 1.36, 0.13, -0.02, 0.13, 0.42, 
1.49, 2.64, 1.01, 0.08, 0.22, 1.01, 1.53, 4.39, 0.99, 0.56, 0.43, 
2.31, 0.31, 0.59, 0.62, 1.65, 2.12, 0.1, 0.24, 1.68, 0.09, 0.59, 
1.23, 0.4, 0.36, 0.49, 1.41, 3.29, 1.22, 0.56, 0.1, 0.67, 2.38, 
0.43, 1.56, 0.07, 0.08, 1.53, -0.01, 0.12, 0.1, 0.04, 3.42, 0.23, 
0, 0.34, 0.15, 0.03, 0.19, 0.17, 0.2, 0.09, 2.3, 0.07, 0.15, 
0.18, 1.07, 1.21, 3.4, 0.8, -0.04, 0.02, 0.74, 1.59, 0.71, 10.64, 
0.64, -0.01, 1.06, 0.81, 4.58, 0.01, 0.14, 0.59, 7.35, 0.63, 
0.17, 0.38, -0.08, 1.1, 0.89, 0.94, 1.52, 0.01, 0.1, 0.38, 0.02
)), .Names = c("group", "point", "x", "y"), class = "data.frame", row.names = c(NA, 
-95L))

Вот сюжет моих попыток наложения легенды:

> attach(v1)    
> plot(x,y, pch=16, col=group)   #simple plot, automatic colors
> #first legend
> legend("topleft", legend=group, pch=16, col=group)
> # colors matched, but it's breaking out every point
> legend("topright", legend=levels(group), pch=16, col=group)
> # Corrected the number of levels in legend, but no colors
>

Вы можете видеть, что первая легенда отображается правильно по цвету, но она показывает запись для каждой точки и заканчивается свободное место. Вторая легенда показывает группу как уровни факторов, чего я и хочу, но это не меняет цвета.

Я понимаю, что мог бы окрашивать как вектор (например, col(c("черный", "красный" и т. Д.)), Но поскольку исходная команда графика автоматически назначала цвета, я собираюсь сделать это "автоматически" в моей легенде и избежать риска поставить неправильные цвета в моем векторе.

Спасибо!

2 ответа

Решение

Базовое решение R:

attach(v1)    
plot(x,y, pch=16, col=group)
legend("topleft", legend=levels(group), pch=16, col=unique(group))

решение ggplot2

ggplot(v1)+
   geom_point(aes(x=x,y=y,colour=group))+
   theme_bw()

Опять же, я настоятельно рекомендую использовать ggplot2 над базой R, если только вы не изучаете данные. Есть много вопросов / ответов по этому вопросу на SO.

Попробуйте создать новый столбец в v1 это число, основанное на значении group (как фактор). Передайте этот столбец как col при построении точек. Затем создайте вектор чисел для legend таким же образом и передать это как col за legend,

v1$cols = as.numeric(as.factor(v1$group))
legend.cols = as.numeric(as.factor(levels(v1$group)))
plot(v1$x , v1$y, pch=16, col=v1$cols)
legend("topright", legend=levels(group), pch=16, col=legend.cols)
Другие вопросы по тегам