ddply - ошибка msg при группировании по двум переменным

Question

ddply - ошибка msg при группировании по двум переменным

Я борюсь с чем-то, что, на мой взгляд, должно быть довольно простым: приведенный ниже набор данных содержит, среди прочего, две переменные: epis.start и epis.end; основываясь на комбинации этих двух, я хотел бы назначить им переменную группировки, начинающуюся с 1, называемую epis.id.

Я использовал следующую команду (.(DyadId), поскольку в полном наборе данных есть много разных диад!):

d <- ddply(d, .(DyadId), transform,
           epis.id=id(epis.start, epis.end))

Тем не менее, я получаю следующее сообщение об ошибке:

Error: arguments imply differing number of rows

Любая помощь? Я начал задаваться вопросом, является ли =id() действительно правильной командой, но не смог определить другую. Эта запись также заставила меня поверить, что я не так далеко. Назначение идентификатора группы с помощью ddply Большое спасибо!

(часть) набора данных:

d<–structure(list(ConflictId = c("1-6", "1-6", "1-6", "1-6", "1-6", 
"1-6", "1-6", "1-6", "1-6", "1-6", "1-6", "1-6", "1-6", "1-6", 
"1-6", "1-6", "1-6", NA), DyadId = c(260L, 260L, 260L, 260L, 
260L, 260L, 260L, 260L, 260L, 260L, 260L, 260L, 260L, 260L, 260L, 
260L, 260L, NA), Year = c(1946L, 1966L, 1967L, 1968L, 1979L, 
1980L, 1981L, 1982L, 1983L, 1984L, 1985L, 1986L, 1987L, 1988L, 
1990L, 1993L, 1996L, NA), StartDate2 = structure(c(-8616, -1097, 
-1097, -1097, 3651, 3651, 3651, 3651, 3651, 3651, 3651, 3651, 
3651, 3651, 7491, 8655, 9705, NA), class = "Date"), epis.start = c(1946L, 
1966L, 1966L, 1966L, 1979L, 1979L, 1979L, 1979L, 1979L, 1979L, 
1979L, 1979L, 1979L, 1979L, 1990L, 1993L, 1996L, NA), epis.end = c(1946L, 
1968L, 1968L, 1968L, 1988L, 1988L, 1988L, 1988L, 1988L, 1988L, 
1988L, 1988L, 1988L, 1988L, 1990L, 1993L, 1996L, NA)), .Names = c("ConflictId", 
"DyadId", "Year", "StartDate2", "epis.start", "epis.end"), row.names = c("700", 
"701", "702", "703", "704", "705", "706", "707", "708", "709", 
"710", "711", "712", "713", "714", "715", "716", "NA"), class = "data.frame")

Это результат, к которому я стремлюсь

ConflictId  DyadId  Year    StartDate2  epis.start  epis.end epis.id
1-6         260    1946     1946-05-31  1946         1946    1 
1-6         260    1966     1966-12-31  1966         1968    2
1-6         260    1967     1966-12-31  1966         1968    2
1-6         260    1968     1966-12-31  1966         1968    2
1-6         260    1979     1979-12-31  1979         1988    3
1-6         260    1980     1979-12-31  1979         1988    3
1-6         260    1981     1979-12-31  1979         1988    3
1-6         260    1982     1979-12-31  1979         1988    3
1-6         260    1983     1979-12-31  1979         1988    3
1-6         260    1984     1979-12-31  1979         1988    3
1-6         260    1985     1979-12-31  1979         1988    3 
1-6         260    1986     1979-12-31  1979         1988    3
1-6         260    1987     1979-12-31  1979         1988    3
1-6         260    1988     1979-12-31  1979         1988    3
1-6         260    1990     1990-07-06  1990         1990    4
1-6         260    1993     1993-09-12  1993         1993    5
1-6         260    1996     1996-07-28  1996         1996    6

1

r plyr

Источник

user2221566 22 авг '14 в 12:36

1 ответ

Решение

Другие вопросы по тегам r plyr

user2725969 22 авг '14 в 12:47 2014-08-22 12:47 · Accepted Answer · 2014-08-22 12:47

Это должно сделать это:

ddply(d, .(DyadId), transform, epis.id=id(list(epis.start, epis.end), drop=T))

Обратите внимание, вы должны поставить list вокруг переменных в качестве аргумента id, Производит:

   ConflictId DyadId Year StartDate2 epis.start epis.end epis.id
1         1-6    260 1946 1946-05-31       1946     1946       1
2         1-6    260 1966 1966-12-31       1966     1968       2
3         1-6    260 1967 1966-12-31       1966     1968       2
4         1-6    260 1968 1966-12-31       1966     1968       2
5         1-6    260 1979 1979-12-31       1979     1988       3
6         1-6    260 1980 1979-12-31       1979     1988       3
7         1-6    260 1981 1979-12-31       1979     1988       3
8         1-6    260 1982 1979-12-31       1979     1988       3
9         1-6    260 1983 1979-12-31       1979     1988       3
10        1-6    260 1984 1979-12-31       1979     1988       3
11        1-6    260 1985 1979-12-31       1979     1988       3
12        1-6    260 1986 1979-12-31       1979     1988       3
13        1-6    260 1987 1979-12-31       1979     1988       3
14        1-6    260 1988 1979-12-31       1979     1988       3
15        1-6    260 1990 1990-07-06       1990     1990       4
16        1-6    260 1993 1993-09-12       1993     1993       5
17        1-6    260 1996 1996-07-28       1996     1996       6