Определение последовательности обозначений...(A), (A>B) и (A) - (A>B)
Надеюсь, быстрый....
Что касается вывода из seqefsub()
операции, пожалуйста, укажите мне определение выходной нотации.
Чтобы быть более конкретным, в скобках, например,
(A)
что означает;- больше, чем войти
(A>B)
что означает; - и дефис в
(A)-(A>B)
что означает.
Section 10
превосходного руководства пользователя есть примеры, но я, возможно, пропустил однозначное определение определения где-то.
Процитировать пример в Section 10.2
из руководства, какова концептуальная разница между (Parent)-(Parent>Left)
и просто (Parent>Left)
?
Спасибо,
Дейв
Обновление после комментария Гилберта....
Пытаясь прояснить то, что я, возможно, пропустил на странице 106 руководства пользователя, я думаю, что объяснение - или, по крайней мере, подтверждение - что я искал, было чем-то вроде следующей структуры. Извиняюсь за возможную неуклюжую многословность.
Контекст здесь, когда seqefsub()
результаты появляются в консоли....
(A)
это число раз, когда состояние A появляется как первое состояние, а не как любое последующее состояние. То есть - он подсчитывает, сколько раз A появляется в первом столбце. Здесь я предполагаю, что я не пропустил другой параметр конфигурации, который учитывает первое и все последующие состояния этого типа. Если есть, пожалуйста, дайте мне знать.
(A>B)
это количество появлений события (т.е. изменение состояния) от A до B. Это число относится к событиям в любом месте последовательности. Я полагаю, что это немного отличается от подсчета состояния выше, предполагая, что я случайно не исказил вещи. Я отмечаю, что ограничения могут быть установлены для вывода одного или нескольких вхождений.
(A)-(A>B)
это подсчитывает, сколько раз состояние A возникает в качестве первого состояния, и где событие от A до B происходит где-либо в последовательности. Это включает в себя события от A до B сразу после первого состояния и может включать в себя промежуточные другие состояния между первым состоянием A и событием от A до B.
Я надеюсь, что это помогает, и я надеюсь, что это правильный набор утверждений (основанный на исследованиях, которые позже моего первоначального вопроса).
2-е обновление после комментария Гилберта с просьбой привести пример....
Для реального набора данных... (где J и я занимаем место A и B)
> data
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1 I J J I J J I K J D J
2 G K R I J D J R I J N
3 K K I R M M K R J K I
4 R R B R I G R G R G G
5 J J J J J J J T Z J Z
6 R K R K M R R J J J R
7 J I I I I I I I I I I
8 J J J J J J J J J J R
9 J R J R J R J J I S R
10 J J J J J I J J J J J
11 G J J J J I I I R J J
12 I I D M D I I D I I D
13 R M R R J J J J J J J
затем
> dataseq <- seqdef(data)
> dataseqe <- seqecreate(dataseq)
> datasubseq <- seqefsub(dataseqe, pMinSupport = 0.05)
> datasubseq[1:10]
дает
Subsequence Support Count
1 (J) 0.3846154 5
2 (J>I) 0.3846154 5
3 (R>J) 0.3846154 5
4 (J>R) 0.3076923 4
5 (I>J) 0.2307692 3
6 (J)-(J>I) 0.2307692 3
7 (K>R) 0.2307692 3
8 (R) 0.2307692 3
9 (D>J) 0.1538462 2
10 (G) 0.1538462 2
Так....
1) количество 5 J-состояний (J)
применяется только к первому столбцу / вхождению, а не к любым последующим J-состояниям. Всего существует 57 J-государств.
2) счет 5 событий изменения состояния J в состояние I (J>I)
общее количество (для этой опции ограничения), когда бы они ни возникали.
3) подсчет 3 J-состояний с последующими подпоследовательностями J-состояния-I-состояния (J)-(J>I)
являются счетчиками событий в строке 7 (столбцы 1 и 2), строке 9 (столбец 1 и столбцы 8 и 9) и, наконец, в строке 10 (столбец 1 и столбцы 5 и 6); последние два случая имеют промежуточные состояния и / или события между (J)
и (J>I)
,
Тогда к вопросу - это правильное и ожидаемое поведение и правильная интерпретация. Если да, то почему подсчет состояний выполняется на основе, отличной от подсчета изменений событий / состояний?
1 ответ
В вашем примере последовательности событий являются производными от объекта последовательности состояний dataseq
сseqecreate(dataseq)
, Поскольку вы не предоставляете tevent
аргумент, по умолчанию tevent = "transition"
используется (см. help(seqecreate)
). С этим значением события определяются как переходы из состояния A
в состояние B
и помечены A>B
, Кроме того, конкретное событие помечено A
связан с началом последовательности, чтобы указать состояние в начале последовательности. Итак, хотя используется тот же символ, A
в последовательности событий это событие --- событие запуска --- и его не следует путать с A
в последовательностях состояний, где это состояние.
Вышеуказанное относится к tevent="transition"
вариант. Например, с tevent="state"
события будут началом заклинаний и помечены как A
чтобы указать начало заклинания в состоянии A
, В этом случае событие A
может произойти где угодно в последовательности, а не только в начале.
Теперь о скобках. Они указывают на переходы (или транзакции), причем переход определяется как набор одновременных событий, которые провоцируют изменение состояния. Например:
(a,b)
указывает на то, что два события a
а также b
происходят в один и тот же момент времени,
(A>C)
означает, что у нас есть одно событие A>C
в момент времени.
(a)-(b)
обозначает последовательность длины 2, где событие a
предшествует событие b
,
Надеюсь это поможет.