Определение последовательности обозначений...(A), (A>B) и (A) - (A>B)

Надеюсь, быстрый....

Что касается вывода из seqefsub() операции, пожалуйста, укажите мне определение выходной нотации.

Чтобы быть более конкретным, в скобках, например,

  • (A) что означает;
  • больше, чем войти (A>B) что означает;
  • и дефис в (A)-(A>B) что означает.

Section 10 превосходного руководства пользователя есть примеры, но я, возможно, пропустил однозначное определение определения где-то.

Процитировать пример в Section 10.2 из руководства, какова концептуальная разница между (Parent)-(Parent>Left) и просто (Parent>Left)?

Спасибо,

Дейв

Обновление после комментария Гилберта....

Пытаясь прояснить то, что я, возможно, пропустил на странице 106 руководства пользователя, я думаю, что объяснение - или, по крайней мере, подтверждение - что я искал, было чем-то вроде следующей структуры. Извиняюсь за возможную неуклюжую многословность.

Контекст здесь, когда seqefsub() результаты появляются в консоли....

(A) это число раз, когда состояние A появляется как первое состояние, а не как любое последующее состояние. То есть - он подсчитывает, сколько раз A появляется в первом столбце. Здесь я предполагаю, что я не пропустил другой параметр конфигурации, который учитывает первое и все последующие состояния этого типа. Если есть, пожалуйста, дайте мне знать.

(A>B) это количество появлений события (т.е. изменение состояния) от A до B. Это число относится к событиям в любом месте последовательности. Я полагаю, что это немного отличается от подсчета состояния выше, предполагая, что я случайно не исказил вещи. Я отмечаю, что ограничения могут быть установлены для вывода одного или нескольких вхождений.

(A)-(A>B) это подсчитывает, сколько раз состояние A возникает в качестве первого состояния, и где событие от A до B происходит где-либо в последовательности. Это включает в себя события от A до B сразу после первого состояния и может включать в себя промежуточные другие состояния между первым состоянием A и событием от A до B.

Я надеюсь, что это помогает, и я надеюсь, что это правильный набор утверждений (основанный на исследованиях, которые позже моего первоначального вопроса).

2-е обновление после комментария Гилберта с просьбой привести пример....

Для реального набора данных... (где J и я занимаем место A и B)

> data   
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1   I  J  J  I  J  J  I  K  J   D   J
2   G  K  R  I  J  D  J  R  I   J   N
3   K  K  I  R  M  M  K  R  J   K   I
4   R  R  B  R  I  G  R  G  R   G   G
5   J  J  J  J  J  J  J  T  Z   J   Z
6   R  K  R  K  M  R  R  J  J   J   R
7   J  I  I  I  I  I  I  I  I   I   I
8   J  J  J  J  J  J  J  J  J   J   R
9   J  R  J  R  J  R  J  J  I   S   R
10  J  J  J  J  J  I  J  J  J   J   J
11  G  J  J  J  J  I  I  I  R   J   J
12  I  I  D  M  D  I  I  D  I   I   D
13  R  M  R  R  J  J  J  J  J   J   J

затем

> dataseq <- seqdef(data)

> dataseqe <- seqecreate(dataseq)

> datasubseq <- seqefsub(dataseqe, pMinSupport = 0.05)

> datasubseq[1:10]

дает

    Subsequence   Support Count
1          (J) 0.3846154     5
2        (J>I) 0.3846154     5
3        (R>J) 0.3846154     5
4        (J>R) 0.3076923     4
5        (I>J) 0.2307692     3
6    (J)-(J>I) 0.2307692     3
7        (K>R) 0.2307692     3
8          (R) 0.2307692     3
9        (D>J) 0.1538462     2
10         (G) 0.1538462     2

Так....

1) количество 5 J-состояний (J) применяется только к первому столбцу / вхождению, а не к любым последующим J-состояниям. Всего существует 57 J-государств.

2) счет 5 событий изменения состояния J в состояние I (J>I) общее количество (для этой опции ограничения), когда бы они ни возникали.

3) подсчет 3 J-состояний с последующими подпоследовательностями J-состояния-I-состояния (J)-(J>I) являются счетчиками событий в строке 7 (столбцы 1 и 2), строке 9 (столбец 1 и столбцы 8 и 9) и, наконец, в строке 10 (столбец 1 и столбцы 5 и 6); последние два случая имеют промежуточные состояния и / или события между (J) и (J>I),

Тогда к вопросу - это правильное и ожидаемое поведение и правильная интерпретация. Если да, то почему подсчет состояний выполняется на основе, отличной от подсчета изменений событий / состояний?

1 ответ

Решение

В вашем примере последовательности событий являются производными от объекта последовательности состояний dataseq сseqecreate(dataseq), Поскольку вы не предоставляете tevent аргумент, по умолчанию tevent = "transition" используется (см. help(seqecreate)). С этим значением события определяются как переходы из состояния A в состояние B и помечены A>B, Кроме того, конкретное событие помечено A связан с началом последовательности, чтобы указать состояние в начале последовательности. Итак, хотя используется тот же символ, A в последовательности событий это событие --- событие запуска --- и его не следует путать с A в последовательностях состояний, где это состояние.

Вышеуказанное относится к tevent="transition" вариант. Например, с tevent="state"события будут началом заклинаний и помечены как A чтобы указать начало заклинания в состоянии A, В этом случае событие A может произойти где угодно в последовательности, а не только в начале.

Теперь о скобках. Они указывают на переходы (или транзакции), причем переход определяется как набор одновременных событий, которые провоцируют изменение состояния. Например:

(a,b) указывает на то, что два события a а также b происходят в один и тот же момент времени,

(A>C) означает, что у нас есть одно событие A>C в момент времени.

(a)-(b) обозначает последовательность длины 2, где событие a предшествует событие b,

Надеюсь это поможет.

Другие вопросы по тегам