Описание тега sequence-analysis

Анализ последовательности (в социальных науках) - это анализ того, как люди или другие единицы обучения переходят из одного состояния в другое (например, холост -> женат -> вдовец, безработный -> работает -> пенсионер) течение их продолжительности жизни.
1 ответ

Как проверить, если два значения подъема значительно отличаются друг от друга?

Рассмотрим этот код: # Load libraries library(RCurl) library(TraMineR) library(PST) # Get data x <- getURL("https://gist.githubusercontent.com/aronlindberg/08228977353bf6dc2edb3ec121f54a29/raw/c2539d06771317c5f4c8d3a2052a73fc485a09c6/challenge_le…
01 мар '17 в 14:58
1 ответ

Подгонка VLMC к очень длинным последовательностям

Я пытаюсь приспособить VLMC к набору данных, где самая длинная последовательность составляет 296 состояний. Я делаю это, как показано ниже: # Load libraries library(PST) library(RCurl) library(TraMineR) # Load and transform data x <- getURL("http…
31 янв '17 в 22:20
2 ответа

seqinr dotplot - изменить ось

У меня есть наборы данных: seq1 и seq2 (последовательности ДНК). Я хотел сделать график данных, сравнивая две последовательности и помещая точку там, где две последовательности совпадают. Я смог сделать это, используя точечную диаграмму seqinr, но я…
09 ноя '14 в 22:56
2 ответа

Получение логарифмической вероятности из дерева вероятностных суффиксов

Вот мой код: library(RCurl) library(TraMineR) library(PST) x <- getURL("https://gist.githubusercontent.com/aronlindberg/08228977353bf6dc2edb3ec121f54a29/raw/c2539d06771317c5f4c8d3a2052a73fc485a09c6/challenge_level.csv") data <- read.csv(text =…
25 янв '17 в 22:44
0 ответов

Sequence Mining с использованием пакета arulesSequence в R

Я пытаюсь узнать о Sequence Mining, и я запустил следующий код из викибук в качестве примера. Функция cspade заняла (и продолжает работать) более 30 минут, когда пример показывает, что она должна занимать менее секунды. Кто-нибудь знает, почему это …
12 ноя '15 в 20:27
0 ответов

Сравнивая значения потерь в журнале для вероятностного дерева суффиксов?

В PST Пакет один может оценить качество прогнозирования отдельных последовательностей, используя log-lossНапример: R> ex2 <- c("a-a-b", "a-b-a-a-b", "b-b-b-b-a") R> ex2 <- seqdef(ex2) R> predict(S1.p1, ex2, output = "logloss") logloss…
28 фев '17 в 19:38
1 ответ

Как вычислить различия между последовательностями, когда последовательности содержат пробелы?

Я хочу кластеризовать последовательности с оптимальным соответствием TraMineR::seqdist() из данных, которые содержат пропуски, то есть последовательности, содержащие пропуски. library(TraMineR) data(ex1) sum(is.na(ex1)) # [1] 38 sq <- seqdef(ex1[…
10 дек '18 в 07:51
2 ответа

Стоимость замены траминера

У меня есть логическая проблема с матрицей переходных расходов. Я работаю над различием последовательностей, используя пакет R Traminer. Я пытаюсь дать вам простой пример (очень простой, но я надеюсь, что полезно объяснить мою проблему): Есть три по…
18 фев '15 в 14:25
1 ответ

Как ввести шум в данные последовательности, используя TraMineR?

Я хочу случайным образом изменить состояния в наборе данных последовательности для целей моделирования. Цель состоит в том, чтобы увидеть, как различные показатели качества кластера ведут себя с различными степенями структуры данных. Если бы я ввел …
03 июл '18 в 07:07
1 ответ

Анализ последовательности и прогнозирование следующей метки

Я записал набор данных около 1000 записей в следующем формате. TimeStamp | Action | UserId 2015-02-05 | Action1 | XXX 2015-02-06 | Action2 | YYY 2015-02-07 | Action2 | XXX ... Я пытаюсь прогнозировать будущее Actions для конкретных пользователей на …
1 ответ

Формат вывода для функции seqecmpgroup()?

seqecmpgroup() Функция возвращает таблицу, которая, помимо прочего, включает частоты для каждой из указанных групп. Тем не менее, когда я запускаю это, он генерирует частоты ниже 1 (например, 0,00035). Должен ли я интерпретировать эти частоты как пр…
14 янв '15 в 16:08
2 ответа

Python/Biopython: Как искать эталонную последовательность (строку) в последовательности с пробелами?

Я столкнулся со следующей проблемой и пока не нашел решения: Я работаю над инструментом для анализа последовательностей, который использует файл со ссылочными последовательностями и пытается найти одну из этих ссылочных последовательностей в тестово…
4 ответа

Шаблон в непрерывной последовательности данных

Предположим, у меня есть список событий. Например A, D, T, H, U, A, B, F, H, ..., Мне нужно найти частые паттерны, которые встречаются в полной последовательности. В этой задаче мы не можем использовать традиционные алгоритмы, такие как a priori или…
1 ответ

TraMineR::: страница справки seqerules?

Есть ли страница помощи для TraMineR:::seqerules? Я не могу найти его ни в пакете, ни в Интернете. Отсутствие этой страницы справки затрудняет интерпретацию результатов. Например, что делать Conf а также Lift столбцы указать? Ниже приведен пример вы…
14 янв '15 в 16:16
1 ответ

Где в последовательности дерева вероятностных суффиксов встречается "е"?

В моих данных есть только недостающие данные (*) на правой стороне последовательностей. Это означает, что последовательность не начинается с * и ни одна последовательность не имеет никаких других маркеров после *, Несмотря на это, PST (вероятностное…
27 янв '17 в 01:39
2 ответа

Как определить последовательности в каждом листе из дерева регрессии?

Использование набора данных биофамы library(TraMineR) data(biofam) lab <- c("P","L","M","LM","C","LC","LMC","D") biofam.seq <- seqdef(biofam[,10:25], states=lab) head(biofam.seq) Sequence 1167 P-P-P-P-P-P-P-P-P-LM-LMC-LMC-LMC-LMC-LMC-LMC 514 P…
15 окт '14 в 19:47
1 ответ

Обнаружение последовательности с помощью регулярных выражений

Представьте, что у меня в списке несколько строк символов: [[1]] [1] "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-" [2] "-1-I2-1-TR-1-" [3] "-1-I2-1-FA-1-I3-1-" [4] "-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-" [5] "-1-I2-1-" [6] "-1-I2-1-FA-1-I2-1-" [7] "-1-I3…
21 сен '15 в 13:35
1 ответ

Что означает альфа в контексте функции сокращения получения информации?

В пакете PST мы используем значение C в качестве отсечения для функции получения информации, используемой для обрезки дерева. C Значение для альфа 0,05 рассчитывается следующим образом: C95 <- qchisq(0.95, 1) / 2 Что это значит, что C значение ос…
24 фев '17 в 17:04
1 ответ

Вычислить лифт для отношения контекст-состояние в вероятностном дереве суффиксов?

PST дает мне вероятности и условные вероятности для различных контекстов и следующих состояний. Однако было бы очень полезно иметь возможность рассчитать подъем (и его значение) взаимосвязи между контекстом и следующим состоянием. Как я могу это сде…
27 янв '17 в 14:07
1 ответ

Значение параметра задержки в PST?

В pmine() функция в PST Вы можете использовать лаги. Что это за отставание? Означает ли это, что игнорирует lag первые позиции в последовательности? Или это означает, что вы допускаете лаги в подпоследовательностях? Из документации трудно понять, чт…
24 фев '17 в 17:14