Переменные затраты на создание последовательностей неравной длины

Я делаю анализ последовательности в TraMineR, используя алгоритм оптимального соответствия. К сожалению, мои последовательности имеют неодинаковую длину из-за данных, подвергнутых цензуре. Минимальная длина моих последовательностей - 5, максимальная длина - 11. Различия в длине не имеют смысла для различий между интересующими меня последовательностями. Поэтому я хочу сохранить влияние неравной длины на общие различия между последовательностями как как можно меньше.

Я прочитал возможное решение этой проблемы в работе Stovel and Bolan (2004 (1)), в которой используются переменные издержки, не зависящие от того, имеют ли последовательности одинаковую длину. Таким образом, для последовательностей равной длины они используют фиксированные постоянные издержки, а для неравной длины они используют уменьшенную стоимость, которая составляет "примерно одну четвертую фиксированных затрат".

Мои вопросы будут: В общем, как должны кодироваться пропуски в TraMineR? Как пустые элементы или я должен включить отсутствующее состояние в алфавит? Есть ли возможность в TraMineR применять переменные расходы по индексу, как это было предложено Stovel и Bolan? Если да, как это можно сделать?


(1) Стовел, Кэтрин и Марк Болан. 2004. "Жилые траектории: использование оптимального выравнивания для раскрытия структуры жилой мобильности". Социологические методы и исследования 32(4):559-598.

1 ответ

Решение

В настоящее время невозможно использовать переменные затраты на получение данных (в зависимости от того, имеют ли последовательности одинаковую длину). Я довольно скептически отношусь к этому методу, потому что, если я его хорошо понимаю, определение меры расстояния изменяется в соответствии с задействованными последовательностями (так как изменяются затраты без учета стоимости). По этой причине неравенство треугольника не соблюдается. С концептуальной точки зрения, я думаю, что мы всегда должны использовать одни и те же критерии сравнения и, следовательно, одно и то же определение расстояния.

Другие вопросы по тегам