Максимальное количество состояний в TraMineR?
У меня есть набор данных с текстом, написанным пользователями в текстовом поле на веб-сайте. Из-за характера сайта большинство пользователей написали несколько раз в поле. Теперь я хочу посмотреть, если есть шаблон. Например, пользователи, которые в какой-то момент написали "А", позже будут писать "В".
После некоторого поиска в Google я нашел TraMineR
в качестве библиотеки для такого рода анализа. Но похоже что TraMineR
и / или R устанавливает максимум на число состояний. Это правда или я что-то не так делаю? Как лучше всего подойти к моей проблеме?
Еще немного информации о моем наборе данных:
- Есть более миллиона журналов ввода текста
- Около 90000 разных пользователей
- Около 80000 различных входов (события / состояния?)
Для создания объекта последовательности состояний моих данных мне нужно использовать seqe2stm()
от TraMineRextras
( Как объяснено здесь), где номер моего events
более 80000. Запуск функции выдает ошибку:
Ошибка в матрице (ИСТИНА, nrow = nbstate, ncol = nevent):
недопустимое значение 'nrow' (слишком большое или NA)
Дополнительно: предупреждающее сообщение:
В матрице (ИСТИНА, nrow = nbstate, ncol = nevent):
НС введены путем принуждения в целочисленный диапазон