Максимальное количество состояний в TraMineR?

У меня есть набор данных с текстом, написанным пользователями в текстовом поле на веб-сайте. Из-за характера сайта большинство пользователей написали несколько раз в поле. Теперь я хочу посмотреть, если есть шаблон. Например, пользователи, которые в какой-то момент написали "А", позже будут писать "В".

После некоторого поиска в Google я нашел TraMineR в качестве библиотеки для такого рода анализа. Но похоже что TraMineR и / или R устанавливает максимум на число состояний. Это правда или я что-то не так делаю? Как лучше всего подойти к моей проблеме?

Еще немного информации о моем наборе данных:

  • Есть более миллиона журналов ввода текста
  • Около 90000 разных пользователей
  • Около 80000 различных входов (события / состояния?)

Для создания объекта последовательности состояний моих данных мне нужно использовать seqe2stm() от TraMineRextras ( Как объяснено здесь), где номер моего events более 80000. Запуск функции выдает ошибку:

Ошибка в матрице (ИСТИНА, nrow = nbstate, ncol = nevent):
недопустимое значение 'nrow' (слишком большое или NA)
Дополнительно: предупреждающее сообщение:
В матрице (ИСТИНА, nrow = nbstate, ncol = nevent):
НС введены путем принуждения в целочисленный диапазон

0 ответов

Другие вопросы по тегам