Ошибка при настройке фрейма данных
Когда я пытаюсь создать последовательность для своего анализа последовательности состояний в данных справочной службы ИТ с использованием пакетов TraMineR
а также reshape2
Я получаю ошибку
Error in `[.data.frame`(x, r, vars, drop = drop) :
undefined columns selected
Данные отформатированы, как показано ниже:
Object_ID Changed_by Team_ID Change_Date Sequence Time_1 Time_2 Time_Elapsed
0003DDF7 Jan S SDM 2/9/2015 12:33 1 12:33 12:33 0
0003DDF7 George V TM 2/9/2015 14:15 2 12:33 1.7
0003DDF7 Eric K TM 2/9/2015 17:06 3 12:33 4.55
0004D2A0 Jean C SDM 13/03/2015 12:33 1 8:39 8:39 0
Код, который выполняется:
#Load Libraries
library(TraMineR)
library(reshape2)
setwd("H:/SSA")
# Original Dataset
Tickets<-read.csv("ThreeTickets.csv",sep=",")
fix(Tickets)
TicketsUnique<-unique(Tickets)
fix(Tickets)
TicketsTrans<-dcast(TicketsUnique, Object_ID ~ Time.Elapsed, value.var="Team_ID", fun.aggregate=length)
help(dcast)
fix(TicketsTrans)
#Create Alphabet
TicketsTrans.alphab<-c('SDM','TM','Automation Server SQL')
TicketsTrans.lab<-c('SDM','TM','Automation Server SQL')
#Create the sequence
TicketsTrans.seq <- seqdef(TicketsTrans, 2:14, alphabet = TicketsTrans.alphab, labels = TicketsTrans.lab, xtstep = 8)
Но когда я пытаюсь выполнить последнюю строку кода, я получаю сообщение об ошибке, как я уже говорил выше.
Выход из TicketTrans
выглядит как показано ниже:
Object_ID 0 0.4 0.83 1.7 4.55 4.57 35.44 37.07 37.07 var12 var13 var14
0003DDF7 2 0 0 3 6 8 3 0 0
0004D2A0 8 11 0 0 0 0 0 0 0
0005BE2A 2 0 4 0 0 0 0 5 11
1 ответ
От вас выдержка из TicketTrans
последние три столбца кажутся неопределенными. Кроме того, есть дублирующий заголовок столбца (37.07
). Это может быть причиной ошибки, которую вы получаете.
Теперь, независимо от этой ошибки, содержание TicketTrans
мне кажется любопытным Из ваших исходных данных я понимаю, что переменная sequence
указывает на состояние, которое длится Time_Elapsed
время от Time_1
, Тогда для случая 0003DDF7
у вас должно быть государство 1 and 2 and 3
в столбце 1 укажите 2 and 3
в следующих трех столбцах укажите 3
в колонке с надписью "4.55
и государство 0
в следующих столбцах.