Как написать пользовательские правила для sutime в stanford temporal tagger?
Stanford temporal tagger работает нормально в большинстве случаев. Например, "Я должен быть в школе завтра к 9 часам". имеет 9 часов как время. Но SUTime не идентифицирует это:(
Поэтому я хочу добавить правило, основанное на этом. Какие-либо предложения?
Я использую это
1 ответ
Решение
Я добавил это правило прямо под правилом "9 часов":
{ ( (?: /the/ /hour/ /of/?)? ([ $INT & { numcompvalue<=24 } ]) (/'/ /o/ /clock/)) => IsoTime($1[0].numcompvalue, 0, NIL) }
в:
Edu / Стэнфорд / NLP / модель / sutime / english.sutime.txt
и смог распознать шаблон, который вы описали.
Обратите внимание, что токенизатор разбивает "9'o clock" на ["9", "'", "o", "clock"].
В общем, если вы добавляете правила в этот файл, вы можете добавлять собственные шаблоны для случаев, которые вы хотите охватить. Этот файл можно найти в этом банке:
Стэнфорд-corenlp-3.5.2-models.jar