Как написать пользовательские правила для sutime в stanford temporal tagger?

Stanford temporal tagger работает нормально в большинстве случаев. Например, "Я должен быть в школе завтра к 9 часам". имеет 9 часов как время. Но SUTime не идентифицирует это:(

Поэтому я хочу добавить правило, основанное на этом. Какие-либо предложения?

Я использую это

1 ответ

Решение

Я добавил это правило прямо под правилом "9 часов":

{ ( (?: /the/ /hour/ /of/?)? ([ $INT & { numcompvalue<=24 } ]) (/'/ /o/ /clock/)) => IsoTime($1[0].numcompvalue, 0, NIL) }

в:

Edu / Стэнфорд / NLP / модель / sutime / english.sutime.txt

и смог распознать шаблон, который вы описали.

Обратите внимание, что токенизатор разбивает "9'o clock" на ["9", "'", "o", "clock"].

В общем, если вы добавляете правила в этот файл, вы можете добавлять собственные шаблоны для случаев, которые вы хотите охватить. Этот файл можно найти в этом банке:

Стэнфорд-corenlp-3.5.2-models.jar

Другие вопросы по тегам