Как установить эталонное время в Стэнфорде SUTime
Я использую библиотеки времени Stanford NLPCore SU для создания временного синтаксического анализатора. У меня проблемы с настройкой эталонного времени. Вот мой код:
public static String dateFormatString = "yyyy-MM-dd HH:mm";
private static void setup() {
try {
String defs_sutime = rulesFiles + "/defs.sutime.txt";
String holiday_sutime = rulesFiles + "/english.holidays.sutime.txt";
String _sutime = rulesFiles + "/english.sutime.txt";
pipeline = new AnnotationPipeline();
Properties props = new Properties();
String sutimeRules = defs_sutime + "," + holiday_sutime
+ "," + _sutime;
props.setProperty("sutime.rules", sutimeRules);
props.setProperty("sutime.binders", "0");
props.setProperty("sutime.markTimeRanges", "true");
props.setProperty("sutime.includeRange", "true");
pipeline.addAnnotator(new TokenizerAnnotator(false));
pipeline.addAnnotator(new TimeAnnotator("sutime", props));
} catch (Exception e) {
e.printStackTrace();
}
}
public void annotateText(String text, String referenceDate) {
try {
if (pipeline != null) {
Annotation annotation = new Annotation(text);
annotation.set(CoreAnnotations.DocDateAnnotation.class, referenceDate);
pipeline.annotate(annotation);
List<CoreMap> timexAnnsAll = annotation.get(TimeAnnotations.TimexAnnotations.class);
for (CoreMap cm : timexAnnsAll) {
try {
Temporal temporal = cm.get(TimeExpression.Annotation.class).getTemporal();
System.out.println("Token text : " + cm.toString());
System.out.println("Temporal Value : " + temporal.toString());
System.out.println("Timex : " + temporal.getTimexValue());
} catch (Exception e) {
e.printStackTrace();
}
}
} else {
System.out.println("Annotation Pipeline object is NULL");
}
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main (String [] args) {
UnderstandTime time = new UnderstandTime();
setup();
time.annotateText("20 minutes from now", "2015-07-20 10:00");
}
Вывод показывает:
Текст токена: через 20 минут
Временное значение: 2015-07-20T00: 20
Timex: 2015-07-20T00: 20
Контрольное время он выбирает в 00:00. Тот же вывод при вводе "20 минут спустя"
1 ответ
Строка с указанием даты и времени должна быть в формате ISO, принятом в date parser code
, Попробуйте разделить дату и время с помощью T
а не пробел (не проверено):
time.annotateText("20 minutes from now", "2015-07-20T10:00");