Как установить эталонное время в Стэнфорде SUTime

Я использую библиотеки времени Stanford NLPCore SU для создания временного синтаксического анализатора. У меня проблемы с настройкой эталонного времени. Вот мой код:

public static String dateFormatString = "yyyy-MM-dd HH:mm";
private static void setup() {
    try {
        String defs_sutime = rulesFiles + "/defs.sutime.txt";
        String holiday_sutime = rulesFiles + "/english.holidays.sutime.txt";
        String _sutime = rulesFiles + "/english.sutime.txt";
        pipeline = new AnnotationPipeline();
        Properties props = new Properties();
        String sutimeRules = defs_sutime + "," + holiday_sutime
                + "," + _sutime;
        props.setProperty("sutime.rules", sutimeRules);
        props.setProperty("sutime.binders", "0");
        props.setProperty("sutime.markTimeRanges", "true");
        props.setProperty("sutime.includeRange", "true");
        pipeline.addAnnotator(new TokenizerAnnotator(false));
        pipeline.addAnnotator(new TimeAnnotator("sutime", props));
     } catch (Exception e) {
        e.printStackTrace();
     }
}
public void annotateText(String text, String referenceDate) {
    try {
        if (pipeline != null) {
            Annotation annotation = new Annotation(text);
            annotation.set(CoreAnnotations.DocDateAnnotation.class, referenceDate);
            pipeline.annotate(annotation);
            List<CoreMap> timexAnnsAll = annotation.get(TimeAnnotations.TimexAnnotations.class);
            for (CoreMap cm : timexAnnsAll) {
                try {
                    Temporal temporal = cm.get(TimeExpression.Annotation.class).getTemporal();

                    System.out.println("Token text : " + cm.toString());
                    System.out.println("Temporal Value : " + temporal.toString());
                    System.out.println("Timex : " + temporal.getTimexValue());

                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        } else {
            System.out.println("Annotation Pipeline object is NULL");
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
} 

public static void main (String [] args) {
    UnderstandTime time = new UnderstandTime();
    setup();
    time.annotateText("20 minutes from now", "2015-07-20 10:00");
}

Вывод показывает:

Текст токена: через 20 минут

Временное значение: 2015-07-20T00: 20

Timex: 2015-07-20T00: 20

Контрольное время он выбирает в 00:00. Тот же вывод при вводе "20 минут спустя"

1 ответ

Строка с указанием даты и времени должна быть в формате ISO, принятом в date parser code, Попробуйте разделить дату и время с помощью T а не пробел (не проверено):

time.annotateText("20 minutes from now", "2015-07-20T10:00");
Другие вопросы по тегам