НЛП подходит для определения даты / времени в тексте

Мне нужно разработать приложение, которое идентифицирует дату внутри данного текста, используя некоторый подход НЛП. Давайте предположим, что у меня есть данные в БД с колонками дат "от", "до", и если текст ниже,

Get data between 1st August and 15th August

Мне нужно определить даты и сформировать запрос для получения данных. Я использовал Natty NLP и смог определить даты. Но я застрял для более сложных выражений времени, таких как:

Get data uploaded next week
Get data uploaded last week

Здесь для первого мне нужно определить дату следующей недели в понедельник и дату воскресенья и сформировать такой же запрос для второго. Но с Нетти это дает мне следующую неделю с сегодняшнего свидания. Какие еще решения существуют? Или мне нужно манипулировать выражением путем кодирования? Я использую Java.

Заранее спасибо.

1 ответ

Ваши вопросы немного сбивают с толку, но я думаю, вы хотите достичь двух вещей:

  1. Определите слова, которые представляют выражение времени

  2. Сопоставьте эти слова с формальным машиночитаемым представлением

Если это то, что вам нужно, проверьте структуру утенка, она идентифицирует выражения времени и нормализует их в единое уникальное представление формальной даты. Обратите внимание, что вам нужно передать контрольную дату для неоднозначных выражений времени.

Вы можете запустить его как сервис и вызывать его из своего кода.

Другие вопросы по тегам