НЛП подходит для определения даты / времени в тексте
Мне нужно разработать приложение, которое идентифицирует дату внутри данного текста, используя некоторый подход НЛП. Давайте предположим, что у меня есть данные в БД с колонками дат "от", "до", и если текст ниже,
Get data between 1st August and 15th August
Мне нужно определить даты и сформировать запрос для получения данных. Я использовал Natty NLP и смог определить даты. Но я застрял для более сложных выражений времени, таких как:
Get data uploaded next week
Get data uploaded last week
Здесь для первого мне нужно определить дату следующей недели в понедельник и дату воскресенья и сформировать такой же запрос для второго. Но с Нетти это дает мне следующую неделю с сегодняшнего свидания. Какие еще решения существуют? Или мне нужно манипулировать выражением путем кодирования? Я использую Java.
Заранее спасибо.
1 ответ
Ваши вопросы немного сбивают с толку, но я думаю, вы хотите достичь двух вещей:
Определите слова, которые представляют выражение времени
Сопоставьте эти слова с формальным машиночитаемым представлением
Если это то, что вам нужно, проверьте структуру утенка, она идентифицирует выражения времени и нормализует их в единое уникальное представление формальной даты. Обратите внимание, что вам нужно передать контрольную дату для неоднозначных выражений времени.
Вы можете запустить его как сервис и вызывать его из своего кода.