Пространство: неверная дата, указанная нер

Я использую просторную библиотеку, чтобы идентифицировать сущность из текста. Когда я передал текст объекту nlp, он неправильно идентифицирует дату.

текст: встретимся 9 октября - 8 утра

Выявлено ->

9 (как кардинал)

8 октября (дата)

Обязательно ->

9 октября (как дата)

8 утра (как время)

Не могли бы вы помочь мне, как я мог решить эту проблему. Я новичок в НЛП.

С уважением, Аман

1 ответ

Простота это хорошо, но не идеально. Похоже, лучшая стратегия - разделить текст, возможно, используя что-то вроде этого:

text = 'meet me 9 Oct. - 8 am'
sections = text.split(' - ')
for section in sections:
    doc = nlp(section)
    for ent in doc.ents:
        print(ent, ent.label_)

Конечно, этот код не работает, если в тексте более одного дефиса, но вы поняли идею.

Другие вопросы по тегам