Как сопоставить образец SVO с Textacy

Как вы используете Textacy's pos_regex_match() способ найти тройки субъект-глагол-объект, используя их синтаксис псевдо-регулярного выражения? И да, я в курсе textacy.extract.subject_verb_object_triples(), но эта функция очень неточная и находит очень мало, поэтому я пытаюсь создать что-то более надежное.

Для текста:

text = "He recently wrote the sky is full of stars."

Я пытаюсь:

svo_pattern = r'<DET>? <NOUN|PROPN|PRON>+ <VERB>?<ADV>*<VERB>+ <DET>? <NOUN|PROPN|PRON>+'
doc = textacy.Doc(text)
for sent in sents:
    matches = list(textacy.extract.pos_regex_matches(sent, svo_pattern))
    print(matches)

но ничего не находит. Какой недостаток в моем образце? Я играл с несколькими вариантами этого, но ничего не соответствует.

0 ответов

Другие вопросы по тегам