Как избавиться от слов в Conceptnet

Conceptnet содержит два основных типа узлов: слова (например, /c/en/cat) и смыслы (например, /c/en/cat/n/domestic_cat). К сожалению, подавляющее большинство ребер используют узлы слова. Это делает вывод затруднительным, потому что я не могу быть уверенным, к какому смыслу относится слово-слово.

Например, Conceptnet содержит 9 чувств, которые используют слово "кошка", большинство из которых являются собственными существительными (/c/en/cat/n/ музыкальный, /c/en/cat/n/magazine, /c/en/cat/n/a_spiteful_woman_gossip и т. д.). Если ребро говорит: "/c/en/cat /r/HasA /c/en/tail", я по собственному опыту знаю, что это, вероятно, относится к / c / en / cat / n / domestic_cat и никаких других чувств. Принимая во внимание, что если я вижу край, который говорит "/c/en/cat /r/IsA /c/en/fun_to_watch", я знаю, что это, вероятно, относится к / c / en / cat / n / мюзикл, но это также может быть ссылаясь на /c/en/cat/n/domestic_cat.

Как мне автоматизировать этот процесс? Как мне перевести ребра, которые используют только узлы слова, чтобы они использовали смысловые узлы?

1 ответ

В ConceptNet нет словосочетаний, см. Их FAQ:

На данный момент ConceptNet делает лишь минимальный минимум для различения смысловых значений слов - в построенном графике ConceptNet 5.5 смысловые значения слов различаются только по их части речи (аналогично sense2vec). WordNet имеет большое количество чувств для каждого слова, хотя некоторые из них трудно различить на практике.

Другие вопросы по тегам