Ищу какую-то существительную модель классификации
Все. В последнее время я думаю о том, как поместить слова в категорию или что-то в этом роде, когда я изучаю НЛП. Например, если я попытаюсь научить компьютер понимать "яблоко", я также хочу, чтобы он понимал, что "яблоко" принадлежит "фрукту", так что он изучит это "фруктовое дерево" и поймет что-то вроде:
fruit
/\----
/ \ \
apple kiwi pear
и это будет полезно, даже когда я хочу преподавать что-то вроде: автомобили являются своего рода транспортным средством, и поэтому некоторые другие виды транспорта включают: мотоциклы, самолеты и так далее.
Кто-нибудь знает, могу ли я найти какие-нибудь бумаги или демоверсии, работающие над этим? Благодарю.
Анды
2 ответа
На самом деле, SKOS (Простая система организации знаний) хорошо подходит для этого. Это специализированный семантический язык, образованный от RDF.
Существует множество "больших" наборов данных, таких как тезаурус ЮНЕСКО (EN/RU/FR/ES), тезаурус BNF (FR), ... Это всего лишь пример среди многих других
WordNet из Принстона содержит некоторую информацию о классификации существительных. Я бы порекомендовал формат базы данных RDF, который вы можете использовать для изучения того, какие отношения у него есть (а какие отсутствуют).
Например:
Хотя WordNet может сопоставлять значения друг с другом, перед вами встает более сложная проблема: как определить значение слова в контексте в первую очередь. Например, "яблоко" - это дерево или фрукт?