Ищу какую-то существительную модель классификации

Все. В последнее время я думаю о том, как поместить слова в категорию или что-то в этом роде, когда я изучаю НЛП. Например, если я попытаюсь научить компьютер понимать "яблоко", я также хочу, чтобы он понимал, что "яблоко" принадлежит "фрукту", так что он изучит это "фруктовое дерево" и поймет что-то вроде:

   fruit
     /\----
    /  \   \
apple  kiwi  pear

и это будет полезно, даже когда я хочу преподавать что-то вроде: автомобили являются своего рода транспортным средством, и поэтому некоторые другие виды транспорта включают: мотоциклы, самолеты и так далее.

Кто-нибудь знает, могу ли я найти какие-нибудь бумаги или демоверсии, работающие над этим? Благодарю.

Анды

2 ответа

На самом деле, SKOS (Простая система организации знаний) хорошо подходит для этого. Это специализированный семантический язык, образованный от RDF.

Существует множество "больших" наборов данных, таких как тезаурус ЮНЕСКО (EN/RU/FR/ES), тезаурус BNF (FR), ... Это всего лишь пример среди многих других

Ссылка на документацию СКОСа

WordNet из Принстона содержит некоторую информацию о классификации существительных. Я бы порекомендовал формат базы данных RDF, который вы можете использовать для изучения того, какие отношения у него есть (а какие отсутствуют).

Например:

Хотя WordNet может сопоставлять значения друг с другом, перед вами встает более сложная проблема: как определить значение слова в контексте в первую очередь. Например, "яблоко" - это дерево или фрукт?

Другие вопросы по тегам