WordNet, расширение запросов, шаг за шагом
Я хочу создать проект по расширению запросов с использованием WordNet, но сложно найти пошаговый метод для этого.
Основываясь на этой статье, я должен предпринять следующие шаги (принимая предложение в качестве входных данных для программы):
- лексемизацию
- Пометка части речи
- Основное слово
- Слово смысл двусмысленности
- Семантическое сходство между двумя синтаксисами (это все еще сбивает с толку)
... и тогда мы можем заключить, что слово с большим счетом является расширением запроса от ввода. Тем не менее, я все еще не понимаю, как выполнить каждый из этих шагов. Есть ли источник, который описывает их более подробно?
1 ответ
Query Expansion - это огромное поле само по себе в IR (информационный поиск).
Кроме того, WordNet сам по себе огромен, и поэтому трудно найти пошаговые инструкции. Тем не менее, есть тонны очень хороших ресурсов. Я начал с этого, взяв несколько веб-примеров и попробовав их сам.
Ресурсы, которые вы найдете полезными для начала.
- Сам сайт Wordnet (с примерами)
- Страница Википедии WordNet
- Python Programming.net имеет учебную страницу WordNet
- Даже если вы не знаете Python, я очень рекомендую книгу О'Рейли "Обработка естественного языка с помощью Python". Это сайт имеет множество примеров, чтобы вы начали.
Надеюсь, что это поможет вам начать.