WordNet, расширение запросов, шаг за шагом

Я хочу создать проект по расширению запросов с использованием WordNet, но сложно найти пошаговый метод для этого.

Основываясь на этой статье, я должен предпринять следующие шаги (принимая предложение в качестве входных данных для программы):

  1. лексемизацию
  2. Пометка части речи
  3. Основное слово
  4. Слово смысл двусмысленности
  5. Семантическое сходство между двумя синтаксисами (это все еще сбивает с толку)

... и тогда мы можем заключить, что слово с большим счетом является расширением запроса от ввода. Тем не менее, я все еще не понимаю, как выполнить каждый из этих шагов. Есть ли источник, который описывает их более подробно?

1 ответ

Решение

Query Expansion - это огромное поле само по себе в IR (информационный поиск).

Кроме того, WordNet сам по себе огромен, и поэтому трудно найти пошаговые инструкции. Тем не менее, есть тонны очень хороших ресурсов. Я начал с этого, взяв несколько веб-примеров и попробовав их сам.

Ресурсы, которые вы найдете полезными для начала.

  1. Сам сайт Wordnet (с примерами)
  2. Страница Википедии WordNet
  3. Python Programming.net имеет учебную страницу WordNet
  4. Даже если вы не знаете Python, я очень рекомендую книгу О'Рейли "Обработка естественного языка с помощью Python". Это сайт имеет множество примеров, чтобы вы начали.

Надеюсь, что это поможет вам начать.

Другие вопросы по тегам