Как я могу получить определение смысла в смысловом модуле NLTK?

В НЛТК senseval модуль, чувства имеют форму HARD1, HARD2и т. д. (см. источник здесь). Однако, кажется, нет способа получить фактическое определение. Я пытаюсь реализовать алгоритм Леска и сейчас пытаюсь проверить, является ли смысл, предсказанный алгоритмом Леска, правильным (используя определение из WordNet).

Проблема, с которой я сталкиваюсь, состоит в том, как объединить определение WordNet с senseval ответ (HARD1, HARD2). Кто-нибудь знает, как перевести смысл SENSEVAL в определение, или найти его где-нибудь?

1 ответ

Решение

В итоге я обнаружил, что они соответствуют чувствам в WordNet 1.7, который довольно архаичен (кажется, его нелегко установить в Mac OS X или Ubuntu 11.04).

Нет онлайн-версий WordNet 1.7, которые я мог бы найти.

Этот сайт также содержит полезную информацию об этих трех корпусах. Например, он говорит, что шесть чувств interest были взяты из словаря английского языка Longman (около 2001 г.). Смотрите здесь

Он описывает источник HARD как WordNet 1.7.

В конечном итоге я вручную сопоставил определения с определениями в WordNet 3.0. Если вам интересно, вот словарь. Обратите внимание, однако, что я не специалист по лингвистике, и они не точны

# A map of SENSEVAL senses to WordNet 3.0 senses.
# SENSEVAL-2 uses WordNet 1.7, which is no longer installable on most modern
# machines and is not the version that the NLTK comes with.
# As a consequence, we have to manually map the following
# senses to their equivalent(s).
SV_SENSE_MAP = {
    "HARD1": ["difficult.a.01"],    # not easy, requiring great physical or mental
    "HARD2": ["hard.a.02",          # dispassionate
              "difficult.a.01"],
    "HARD3": ["hard.a.03"],         # resisting weight or pressure
    "interest_1": ["interest.n.01"], # readiness to give attention
    "interest_2": ["interest.n.03"], # quality of causing attention to be given to
    "interest_3": ["pastime.n.01"],  # activity, etc. that one gives attention to
    "interest_4": ["sake.n.01"],     # advantage, advancement or favor
    "interest_5": ["interest.n.05"], # a share in a company or business
    "interest_6": ["interest.n.04"], # money paid for the use of money
    "cord": ["line.n.18"],          # something (as a cord or rope) that is long and thin and flexible
    "formation": ["line.n.01","line.n.03"], # a formation of people or things one beside another
    "text": ["line.n.05"],                 # text consisting of a row of words written across a page or computer screen
    "phone": ["telephone_line.n.02"],   # a telephone connection
    "product": ["line.n.22"],       # a particular kind of product or merchandise
    "division": ["line.n.29"],      # a conceptual separation or distinction
    "SERVE12": ["serve.v.02"],       # do duty or hold offices; serve in a specific function
    "SERVE10": ["serve.v.06"], # provide (usually but not necessarily food)
    "SERVE2": ["serve.v.01"],       # serve a purpose, role, or function
    "SERVE6": ["service.v.01"]      # be used by; as of a utility
}
Другие вопросы по тегам