Я пытаюсь извлечь семантическую информацию из текста
Я использую Java.
До сих пор я реализовал детектор предложений, токенизатор и использую WORDNET LIBRARY (через JAWS api), чтобы найти различное значение слов.
По сути, я хочу извлечь семантику / контекст предложения, чтобы его можно было использовать для улучшения результатов поисковой системы.
Пожалуйста, поделитесь любой информацией, которая, по вашему мнению, мне поможет, любые инструменты, API и т. Д.
1 ответ
Хотя я вижу, что благодаря использованию WORDNET вы применяете онтологический подход к семантическому анализу, я просто хотел бы сказать, что хорошие результаты были получены (не только мной, но и Google и Википедией), просто взглянув на относительное совпадение слов, т. е. как часто они используются в непосредственной близости друг от друга и благодаря этому подразумевается, что они в некоторой степени связаны по смыслу.
Например, используя скрытый семантический анализ
Я не пытаюсь подтолкнуть вас в каком-либо направлении. Я просто оказался в похожей ситуации несколько лет назад и добился успеха при использовании вышеуказанного подхода.
Удачи