Скрытый семантический анализ и стемминг

Предположим, что очень большой корпус любого негибкого языка. Имеет ли смысл следующее? Применяя LSA к такому корпусу, слова с похожими понятиями сходятся вместе в векторном пространстве, таким образом, наклоненные формы слов, относящиеся к одному и тому же понятию, в идеале должны совпадать с их леммой в пространстве. При таком допущении любая лемматизация или основание запросов или корпуса не являются необходимыми. Или я совершенно не прав?

0 ответов

По словам основателей АЛП, останавливать не нужно. Хотя, я думаю, что в литературе по этому поводу есть общее разногласие. Я прочитал несколько статей, в которых было найдено, что основа для улучшения результатов для конкретной задачи поиска информации.

Как правило, есть недавние исследования, которые показывают, что основа не помогает в моделировании темы и может даже повредить согласованность темы.

Другие вопросы по тегам