Внедрение LSA для эластичного поискового индекса

Question

Внедрение LSA для эластичного поискового индекса

Я только что провел последние пару дней, обдумывая реализацию скрытого семантического анализа для документов, которые проиндексированы в asticsearch. Первым шагом является построение матрицы термина-документа. Так что я думаю использовать библиотеку Stanford nlp, которая принимает в качестве входных данных индекс Значение в нижнем регистре, удаление стоп-слов, может быть, основание и генерирование матрицы, или это просто возможно с использованием JavaS API-интерфейс asticsearch для ее построения.?

2

java stanford-nlp elasticsearch-5 elasticsearch-plugin lsa

Источник

user7885044 19 май '17 в 10:55

1 ответ

Другие вопросы по тегам java stanford-nlp elasticsearch-5 elasticsearch-plugin lsa

user1994844 20 май '17 в 15:26 2017-05-20 15:26 · Answer 1 · 2017-05-20 15:26

Да, вы можете использовать _analyze конечная точка упругого поиска и сделать tokenizing/character mapping/stemming/... на ваш текст и получить результат обратно.

0

Источник

user1994844 20 май '17 в 15:26