Поиск строк релевантности из нескольких текстовых файлов по модели векторного пространства
Я хочу создать Java-программу по модели векторного пространства. У меня есть несколько текстовых файлов в одной папке. Я задаю запрос и хочу, чтобы он одну за другой показывал мне строку релевантности из текстовых файлов путем вычисления подобия TF IDF и косинуса. Моя проблема в том, как я могу искать строки релевантности одну за другой из текстовых файлов, содержащих несколько строк? а как мне распечатать по очереди из текстовых файлов? Я начинающий.
Примечание: я знаю, как найти сходство двух документов с помощью TF IDF.