Есть ли в памяти реализация заданий SparseVectorsFromSequenceFiles, RowIdJob и RowSimilityJob

Question

Есть ли в памяти реализация заданий SparseVectorsFromSequenceFiles, RowIdJob и RowSimilityJob

Я работал над выполнением скрытого семантического анализа с использованием SparseVectorsFromSequenceFiles, RowIdJob а также RowSimilarityJob Задания Hadoop, предоставляемые Mahout, которые запускают задания Map/Reduce. Я пытался найти эквивалентную реализацию для этих функций, которая работает в памяти, либо в одном потоке, либо, предпочтительно, в нескольких потоках.

Что-то подобное существует?

0

hadoop mahout semantic-analysis lsa latent-semantic-analysis

Источник

user863772 02 июл '12 в 07:52

1 ответ

Другие вопросы по тегам hadoop mahout semantic-analysis lsa latent-semantic-analysis

user64174 02 июл '12 в 08:03 2012-07-02 08:03 · Answer 1 · 2012-07-02 08:03

Я не знаю, не думаю, но было бы тривиально написать. Вы просто открываете SequenceFile.Reader и для каждой записи, получить Vector от стоимости Writable и делать то, что вы хотите. Это, вероятно, 10 строк кода и не стоит инструмента.

2

Источник

user64174 02 июл '12 в 08:03