Описание тега mahout

Проект масштабируемого машинного обучения с открытым исходным кодом Apache Mahout
1 ответ

Mahout (0,8) CVB VectorDump

Я пытаюсь запустить CVB для каталога файлов с простым текстом, следуя процедуре, описанной ниже. Тем не менее, я не могу видеть vectordump (шаг 6). Запустите без флага "-c csv", сгенерированный файл будет пустым. Однако, если я использую флаг "-c cs…
25 янв '14 в 21:27
1 ответ

Ошибка пространства кучи Java при запуске задания сходства элементов mahout в Amazon EMR

Я пытаюсь выполнить задание сходства элементов mahout на входе, состоящем из ~250 миллионов пар (строка) в кластере Amazon EMR (m3.2xLarge,10 основных узлов). Я сталкиваюсь с ошибкой размера кучи Java при выполнении задания сходства. Вещи, которые я…
06 янв '15 в 10:01
0 ответов

Mahout K-Means: не найдены входные кластеры

Я использую версию Mahout 0.9 на самой последней версии Hadoop. В алгоритме K-Means я преобразовываю входные данные в векторы по мере необходимости. Я выполнил следующую команду, чтобы запустить K-Means: mahout kmeans -i /user/ubuntu/Test/Vec/tfidf-…
27 ноя '15 в 17:21
1 ответ

Иерархическая кластеризация текста в масштабе

У меня есть большой набор данных (миллиарды записей), который почти полностью состоит из категориальных переменных. Эти данные будут использованы для прогнозирования довольно редкого численного результата. Большинство атрибутов имеют большую мощност…
1 ответ

Инверсия матриц, умножение и собственные вычисления в Hadoop

Мне нужно выполнить эти три шага: - Найти инверсию квадратной симметричной матрицы - Умножить результат на другую квадратную симметричную матрицу - Наконец, найти собственные векторы и собственные значения результирующей матрицы Код Python: S_i = np…
26 сен '14 в 05:38
1 ответ

Запуск mahout с использованием hadoop на EMR/EC2 Amazon

Я хочу перенести мой текущий локальный кластер hadoop в Amazon . В этом кластере hadoop я использую такие сервисы, как mahout, hbase и hive. У меня есть два варианта в Амазонке: использовать только чистые инстансы EC2 или кластер сокращения упругой …
0 ответов

Mahout возвращает одинаковые результаты в последовательных прогонах

Я пытаюсь пример Apache Mahout, используя код ниже. Все работает отлично, за исключением того, что каждый раз, когда я меняю значение userId, мне нужно дважды запустить класс, чтобы возвращались новые значения. Под этим я подразумеваю, что каждый ра…
09 май '14 в 17:24
1 ответ

Mahout: отсутствует класс для создания файлов последовательности

Я следую инструкциям на сайте mahout для преобразования существующего файла в файл последовательности: VectorWriter vectorWriter = SequenceFile.createWriter(filesystem, configuration, outfile, LongWritable.class, SparseVector.class); long numDocs = …
2 ответа

Что означает, что Mahout построен на Hadoop?

Я читал, что Mahout разработан на Hadoop, и что мы можем использовать Mahout с Hadoop или без него. Что это значит, говоря, что алгоритмы Mahout могут работать на Hadoop? Алгоритмы Mahout написаны не в форме Map-Reduce, верно? Не могли бы вы объясни…
29 май '13 в 08:08
1 ответ

Ошибка Mahout с Hadoop2.2

Я пытаюсь выполнить задание mapreduce для разбора XML с использованием библиотеки mahout 0.9 в Hadoop 2.2. Но я получаю следующую ошибку: 14/02/24 16:03:02 INFO mapreduce.Job: Task Id : attempt_1393235568433_0004_m_000000_0, Status : FAILED Error: …
24 фев '14 в 10:45
1 ответ

LDA Mahout только одна тема

Я пытаюсь следовать примеру использования LDA для данных Reuters, как указано в книге Mahout In Action. Однако, независимо от того, сколько раз я его запускаю, я всегда получаю только одну тему. Я выполнил команду как указано: mahout lda -i reuters-…
28 июн '12 в 19:58
1 ответ

Hadoop: Все датоданы 127.0.0.1:50010 плохие. Aborting

Я запускаю пример из Apache Mahout 0.9 (org.apache.mahout.classifier.df.mapreduce.BuildForest) с использованием реализации PartialBuilder на Hadoop, но я получаю сообщение об ошибке, независимо от того, что я пытаюсь. Ошибка: 14/12/10 10:58:36 INFO …
10 дек '14 в 20:06
2 ответа

mahout не запустится Что-нибудь делать с совместимой версией между hadoop и mahout?

Я новичок в Hadoop, а не сказать Mahout. Я надеюсь, что кто-то может помочь мне пройти здесь.. пытался в течение 2 дней..У меня уже работает кластер hadoop.Я использую hadoop-2.0.0-alpha.Я установил mahout (ahout-distribution-0.7) и maven-2.2.1 (пос…
01 авг '12 в 02:23
1 ответ

Mahout - кластеризация - "именование" элементов кластера

Я провожу некоторые исследования и играю с Apache Mahout 0.6 Моя цель - создать систему, которая будет называть различные категории документов на основе пользовательского ввода. Документы не известны заранее, и я не знаю также, какие категории я име…
12 июн '12 в 12:18
1 ответ

Ошибка при запуске примера навеса в mahout

Я хочу запустить пример сени в mahout, но я получаю сообщение об ошибке: Предупреждение: $HADOOP_HOME устарела. Запуск на hadoop с использованием /usr/local/hadoop/bin/hadoop и HADOOP_CONF_DIR= MAHOUT-JOB: /usr/local/mahout-distribution-0.7/examples…
28 мар '14 в 16:10
1 ответ

Получение результата классификации от mahout

Наконец я смог обучить классификатор mahout, теперь моя проблема в том, как я могу получить целевую категорию для моего входного документа. Как происходит получение целевой категории для моих текстовых документов?
15 янв '13 в 05:49
1 ответ

datastax mahout не может создавать векторы TFIDF из индексации datastax solr

Я запускаю datastax 4.5 mahout для индексации solr, созданной datastax 4.5. dse mahout lucene.vector --dir /var/lib/cassandra/data/solr.data/test.test/index/ --field body --dictOut $WORK_DIR/solr/wikipedia/dict.txt --output $WORK_DIR/solr/wikipedia/…
15 окт '14 в 12:51
1 ответ

Включить классы математических библиотек Mahout из основных и математических папок - Eclipse - Hadoop

Моя проблема похожа на эту: как мне собрать / запустить эту простую программу Mahout без исключений?, но немного сложнее. Я пишу код Hadoop и хотел бы использовать математические библиотеки Mahout (например, классы SparseRowMatrix и VectorWritable).…
31 июл '12 в 13:19
1 ответ

Плагин Grails Mahout с фоновым заданием (quartz2)

Я новичок в Grails. Я использую плагин Mahout Recommender для создания движка Recommender. Я следую этому уроку. Он отлично работает для меня. Теперь, что я пытаюсь сделать, я просто хочу сделать эту Рекомендацию Mahout, используя Background JOB. Та…
17 июл '13 в 07:11
0 ответов

Hadoop не может распознать библиотеку mahout

Я пытаюсь запустить пример в http://chimpler.wordpress.com/2013/06/24/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages-part-2-distribute-classification-with-hadoop/comment-page-1/, но столкнулся с проблемой, посколь…
08 сен '13 в 05:02