Описание тега mahout
Проект масштабируемого машинного обучения с открытым исходным кодом Apache Mahout
1
ответ
Mahout (0,8) CVB VectorDump
Я пытаюсь запустить CVB для каталога файлов с простым текстом, следуя процедуре, описанной ниже. Тем не менее, я не могу видеть vectordump (шаг 6). Запустите без флага "-c csv", сгенерированный файл будет пустым. Однако, если я использую флаг "-c cs…
25 янв '14 в 21:27
1
ответ
Ошибка пространства кучи Java при запуске задания сходства элементов mahout в Amazon EMR
Я пытаюсь выполнить задание сходства элементов mahout на входе, состоящем из ~250 миллионов пар (строка) в кластере Amazon EMR (m3.2xLarge,10 основных узлов). Я сталкиваюсь с ошибкой размера кучи Java при выполнении задания сходства. Вещи, которые я…
06 янв '15 в 10:01
0
ответов
Mahout K-Means: не найдены входные кластеры
Я использую версию Mahout 0.9 на самой последней версии Hadoop. В алгоритме K-Means я преобразовываю входные данные в векторы по мере необходимости. Я выполнил следующую команду, чтобы запустить K-Means: mahout kmeans -i /user/ubuntu/Test/Vec/tfidf-…
27 ноя '15 в 17:21
1
ответ
Иерархическая кластеризация текста в масштабе
У меня есть большой набор данных (миллиарды записей), который почти полностью состоит из категориальных переменных. Эти данные будут использованы для прогнозирования довольно редкого численного результата. Большинство атрибутов имеют большую мощност…
25 июн '15 в 17:42
1
ответ
Инверсия матриц, умножение и собственные вычисления в Hadoop
Мне нужно выполнить эти три шага: - Найти инверсию квадратной симметричной матрицы - Умножить результат на другую квадратную симметричную матрицу - Наконец, найти собственные векторы и собственные значения результирующей матрицы Код Python: S_i = np…
26 сен '14 в 05:38
1
ответ
Запуск mahout с использованием hadoop на EMR/EC2 Amazon
Я хочу перенести мой текущий локальный кластер hadoop в Amazon . В этом кластере hadoop я использую такие сервисы, как mahout, hbase и hive. У меня есть два варианта в Амазонке: использовать только чистые инстансы EC2 или кластер сокращения упругой …
14 фев '14 в 07:44
0
ответов
Mahout возвращает одинаковые результаты в последовательных прогонах
Я пытаюсь пример Apache Mahout, используя код ниже. Все работает отлично, за исключением того, что каждый раз, когда я меняю значение userId, мне нужно дважды запустить класс, чтобы возвращались новые значения. Под этим я подразумеваю, что каждый ра…
09 май '14 в 17:24
1
ответ
Mahout: отсутствует класс для создания файлов последовательности
Я следую инструкциям на сайте mahout для преобразования существующего файла в файл последовательности: VectorWriter vectorWriter = SequenceFile.createWriter(filesystem, configuration, outfile, LongWritable.class, SparseVector.class); long numDocs = …
11 мар '15 в 14:06
2
ответа
Что означает, что Mahout построен на Hadoop?
Я читал, что Mahout разработан на Hadoop, и что мы можем использовать Mahout с Hadoop или без него. Что это значит, говоря, что алгоритмы Mahout могут работать на Hadoop? Алгоритмы Mahout написаны не в форме Map-Reduce, верно? Не могли бы вы объясни…
29 май '13 в 08:08
1
ответ
Ошибка Mahout с Hadoop2.2
Я пытаюсь выполнить задание mapreduce для разбора XML с использованием библиотеки mahout 0.9 в Hadoop 2.2. Но я получаю следующую ошибку: 14/02/24 16:03:02 INFO mapreduce.Job: Task Id : attempt_1393235568433_0004_m_000000_0, Status : FAILED Error: …
24 фев '14 в 10:45
1
ответ
LDA Mahout только одна тема
Я пытаюсь следовать примеру использования LDA для данных Reuters, как указано в книге Mahout In Action. Однако, независимо от того, сколько раз я его запускаю, я всегда получаю только одну тему. Я выполнил команду как указано: mahout lda -i reuters-…
28 июн '12 в 19:58
1
ответ
Hadoop: Все датоданы 127.0.0.1:50010 плохие. Aborting
Я запускаю пример из Apache Mahout 0.9 (org.apache.mahout.classifier.df.mapreduce.BuildForest) с использованием реализации PartialBuilder на Hadoop, но я получаю сообщение об ошибке, независимо от того, что я пытаюсь. Ошибка: 14/12/10 10:58:36 INFO …
10 дек '14 в 20:06
2
ответа
mahout не запустится Что-нибудь делать с совместимой версией между hadoop и mahout?
Я новичок в Hadoop, а не сказать Mahout. Я надеюсь, что кто-то может помочь мне пройти здесь.. пытался в течение 2 дней..У меня уже работает кластер hadoop.Я использую hadoop-2.0.0-alpha.Я установил mahout (ahout-distribution-0.7) и maven-2.2.1 (пос…
01 авг '12 в 02:23
1
ответ
Mahout - кластеризация - "именование" элементов кластера
Я провожу некоторые исследования и играю с Apache Mahout 0.6 Моя цель - создать систему, которая будет называть различные категории документов на основе пользовательского ввода. Документы не известны заранее, и я не знаю также, какие категории я име…
12 июн '12 в 12:18
1
ответ
Ошибка при запуске примера навеса в mahout
Я хочу запустить пример сени в mahout, но я получаю сообщение об ошибке: Предупреждение: $HADOOP_HOME устарела. Запуск на hadoop с использованием /usr/local/hadoop/bin/hadoop и HADOOP_CONF_DIR= MAHOUT-JOB: /usr/local/mahout-distribution-0.7/examples…
28 мар '14 в 16:10
1
ответ
Получение результата классификации от mahout
Наконец я смог обучить классификатор mahout, теперь моя проблема в том, как я могу получить целевую категорию для моего входного документа. Как происходит получение целевой категории для моих текстовых документов?
15 янв '13 в 05:49
1
ответ
datastax mahout не может создавать векторы TFIDF из индексации datastax solr
Я запускаю datastax 4.5 mahout для индексации solr, созданной datastax 4.5. dse mahout lucene.vector --dir /var/lib/cassandra/data/solr.data/test.test/index/ --field body --dictOut $WORK_DIR/solr/wikipedia/dict.txt --output $WORK_DIR/solr/wikipedia/…
15 окт '14 в 12:51
1
ответ
Включить классы математических библиотек Mahout из основных и математических папок - Eclipse - Hadoop
Моя проблема похожа на эту: как мне собрать / запустить эту простую программу Mahout без исключений?, но немного сложнее. Я пишу код Hadoop и хотел бы использовать математические библиотеки Mahout (например, классы SparseRowMatrix и VectorWritable).…
31 июл '12 в 13:19
1
ответ
Плагин Grails Mahout с фоновым заданием (quartz2)
Я новичок в Grails. Я использую плагин Mahout Recommender для создания движка Recommender. Я следую этому уроку. Он отлично работает для меня. Теперь, что я пытаюсь сделать, я просто хочу сделать эту Рекомендацию Mahout, используя Background JOB. Та…
17 июл '13 в 07:11
0
ответов
Hadoop не может распознать библиотеку mahout
Я пытаюсь запустить пример в http://chimpler.wordpress.com/2013/06/24/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages-part-2-distribute-classification-with-hadoop/comment-page-1/, но столкнулся с проблемой, посколь…
08 сен '13 в 05:02