Описание тега naivebayes

Naive Bayes is a popular (baseline) method for text-classification.
0 ответов

Полиномиальное скользящее окно наивного байесовского классификатора (реализация MOA, weka)

Я сталкиваюсь со следующей проблемой: я пытаюсь реализовать классификатор MNB в скользящем окне. Я реализовал LinkedList размера окна и храню все экземпляры потока, которые должны быть рассмотрены в нем. Когда появляется новый экземпляр, который бол…
1 ответ

Неверный тип (символ) аргумента

Это сообщение об ошибке по теме. Я получаю эту ошибку при попытке запустить классификатор naive.bayes. Вот краткая информация о моих поездах: 'data.frame': 7269 obs. of 193 variables: $ pid : int 2 4 5 7 10 11 14 18 25 31 ... $ acquir : int 0 0 0 0 …
0 ответов

Как улучшить код Python для анализа настроений с помощью NLTK

У меня есть код Python, который выполняет анализ настроений на обзорах фильмов. Я использую NLTK инструменты с NaiveBayesCassifier, Что я хочу сделать, это выполнить 10-fold cross validation, Но пока работает в командной строке, это чертовски медлен…
30 дек '16 в 23:52
2 ответа

Как использовать свой собственный файл вместо набора данных в этом коде

Я реализую этот код, и это дает мне вывод corrent, но я хочу сохранить эти четыре строки "набора данных" в файле и затем использовать его. Как я могу это сделать? Как я могу использовать свой собственный файл вместо набора данных вручную? from naive…
07 ноя '15 в 09:59
1 ответ

Наивный байес pyspark 1.3 нет ответа

Я пытаюсь запустить наивный байесовский классификатор для моих данных в PySpark 1.3 Вот мой пример данных: Используя текстовый файл, я конвертирую его в объект LabeledPoint 67,[0,1,2,3,4,5,6,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,…
1 ответ

MATLAB Наивный байесовский объект хранения

После использования: nb = NaiveBayes.fit(training, class) Чтобы создать объект наивного байесовского классификатора, я хочу сохранить N-by-D этих объектов в матрице. Я пытался сделать следующее ARRAYOFNAIVEBAYES(2,3) = nb; Но я получаю: "Ошибка при …
1 ответ

Построить наивную байесовскую кривую, используя пакеты klaR и ROCR

Здесь у меня есть задача классификации, и мне нужно использовать пакеты klaR и ROCR. Проблема в том, что кривая ROC имеет очень низкую производительность. Вот мой код: #install the klaR package for naiveBayes install.packages('klaR') library(klaR) l…
31 мар '17 в 05:17
2 ответа

Классификатор NaiveBayes, обрабатывающий различные типы данных в Python

Я пытаюсь реализовать наивный байесовский классификатор в Python. Мои атрибуты имеют разные типы данных: Strings, Int, float, Boolean, Ordinal Я мог бы использовать гауссовский наивный байесовский классификатор (Sklearn.naivebayes: пакет Python), но…
19 июн '15 в 12:01
1 ответ

Ошибка R: все аргументы должны иметь одинаковую длину

Я получил ошибку, когда я делаю наивный байесовский от R, вот мой код и ошибка library(e1071) #data train_data <- read.csv('https://raw.githubusercontent.com/JonnyyJ/data/master/train.csv',header=T) test_data <- read.csv('https://raw.githubuse…
02 дек '18 в 23:54
2 ответа

Как использовать метку времени в построении наивной байесовской модели в Python

У меня есть набор данных с меткой времени в качестве одного из столбцов в формате 09/07/2016 23:58. Я пытаюсь применить Наивный Байес к этим Данным, и я столкнулся с приведенной ниже ошибкой. Пожалуйста, дайте мне знать, как использовать эти данные …
15 дек '16 в 08:24
2 ответа

Наивный байесовский классификатор с плавающей точкой

Умножение большого количества вероятностей в наивных байесовских алгоритмах может привести к недостаточному вычислению с плавающей точкой. P(x_1,….,x_n│c) = P(x_1│c).P(x_2│c).P(x_3│c)… … P(x_n |c) Вместо использования приведенной выше формулы (приво…
30 янв '16 в 05:59
0 ответов

Можно ли установить весы для признаков при классификации с использованием наивного байесовского метода в Spark?

В моем приложении Spark я использую NaiveBayesModel для классификации текстовых документов. Допустим, моя модель выглядит так: class SomeDocument { String text; String lead; } Мой текущий подход состоит в том, чтобы маркировать весь документ, включа…
1 ответ

Классификация NaiveBayes в NLTK с использованием Python

У меня есть следующие наборы данных... набор данных Я загрузил данные, используя это import numpy as np import pandas as pd input_file = "C:/Users/User/Documents/R/exp.csv" df = pd.read_csv(input_file, header = 0) Теперь я пытаюсь сделать это... cla…
26 сен '16 в 19:40
0 ответов

Используя пакет naivebayes для прогнозирования переменной класса в R

Я пытаюсь предсказать переменную класса для набора данных в R, используя пакет naivebayes. В настоящее время у меня есть два набора данных, и он отлично работает на одном из них, но для другого я продолжал получать сообщение об ошибке: "Ошибка в [.d…
11 апр '18 в 07:35
1 ответ

Как совместить кластеризацию K-средних с наивным байесовским

Недавно я прочитал статью о K-средних и наивном байесовском подходе к обучению. Но я не совсем понимаю, как объединить эти два метода вместе. Например, X(x1,x2,x3,...,xn) обозначает запись данных. Метка обозначает класс, к которому принадлежит запис…
14 апр '16 в 08:11
1 ответ

sklearn NB классификатор: как получить фактические вероятности отдельных выборок?

Я делаю программу машинного обучения, которая классифицирует слова в одну из следующих категорий: Аппаратное обеспечение, Программное обеспечение, None_of_these. Я использую Multinomial Naive Bayes классификатор из sklearn. Функция предиката () дает…
0 ответов

Как установить частоту среза слова перед использованием näive Байеса в молотке?

Как установить частоту среза слова перед использованием näive Байеса в молотке? Можно ли установить минимальную частоту слов в pipelist? Есть ли возможности?
28 мар '18 в 14:44
1 ответ

Импортируйте CSV-файл в python, затем превратите его в массив numpy, а затем передайте его алгоритму sklearn

Алгоритм Склеарн требует функции и метки для его изучения. У меня есть файл CSV, который содержит некоторые данные. Эти данные на самом деле представляют собой проблему с веб-сайта hackerearth, на котором участнику необходимо создать алгоритм обучен…
1 ответ

Ошибка при рассоле данных в Python

Мне нужно сохранить мой тренировочный набор данных в Data Pickle. Вот код При выполнении этого кода произошла ошибка. Как мне исправить эту ошибку. Мне нужно сохранить переменные featureCounts и labelCounts в двух выводах. from __future__ import div…
01 сен '16 в 08:09
1 ответ

Как проверить классификацию с помощью sklearn

Я использую два разных алгоритма классификации для моей логистической регрессии данных и наивных байесов, но это дает мне ту же точность, даже если я изменяю соотношение данных обучения и тестирования. Ниже приведен код, который я использую import p…