Описание тега classification
In machine learning and statistics, classification is the problem of identifying which of a set of categories a new observation belongs to, on the basis of a training set of data containing observations whose category membership (label) is known.
1
ответ
В классификации почему граница Решения является свойством гипотезы, а не обучающей совокупности?
Я начал смотреть ML-ролики Эндрю Нг на Coursera. В уроке по классификации (в третьем видео) он сказал следующие строки "Еще раз, граница решения - это свойство не обучающего набора, а гипотезы и параметров. Но как только у вас есть параметры тета, э…
13 июл '17 в 06:18
1
ответ
Как посчитать сумму пикселей в каждом классе в классифицированном изображении (Landsat) в Google Earth Engine?
Я делаю диссертацию об изменениях ледника. Я провел контролируемую классификацию изображения Landsat 8 и хотел бы подсчитать, сколько пикселей в каждом классе. Я хочу сделать диаграмму, кстати. Но я застрял, мой код работает с ошибкой. Я пытался исп…
10 янв '18 в 18:00
1
ответ
Как обеспечить стоимость балансирования обучения с помощью несбалансированного набора данных о поездах, доступную в svmlight?
Стоимость в SVM у e1071 не такая же, как у svmlight. В руководстве к библиотеке e1071 приведено следующее определение ее параметра стоимости: cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular- ization term in the Lagra…
17 янв '15 в 13:50
2
ответа
Проведено обучение и валидация в gridsearchcv sklearn
Я вижу, что в gridsearchcv лучшие параметры определяются на основе cross-validation, но то, что я действительно хочу сделать, это определить лучшие параметры на основе one held out validation set вместо cross validation, Не уверен, есть ли способ сд…
14 июн '16 в 05:16
3
ответа
Матрицы точности не работают на линейной регрессии
Пожалуйста, помогите здесь: import numpy as np import pandas as pd import matplotlib.pyplot as plt X = [[1.1],[1.3],[1.5],[2],[2.2],[2.9],[3],[3.2],[3.2],[3.7],[3.9],[4],[4],[4.1],[4.5],[4.9],[5.1],[5.3],[5.9],[6],[6.8],[7.1],[7.9],[8.2],[8.7],[9],[…
30 май '18 в 05:15
1
ответ
График смежности регионов Skimage (RAG) по сегментации быстрых сдвигов
Я пытаюсь создать график смежности регионов после сегментирования изображения с помощью инструментов в Skimage пакет. Используя примеры в документации, я могу сегментировать изображение с помощью SLIC и успешно создать RAG. from skimage import data …
27 июл '16 в 18:00
1
ответ
Точность и отзыв в fastText?
Я использую fastText для классификации текста, ссылка https://github.com/facebookresearch/fastText/blob/master/tutorials/supervised-learning.md Мне было интересно, что означает точность @1 или P@5? Я сделал бинарную классификацию, но я проверил друг…
09 сен '17 в 10:54
1
ответ
Неопределенная функция или переменная 'skript_name' Matlab
Я использую открытый исходный код от Matlab: http://makerzone.mathworks.com/uncategorized/activity-detection-with-matlab/ для обнаружения активности. Все данные, которые мне нужны, находятся в zip-файле, который вы можете скачать выше. Когда я пытаю…
11 сен '16 в 13:31
0
ответов
Matlab: код Refactor Classification Learner для работы с таблицей данных размера варианта
Интерфейсный файл Classification Learner предоставляет возможность экспортировать код, который выглядит следующим образом function [trainedClassifier, validationAccuracy] = trainClassifier(datasetTable) % Convert input to table datasetTable = table(…
21 ноя '15 в 17:59
1
ответ
Обработка значений null/NaN в искровом классификаторе
У меня есть набор категориальных столбцов (строк), которые я анализирую и преобразую в векторы объектов, чтобы передать их в классификатор mllib (случайный лес). В моих входных данных некоторые столбцы имеют нулевые значения. Скажем, в одном из этих…
07 окт '15 в 17:48
1
ответ
Любая причина, почему эти экземпляры могут быть неправильно классифицированы?
Я начал с двух файлов training & testing, Затем, используя libsvm, я масштабировал оба этих файла до training.scale а также testing.scale Затем с помощью grid.py (часть libsvm) я побежал training.scale и и получил некоторые значения перекрестной про…
08 янв '15 в 05:41
0
ответов
Модель вероятности с гусианской смесью
У меня есть два класса с меткой, которые я хочу классифицировать с помощью гауссовой модели смеси в Matlab, но я не знаю, как рассчитать вероятность, мои тестовые данные для двух классов clear all clc train_class0_data = load('train-class0.data'); t…
17 авг '14 в 07:38
1
ответ
Разве двоичный классификатор SVM не должен понимать порог из обучающего набора?
Я очень озадачен классификаторами SVM, и мне жаль, если я буду звучать глупо. Я использую библиотеку Spark для Java http://spark.apache.org/docs/latest/mllib-linear-methods.html, первый пример из абзаца линейных опорных векторных машин. На этом трен…
04 апр '16 в 14:53
1
ответ
Как нормализовать данные с близкого расстояния?
Я использую логистическую регрессию. У меня есть некоторые особенности. Их значения находятся в диапазоне от 0 до 1 (максимальное значение, которое может выдать функция, равно 1, а минимальное значение равно 0), но как в обучающих, так и в тестовых …
03 фев '16 в 12:40
2
ответа
КНН выбирает классную метку, когда к =4
В классификации k-NN выходные данные являются членами класса. Объект классифицируется большинством голосов своих соседей, при этом объект присваивается классу, наиболее распространенному среди его k ближайших соседей (k является положительным целым …
20 янв '15 в 13:37
0
ответов
Как работать с данными временных рядов при прогнозировании долгосрочной безработицы?
Так что я очень плохо знаком с R и наукой о данных и погрузился в настоящий проект. Я также никогда не работал с данными временных рядов - но я действительно хотел узнать кое-что, что, я надеюсь, благодаря этому:) Вопрос о населении и исследованиях.…
06 июн '18 в 09:21
1
ответ
Неверный тип (символ) аргумента
Это сообщение об ошибке по теме. Я получаю эту ошибку при попытке запустить классификатор naive.bayes. Вот краткая информация о моих поездах: 'data.frame': 7269 obs. of 193 variables: $ pid : int 2 4 5 7 10 11 14 18 25 31 ... $ acquir : int 0 0 0 0 …
15 апр '16 в 07:12
1
ответ
Ошибка ValueE с категоризацией NLTK
Я получаю сообщение ValueError и не уверен, что делаю что-то не так или есть ошибка в моей установке Python. Я пытаюсь разработать тест, чтобы определить, является ли документ выдумкой или научной литературой. Мой код: import nltk, re, string from n…
07 фев '14 в 16:57
2
ответа
MATLAB - генерировать матрицу путаницы из классификатора
У меня есть некоторые тестовые данные и метки: testZ = [0.25, 0.29, 0.62, 0.27, 0.82, 1.18, 0.93, 0.54, 0.78, 0.31, 1.11, 1.08, 1.02]; testY = [1 1 1 1 1 2 2 2 2 2 2 2 2]; Затем я сортирую их: [sZ, ind] = sort(testZ); %%Sorts Z, and gets indexes of …
04 ноя '15 в 14:07
0
ответов
Стэнфордский классификатор: генерирующая модель для классификации на лету (например, большой поток данных)?
Я прошел учебник по обучающим данным в соответствии с http://nlp.stanford.edu/wiki/Software/Classifier Как бы я использовал обученную модель для больших больших данных, которые могут быть обработаны как поток? Выход из классификатора - это просто от…
06 янв '16 в 15:13