Описание тега classification

In machine learning and statistics, classification is the problem of identifying which of a set of categories a new observation belongs to, on the basis of a training set of data containing observations whose category membership (label) is known.
1 ответ

В классификации почему граница Решения является свойством гипотезы, а не обучающей совокупности?

Я начал смотреть ML-ролики Эндрю Нг на Coursera. В уроке по классификации (в третьем видео) он сказал следующие строки "Еще раз, граница решения - это свойство не обучающего набора, а гипотезы и параметров. Но как только у вас есть параметры тета, э…
13 июл '17 в 06:18
1 ответ

Как посчитать сумму пикселей в каждом классе в классифицированном изображении (Landsat) в Google Earth Engine?

Я делаю диссертацию об изменениях ледника. Я провел контролируемую классификацию изображения Landsat 8 и хотел бы подсчитать, сколько пикселей в каждом классе. Я хочу сделать диаграмму, кстати. Но я застрял, мой код работает с ошибкой. Я пытался исп…
1 ответ

Как обеспечить стоимость балансирования обучения с помощью несбалансированного набора данных о поездах, доступную в svmlight?

Стоимость в SVM у e1071 не такая же, как у svmlight. В руководстве к библиотеке e1071 приведено следующее определение ее параметра стоимости: cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular- ization term in the Lagra…
17 янв '15 в 13:50
2 ответа

Проведено обучение и валидация в gridsearchcv sklearn

Я вижу, что в gridsearchcv лучшие параметры определяются на основе cross-validation, но то, что я действительно хочу сделать, это определить лучшие параметры на основе one held out validation set вместо cross validation, Не уверен, есть ли способ сд…
3 ответа

Матрицы точности не работают на линейной регрессии

Пожалуйста, помогите здесь: import numpy as np import pandas as pd import matplotlib.pyplot as plt X = [[1.1],[1.3],[1.5],[2],[2.2],[2.9],[3],[3.2],[3.2],[3.7],[3.9],[4],[4],[4.1],[4.5],[4.9],[5.1],[5.3],[5.9],[6],[6.8],[7.1],[7.9],[8.2],[8.7],[9],[…
1 ответ

График смежности регионов Skimage (RAG) по сегментации быстрых сдвигов

Я пытаюсь создать график смежности регионов после сегментирования изображения с помощью инструментов в Skimage пакет. Используя примеры в документации, я могу сегментировать изображение с помощью SLIC и успешно создать RAG. from skimage import data …
1 ответ

Точность и отзыв в fastText?

Я использую fastText для классификации текста, ссылка https://github.com/facebookresearch/fastText/blob/master/tutorials/supervised-learning.md Мне было интересно, что означает точность @1 или P@5? Я сделал бинарную классификацию, но я проверил друг…
09 сен '17 в 10:54
1 ответ

Неопределенная функция или переменная 'skript_name' Matlab

Я использую открытый исходный код от Matlab: http://makerzone.mathworks.com/uncategorized/activity-detection-with-matlab/ для обнаружения активности. Все данные, которые мне нужны, находятся в zip-файле, который вы можете скачать выше. Когда я пытаю…
11 сен '16 в 13:31
0 ответов

Matlab: код Refactor Classification Learner для работы с таблицей данных размера варианта

Интерфейсный файл Classification Learner предоставляет возможность экспортировать код, который выглядит следующим образом function [trainedClassifier, validationAccuracy] = trainClassifier(datasetTable) % Convert input to table datasetTable = table(…
21 ноя '15 в 17:59
1 ответ

Обработка значений null/NaN в искровом классификаторе

У меня есть набор категориальных столбцов (строк), которые я анализирую и преобразую в векторы объектов, чтобы передать их в классификатор mllib (случайный лес). В моих входных данных некоторые столбцы имеют нулевые значения. Скажем, в одном из этих…
1 ответ

Любая причина, почему эти экземпляры могут быть неправильно классифицированы?

Я начал с двух файлов training & testing, Затем, используя libsvm, я масштабировал оба этих файла до training.scale а также testing.scale Затем с помощью grid.py (часть libsvm) я побежал training.scale и и получил некоторые значения перекрестной про…
0 ответов

Модель вероятности с гусианской смесью

У меня есть два класса с меткой, которые я хочу классифицировать с помощью гауссовой модели смеси в Matlab, но я не знаю, как рассчитать вероятность, мои тестовые данные для двух классов clear all clc train_class0_data = load('train-class0.data'); t…
17 авг '14 в 07:38
1 ответ

Разве двоичный классификатор SVM не должен понимать порог из обучающего набора?

Я очень озадачен классификаторами SVM, и мне жаль, если я буду звучать глупо. Я использую библиотеку Spark для Java http://spark.apache.org/docs/latest/mllib-linear-methods.html, первый пример из абзаца линейных опорных векторных машин. На этом трен…
04 апр '16 в 14:53
1 ответ

Как нормализовать данные с близкого расстояния?

Я использую логистическую регрессию. У меня есть некоторые особенности. Их значения находятся в диапазоне от 0 до 1 (максимальное значение, которое может выдать функция, равно 1, а минимальное значение равно 0), но как в обучающих, так и в тестовых …
2 ответа

КНН выбирает классную метку, когда к =4

В классификации k-NN выходные данные являются членами класса. Объект классифицируется большинством голосов своих соседей, при этом объект присваивается классу, наиболее распространенному среди его k ближайших соседей (k является положительным целым …
0 ответов

Как работать с данными временных рядов при прогнозировании долгосрочной безработицы?

Так что я очень плохо знаком с R и наукой о данных и погрузился в настоящий проект. Я также никогда не работал с данными временных рядов - но я действительно хотел узнать кое-что, что, я надеюсь, благодаря этому:) Вопрос о населении и исследованиях.…
1 ответ

Неверный тип (символ) аргумента

Это сообщение об ошибке по теме. Я получаю эту ошибку при попытке запустить классификатор naive.bayes. Вот краткая информация о моих поездах: 'data.frame': 7269 obs. of 193 variables: $ pid : int 2 4 5 7 10 11 14 18 25 31 ... $ acquir : int 0 0 0 0 …
1 ответ

Ошибка ValueE с категоризацией NLTK

Я получаю сообщение ValueError и не уверен, что делаю что-то не так или есть ошибка в моей установке Python. Я пытаюсь разработать тест, чтобы определить, является ли документ выдумкой или научной литературой. Мой код: import nltk, re, string from n…
07 фев '14 в 16:57
2 ответа

MATLAB - генерировать матрицу путаницы из классификатора

У меня есть некоторые тестовые данные и метки: testZ = [0.25, 0.29, 0.62, 0.27, 0.82, 1.18, 0.93, 0.54, 0.78, 0.31, 1.11, 1.08, 1.02]; testY = [1 1 1 1 1 2 2 2 2 2 2 2 2]; Затем я сортирую их: [sZ, ind] = sort(testZ); %%Sorts Z, and gets indexes of …
04 ноя '15 в 14:07
0 ответов

Стэнфордский классификатор: генерирующая модель для классификации на лету (например, большой поток данных)?

Я прошел учебник по обучающим данным в соответствии с http://nlp.stanford.edu/wiki/Software/Classifier Как бы я использовал обученную модель для больших больших данных, которые могут быть обработаны как поток? Выход из классификатора - это просто от…
06 янв '16 в 15:13