Описание тега machine-learning

Вопросы реализации алгоритмов машинного обучения. Общие вопросы о машинном обучении следует размещать в их сообществах.
1 ответ

Определение определенных частей документа с использованием CRF

Моей целью является набор документов (в основном в финансовой сфере), нам необходимо определить его отдельные части, такие как название компании или тип документа и т. Д. Предполагается, что обучение будет проводиться на нескольких сотнях документов…
1 ответ

Как запустить регрессию на несколько факторов с множеством факторов обучения, используя склеарн

Недавно я работал над попыткой заставить sklearn работать с моими данными. У меня есть 609 столбцов данных для каждой из моих ~20 тыс. Строк. Данные отформатированы следующим образом: Строки 0-7 представляют собой разные "выходные данные" (каждая из…
06 мар '17 в 13:46
1 ответ

sklearn StandardScaler, не разрешает прямое преобразование, нам нужно fit_transform

В чем разница между fit_transform и transform? Почему трансформация не работает напрямую? from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_train) X_test = X_scaler.transform(X_test) Если…
2 ответа

keras CNN 1-D -> Почему все предсказанные классы возвращаются равными?

Я закодировал CNN 1-D, но при выполнении model.predict_classes(X) Команда все возвращаемые классы одинаковы. Пример возврата приведен на следующем экране. Почему все предсказанные классы возвращаются равными? Я уже изменил вход на другие, и результа…
2 ответа

Как определить логотип, если он искажен?

Как обнаружить логотипы, если они искажены (то есть растянуты, свернуты, сжаты)? Я использовал SIFT как функции для обнаружения, так как он масштабирован инвариантно. Ниже приведен пример, логотип появляется на бутылке, он вытянут вдоль кривизны бут…
61 ответ

TensorFlow не найден с использованием pip

Я пытаюсь установить TensorFlow с помощью pip: $ pip install tensorflow --user Collecting tensorflow Could not find a version that satisfies the requirement tensorflow (from versions: ) No matching distribution found for tensorflow Что я делаю непра…
11 авг '16 в 12:28
1 ответ

В классификации почему граница Решения является свойством гипотезы, а не обучающей совокупности?

Я начал смотреть ML-ролики Эндрю Нг на Coursera. В уроке по классификации (в третьем видео) он сказал следующие строки "Еще раз, граница решения - это свойство не обучающего набора, а гипотезы и параметров. Но как только у вас есть параметры тета, э…
13 июл '17 в 06:18
1 ответ

Почему Stanford Topic Modeling Toolbox не создает каталог lda-output?

Я попытался запустить этот код из github (после 1-2-3 шагов), который определяет 30 тем в 14 500 электронных письмах Сары Пэйлин. Открытые автором темы находятся здесь. Тем не менее, Stanford Topic Modeling Toolbox не производит каталог lda-output д…
0 ответов

Как правильно разработать генератор данных для модели Keras с несколькими входами?

Я пытаюсь разработать модель керас с несколькими входами. Мы работаем с изображениями (128x128x3) математических узлов. Я создал модель, которая принимает три входа. Три входа будут 1). Неповоротное изображение узла 2). Тот же узел, что и 1, но пове…
1 ответ

"Не удалось подключиться к локальному порту 54321: соединение отказано"

Я не могу заставить H2O работать в моем R. Это показывает следующую ошибку. Понятия не имею, что это значит. Ранее это дало мне ошибку, потому что у меня не было 64-битной версии Java. Я загрузил 64-битную версию - перезапустил свой компьютер - и сн…
31 июл '18 в 04:21
2 ответа

Как построить случайные леса в R с отсутствующими (NA) значениями?

Я хотел бы соответствовать случайной модели леса, но когда я звоню library(randomForest) cars$speed[1] <- NA # to simulate missing value model <- randomForest(speed ~., data=cars) Я получаю следующую ошибку Error in na.fail.default(list(speed …
1 ответ

Поддержка Vector Machine плохие результаты-Python

Я изучаю SVM и реализовал этот код, он слишком простой, примитивный и занимает слишком много времени, но я просто хотел посмотреть, как он на самом деле работает. К сожалению, он дает мне плохие результаты. Что я пропустил? Некоторая ошибка кодирова…
31 июл '16 в 16:04
0 ответов

Я не понимаю, что значит тренировка в Weka

Я учу Веку, и у меня есть несколько вопросов. Во-первых, я хочу понять идею обучения и тестирования. Это мне не понятно. Я вижу файл weather.arff для Weka и вижу два раздела. Первый - определение атрибутов, а затем создание экземпляров этих атрибуто…
1 ответ

Как я могу объединить / сгруппировать людей, учитывая их продолжительность для данного события?

Я новичок в машинном обучении и у меня есть очень большой набор данных для группы из 100 человек в течение 1 года. и цель состоит в том, чтобы выяснить, кто такие приятели, исходя из времени их обеда. У меня есть следующий набор данных: Person Start…
1 ответ

Параметр формулы при построении объектов SVM с использованием библиотеки e1071

Может кто-нибудь дать мне пример о том, как использовать параметр формулы при построении объекта SVM. У меня есть следующий сценарий R library(e1071) dataset <- read.csv("train.svm", header=TRUE, sep = ",") F <- factor(dataset$F) C1 <- c(da…
15 май '14 в 12:54
1 ответ

Как обеспечить стоимость балансирования обучения с помощью несбалансированного набора данных о поездах, доступную в svmlight?

Стоимость в SVM у e1071 не такая же, как у svmlight. В руководстве к библиотеке e1071 приведено следующее определение ее параметра стоимости: cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular- ization term in the Lagra…
17 янв '15 в 13:50
3 ответа

Матрицы точности не работают на линейной регрессии

Пожалуйста, помогите здесь: import numpy as np import pandas as pd import matplotlib.pyplot as plt X = [[1.1],[1.3],[1.5],[2],[2.2],[2.9],[3],[3.2],[3.2],[3.7],[3.9],[4],[4],[4.1],[4.5],[4.9],[5.1],[5.3],[5.9],[6],[6.8],[7.1],[7.9],[8.2],[8.7],[9],[…
2 ответа

Я хочу разбить датафреймы на обучающие и тестовые наборы с диапазонами

import pandas as pd import numpy as np data=[] columns = ['A', 'B', 'C'] data = [[0, 10, 5], [0, 12, 5], [2, 34, 13], [2, 3, 13], [4, 5, 8], [2, 4, 8], [1, 2, 4], [1, 3, 4], [3, 8, 12],[4,10,12],[6,7,12]] df = pd.DataFrame(data, columns=columns) pri…
30 июл '18 в 18:03
0 ответов

Fuzzification изображения на основе гистограммы

Здесь мне интересно обсудить, как размыть изображение (план членства) с уровня серого [0-255]. Я нашел один пример изображения ниже. Я знаю о создании гистограммы изображения. но не уверен, как мы можем определить значение членства серого уровня. У …
4 ответа

TensorFlow - почему эта регрессия sofmax ничего не изучает?

Я стремлюсь делать большие вещи с TensorFlow, но я пытаюсь начать с малого. У меня есть маленькие серые квадраты (с небольшим шумом), и я хочу классифицировать их по цвету (например, 3 категории: черный, серый, белый). Я написал небольшой класс Pyth…