Описание тега boosting

Boosting is a machine learning ensemble meta-algorithm in supervised learning, and a family of machine learning algorithms that convert weak learners to strong ones. Also: Boosting is the process of enhancing the relevancy of a document or field
0 ответов

Различия между adabag и rpart

Я нашел что-то странное (по крайней мере для меня) при использовании пакетов rpart и adabag в R (версия R 3.5.1 (2018-07-02) - "Перо-спрей")). Мне интересно, что является причиной получения разных деревьев при использовании обоих пакетов, даже если …
22 окт '18 в 10:32
1 ответ

Elasticsearch/ Searchkick gem - поля повышения не возвращают результаты со специальными символами (например, апострофы)

Мы используем гем searchkick в нашем приложении и имеем много документов с полями, которые содержат специальные символы, такие как апострофы, например, предложение с title Valentine's Day Special, Без бустеров, поиск Valentines или же Valentine's ил…
1 ответ

Как узнать, когда использовать Solr bq против bf и как применять логику запросов?

Я только начинаю узнавать о бустинге в Solr, и до сих пор мне удавалось добавлять буст-запросы на основе некоторых конкретных фраз, таких как: bq=manufacturer:sony^2, Тем не менее, я сейчас пытаюсь применить логику для повышения, и я не уверен, что …
17 июл '17 в 18:06
1 ответ

Ошибка в eval(expr, envir, enclos): объект 'PAY_0.1' не найден (Повышение)

Я пытаюсь применить модель повышения, но я продолжаю получать эту ошибку. Любая помощь будет высоко ценится. Это набор данных из kaggle, данные кредитной карты UCI, если вам интересно. DataSplit<-createDataPartition(UCIdata$default.payment.next.m…
19 янв '17 в 22:21
1 ответ

Функция потери градиентного повышающего классификатора со склеарном - операнды нельзя передавать вместе

У меня проблема с методом estimator.loss_ для классификатора повышения градиента sklearn. Я пытаюсь составить график ошибки теста по сравнению с ошибкой тренировки во времени. Вот некоторые из моих подготовительных данных: # convert data to numpy ar…
02 сен '15 в 18:35
1 ответ

Как правильно смоделировать смещение и дисперсию сглаживающего сплайна?

Моя цель - построить разностное разложение кубического сглаживающего сплайна для разных степеней свободы. Сначала я моделирую набор тестов (матрица) и набор поездов (матрица). Затем я повторяю более 100 симуляций и меняю в каждой итерации степени св…
17 дек '18 в 10:28
0 ответов

Какой показатель оценки использовать для функции ранжирования LightGBM

Я использую LGMRanker от LightGBM но не уверен, какую метрику оценки я должен использовать. Вот мой код: import lightgbm as lgb gbm = lgb.LGBMRanker gridParams = { 'learning_rate': [0.005,0.01,0.02], 'max_depth': [5,6,7], 'n_estimators': [100,200], …
17 янв '19 в 22:00
4 ответа

Прогнозирование вероятностей классов в случае градиентных деревьев в Spark с использованием выходных данных дерева

Известно, что GBT s в Spark дает вам предсказанные ярлыки на данный момент. Я думал о попытке рассчитать прогнозируемые вероятности для класса (скажем, все случаи, попадающие под определенный лист) Коды для построения GBT import org.apache.spark.Spa…
1 ответ

Python SkLearn Gradient Boost Classifier Sample_Weight Clarification

Использование Python SkLearn Gradient Boost Classifier. Настройка, которую я использую, - это выбор случайных выборок (стохастик). Использование sample_weight 1 для одного из бинарных классов (исход = 0) и 20 для другого класса (результат = 1). Мой …
30 авг '18 в 11:39
1 ответ

Как получить доступ к взвешиванию отдельных деревьев решений в xgboost?

Я использую xgboost для ранжирования с param = {'objective':'rank:pairwise', 'booster':'gbtree'} Как я понимаю, повышение градиента работает путем вычисления взвешенной суммы изученных деревьев решений. Как я могу получить доступ к весам, которые на…
05 окт '15 в 14:06
0 ответов

Как повысить конкретные документы в Elasticsearch с пользовательским рангом

Я использую Elasticsearch для поиска предметов. Предметы имеют настраиваемое поле ранга, которое используется для сортировки. Пользователи могут пометить эти элементы как избранные. Я хотел бы повысить, чтобы персонализировать результаты поиска, пок…
30 окт '17 в 10:53
0 ответов

Есть ли способ вычислить точность повышенных каскадных стадий?

Итак, я обучил усиленный каскад с использованием утилит Opencv, я хотел бы оценить производительность каждого этапа классификатора. Есть ли способ получить доступ к результатам отдельных этапов или что-нибудь, что может помочь в достижении этого?
1 ответ

"действительное отклонение" - это модель для модели GBM. Что это значит и как от этого избавиться?

Я использую повышение градиента для классификации. Хотя результат улучшается, но я получаю NaN в validdeviance. Model = gbm.fit( x= x_Train , y = y_Train , distribution = "bernoulli", n.trees = GBM_NTREES , shrinkage = GBM_SHRINKAGE , interaction.de…
08 май '16 в 05:50
0 ответов

Использование OpenCv cascade.detectMultiScale() в качестве классификатора

Поэтому я пытаюсь использовать cascade.detectMultiScale() в качестве классификатора, используя входное изображение размером 24*24 (тот же размер, который используется в обучении каскаду) и параметры: detections = my_cascade.detectMultiScale (img, sc…
1 ответ

Разные значения, подгоняя усиленное дерево дважды

Я использую adabag в R-пакете для подгонки расширенных деревьев к (большому) набору данных (140 наблюдений с 3 845 предикторами). Я выполнял этот метод дважды с одним и тем же параметром и одним и тем же набором данных, и каждый раз возвращались раз…
24 дек '16 в 01:18
1 ответ

Повышающий запрос не работает должным образом

{ "sort": [ { "is_active": "asc" } ], "fields": [ "is_job_seeking", "is_active" ], "query": { "bool": { "must": [ { "bool": { "must": { "term": { "is_job_seeking": 1 } } } } ] } } } этот запрос возвращает мне весь документ, который имеет is_job_seek…
21 янв '15 в 08:38
0 ответов

Случайный лес (в питоне) алгоритм повышения?

Я ищу основные различия между случайным лесом и повышением градиента, и я не понимаю, использует ли случайный лес методы повышения, и если нет, то почему. Спасибо!
0 ответов

Повышающие и аддитивные деревья

В книге ESL Хасти и Тибширани, Я запутался в том, что подразумевается под символом ~ над L в этом контексте. Может кто-нибудь объяснить, пожалуйста?
0 ответов

Любые реализации GentleBoost, MILBoost и BrownBoost в Python?

Я нашел реализацию как на GentleBoost, так и на MILBoost в github: https://github.com/hbldh/skboost Однако, если честно, я не мог разобраться в коде. Я не знаю, как использовать эту реализацию с наборами данных scikit-learn или любым файлом.csv. Кто…
1 ответ

ElasticSearch - повышение оценки за нечеткие слова

Я хочу выполнить нечеткий поиск по пользовательским поисковым словам (apple iphone 5s). Я хочу дать большее значение для первого (яблоко), немного меньше для второго и так далее. Я начал с запроса, приведенного ниже, но не работал, как я ожидал: { "…
24 окт '14 в 14:30