Описание тега anomaly-detection

В интеллектуальном анализе данных обнаружение аномалий (также обнаружение выбросов) - это идентификация элементов, событий или наблюдений, которые не соответствуют ожидаемому шаблону или другим элементам в наборе данных.
0 ответов

Нахождение базовых точек смещения для шумных данных

У меня есть грубый сигнал, который прилагается в этом вопросе. Ось X - время, а ось Y - отклик сигнала. Как видно из зашумленных данных, базовая линия зашумленного сигнала, B1, начинает смещаться от t1 s к новому базовому значению, B2, примерно чере…
2 ответа

Нарисуйте круги вокруг точек, принадлежащих уровню фактора в ggplot

Предыдущий пост описывает, как нарисовать красные круги вокруг точек, которые превышают заданное значение в ggplot. Я хотел бы сделать то же самое для результатов обнаружения аномалий, но вместо этого обведите круги вокруг точек, принадлежащих данно…
22 окт '18 в 06:20
0 ответов

K-средство для обнаружения аномалий над набором данных KDD

Привет, ребята. Я студент TU Berlin Master, и мне трудно понять, как ответить на следующие вопросы. Может кто-нибудь, пожалуйста, помогите мне в этом? 1) Используйте K-средства для обнаружения аномалий и определите, сколько кластеров вам нужно. 2) П…
1 ответ

Методы обнаружения аномалий в наборе данных

Я разрабатываю расширение для Chrome и хочу обнаружить аномалии использования процессоров и процессоров. У меня есть два массива: процессор и использование процессора последние 60 секунд моего компьютера. Я хочу обнаружить аномалии в использовании п…
0 ответов

Обнаружение аномалий с использованием изолированного леса

Я использую алгоритм IsolationForest для обнаружения выбросов в данных, которые имеют несколько функций. Я хочу знать, как получить оценку аномалий для каждой отдельной функции в наборе данных. iForest обычно рассчитывает суммарный балл для каждого …
06 фев '19 в 15:37
1 ответ

Обнаружение аномалий с кластеризацией?

Согласно лекции Эндрю Нга, один из алгоритмов обнаружения аномалий заключается в использовании многомерного гауссиана для построения плотности вероятности. Что если данные показывают кластерные структуры (не один блок)? В этом случае мы прибегаем к …
0 ответов

Как предсказать наилучшее значение для доли выбросов?

Я использую "Local Outlier Factor" для обнаружения аномалий. Алгоритм имеет параметр, называемый "загрязнение". Этот параметр представляет собой долю выбросов. В моем случае "0,0058" является лучшим значением для параметра загрязнения. #parameters n…
0 ответов

Обнаружение многофакторной гауссовской аномалии

Я применил многомерный гауссов для обнаружения аномалий. Сегодня кто-то сказал мне, что есть две другие усовершенствованные модели обнаружения аномалий, основанные на многомерном гауссовском, GGM и PGM. Я ничего не мог найти о них. Кто-нибудь знает,…
25 апр '18 в 18:49
0 ответов

Обнаружение различий в изображениях с использованием подхода нейронной сети

Как лучше всего определить разницу между двумя изображениями: одно изображение берется в начале процесса, а другое - в конце, цель состоит в том, чтобы определить, есть ли разница в изображениях. Основываясь на моих исследованиях, нейронные сети каж…
0 ответов

Как реализовать автоэнкодеры LSTM на данных временных рядов?

В приведенном ниже блоге Keras на высоком уровне упоминаются автоэнкодеры LSTM. https://blog.keras.io/building-autoencoders-in-keras.html Но дается только базовый ссылочный код, и он неполный. from keras.layers import Input, LSTM, RepeatVector from …
01 ноя '17 в 08:54
0 ответов

Обнаружение аномалий коррелированных переменных в двух таблицах - реляционная база данных

Я работаю над проектом по обнаружению аномалий или выбросов, проблема в том, что у меня есть две особенности, коррелированные в двух разных таблицах в реляционной базе данных в памяти ( memsql). Первое решение состоит в объединении двух таблиц, чтоб…
2 ответа

Использование Spark и R для обнаружения трендов во временных рядах

Я новичок как в R, так и в Spark, но я пытаюсь создать масштабируемое R-приложение для обнаружения увеличения / уменьшения запросов, выполняемых пользователями. У меня есть Spark DataFrame, содержащий данные в следующем формате: +-------+-----------…
05 июн '17 в 20:19
1 ответ

Метод сравнения изображений и шумоподавления

В настоящее время я делаю проект по выявлению сломанных или плохих продуктов из потока продуктов. Я пытаюсь использовать Opencv, чтобы извлечь края с помощью Canny. Ниже приведены границы, полученные от плохого продукта и образца продукта соответств…
2 ответа

Является ли Isolation Forest (iForest) методом, который можно напрямую применить к большим данным?

Я пытаюсь понять, возможно ли применить iForest напрямую к очень большому набору данных, который является статическим (фиксированный размер, как по количеству элементов, так и по размерности), без использования распределенных сред обработки, таких к…
1 ответ

Какой алгоритм подходит для моих данных временных рядов?

Я работаю в команде мониторинга, мы отслеживаем нагрузку наших клиентов на наши инструменты. Мы записали задержку с соответствующими временными сериями. Первоначально я держал статический порог, чтобы повысить обнаружение аномалий. Тем не менее, это…
0 ответов

Предсказание lstm autoencoder всегда начинается с нуля

Я пытаюсь построить автокодер LSTM, чтобы найти аномалии в наборе сигналов. Автоэнкодер, кажется, работает хорошо, за исключением начала кривых. В начале все восстановленные кривые начинаются с нуля. Фактически ноль здесь - среднее значение каждой к…
01 июл '18 в 13:00
1 ответ

Обнаружение аномалий в текстовой классификации

Я построил классификатор текста, используя OneClassSVM. У меня есть тренировочный набор, который соответствует только одной метке, т. Е. ("Да"), а у меня нет других ("НЕТ") данных метки. Моя задача - создать классификатор, который классифицирует нов…
11 сен '18 в 06:50
0 ответов

Как автоматически нормализовать ошибку восстановления в автоэнкодере H2O

Существуют ли какие-либо настройки параметров для функции автоматического кодирования h2o.anomaly() для возврата нормализованной ошибки восстановления? Я ожидал, что значения ошибок будут между (0,1), но я вижу некоторую ошибку реконструкции больше …
05 дек '18 в 17:13
0 ответов

Обнаружение аномалий с использованием автоэнкодера в категориальных сериях

У меня есть категориальные серии, как показано ниже A, B, R, H, A B, A, C, D, N Q, A, C, D, N Я пытаюсь найти аномалию в этих сериях, используя авто кодировщик. Хотя я получаю ошибку реконструкции, меняя их на числа, но правильно ли это использовать…
2 ответа

Алгоритм поиска кластеров в 1d кластерах, но не обязательно кластеризация всего

Представьте, что у меня есть массив, подобный следующему: [0.1,0.12,0.14,0.45,0.88,0.91,0.94,14.3,15,16] Я хотел бы определить шаблоны в этом, так что я могу сравнить его с другим набором данных, чтобы увидеть, соответствует ли он. Например, если я …
30 дек '18 в 01:57