Описание тега anomaly-detection
В интеллектуальном анализе данных обнаружение аномалий (также обнаружение выбросов) - это идентификация элементов, событий или наблюдений, которые не соответствуют ожидаемому шаблону или другим элементам в наборе данных.
0
ответов
Нахождение базовых точек смещения для шумных данных
У меня есть грубый сигнал, который прилагается в этом вопросе. Ось X - время, а ось Y - отклик сигнала. Как видно из зашумленных данных, базовая линия зашумленного сигнала, B1, начинает смещаться от t1 s к новому базовому значению, B2, примерно чере…
01 фев '17 в 22:01
2
ответа
Нарисуйте круги вокруг точек, принадлежащих уровню фактора в ggplot
Предыдущий пост описывает, как нарисовать красные круги вокруг точек, которые превышают заданное значение в ggplot. Я хотел бы сделать то же самое для результатов обнаружения аномалий, но вместо этого обведите круги вокруг точек, принадлежащих данно…
22 окт '18 в 06:20
0
ответов
K-средство для обнаружения аномалий над набором данных KDD
Привет, ребята. Я студент TU Berlin Master, и мне трудно понять, как ответить на следующие вопросы. Может кто-нибудь, пожалуйста, помогите мне в этом? 1) Используйте K-средства для обнаружения аномалий и определите, сколько кластеров вам нужно. 2) П…
26 май '18 в 10:21
1
ответ
Методы обнаружения аномалий в наборе данных
Я разрабатываю расширение для Chrome и хочу обнаружить аномалии использования процессоров и процессоров. У меня есть два массива: процессор и использование процессора последние 60 секунд моего компьютера. Я хочу обнаружить аномалии в использовании п…
22 июн '18 в 20:53
0
ответов
Обнаружение аномалий с использованием изолированного леса
Я использую алгоритм IsolationForest для обнаружения выбросов в данных, которые имеют несколько функций. Я хочу знать, как получить оценку аномалий для каждой отдельной функции в наборе данных. iForest обычно рассчитывает суммарный балл для каждого …
06 фев '19 в 15:37
1
ответ
Обнаружение аномалий с кластеризацией?
Согласно лекции Эндрю Нга, один из алгоритмов обнаружения аномалий заключается в использовании многомерного гауссиана для построения плотности вероятности. Что если данные показывают кластерные структуры (не один блок)? В этом случае мы прибегаем к …
12 июн '18 в 00:36
0
ответов
Как предсказать наилучшее значение для доли выбросов?
Я использую "Local Outlier Factor" для обнаружения аномалий. Алгоритм имеет параметр, называемый "загрязнение". Этот параметр представляет собой долю выбросов. В моем случае "0,0058" является лучшим значением для параметра загрязнения. #parameters n…
07 май '18 в 06:58
0
ответов
Обнаружение многофакторной гауссовской аномалии
Я применил многомерный гауссов для обнаружения аномалий. Сегодня кто-то сказал мне, что есть две другие усовершенствованные модели обнаружения аномалий, основанные на многомерном гауссовском, GGM и PGM. Я ничего не мог найти о них. Кто-нибудь знает,…
25 апр '18 в 18:49
0
ответов
Обнаружение различий в изображениях с использованием подхода нейронной сети
Как лучше всего определить разницу между двумя изображениями: одно изображение берется в начале процесса, а другое - в конце, цель состоит в том, чтобы определить, есть ли разница в изображениях. Основываясь на моих исследованиях, нейронные сети каж…
14 июн '18 в 10:09
0
ответов
Как реализовать автоэнкодеры LSTM на данных временных рядов?
В приведенном ниже блоге Keras на высоком уровне упоминаются автоэнкодеры LSTM. https://blog.keras.io/building-autoencoders-in-keras.html Но дается только базовый ссылочный код, и он неполный. from keras.layers import Input, LSTM, RepeatVector from …
01 ноя '17 в 08:54
0
ответов
Обнаружение аномалий коррелированных переменных в двух таблицах - реляционная база данных
Я работаю над проектом по обнаружению аномалий или выбросов, проблема в том, что у меня есть две особенности, коррелированные в двух разных таблицах в реляционной базе данных в памяти ( memsql). Первое решение состоит в объединении двух таблиц, чтоб…
31 май '18 в 08:49
2
ответа
Использование Spark и R для обнаружения трендов во временных рядах
Я новичок как в R, так и в Spark, но я пытаюсь создать масштабируемое R-приложение для обнаружения увеличения / уменьшения запросов, выполняемых пользователями. У меня есть Spark DataFrame, содержащий данные в следующем формате: +-------+-----------…
05 июн '17 в 20:19
1
ответ
Метод сравнения изображений и шумоподавления
В настоящее время я делаю проект по выявлению сломанных или плохих продуктов из потока продуктов. Я пытаюсь использовать Opencv, чтобы извлечь края с помощью Canny. Ниже приведены границы, полученные от плохого продукта и образца продукта соответств…
10 сен '16 в 04:33
2
ответа
Является ли Isolation Forest (iForest) методом, который можно напрямую применить к большим данным?
Я пытаюсь понять, возможно ли применить iForest напрямую к очень большому набору данных, который является статическим (фиксированный размер, как по количеству элементов, так и по размерности), без использования распределенных сред обработки, таких к…
24 июл '18 в 07:03
1
ответ
Какой алгоритм подходит для моих данных временных рядов?
Я работаю в команде мониторинга, мы отслеживаем нагрузку наших клиентов на наши инструменты. Мы записали задержку с соответствующими временными сериями. Первоначально я держал статический порог, чтобы повысить обнаружение аномалий. Тем не менее, это…
16 июл '18 в 21:47
0
ответов
Предсказание lstm autoencoder всегда начинается с нуля
Я пытаюсь построить автокодер LSTM, чтобы найти аномалии в наборе сигналов. Автоэнкодер, кажется, работает хорошо, за исключением начала кривых. В начале все восстановленные кривые начинаются с нуля. Фактически ноль здесь - среднее значение каждой к…
01 июл '18 в 13:00
1
ответ
Обнаружение аномалий в текстовой классификации
Я построил классификатор текста, используя OneClassSVM. У меня есть тренировочный набор, который соответствует только одной метке, т. Е. ("Да"), а у меня нет других ("НЕТ") данных метки. Моя задача - создать классификатор, который классифицирует нов…
11 сен '18 в 06:50
0
ответов
Как автоматически нормализовать ошибку восстановления в автоэнкодере H2O
Существуют ли какие-либо настройки параметров для функции автоматического кодирования h2o.anomaly() для возврата нормализованной ошибки восстановления? Я ожидал, что значения ошибок будут между (0,1), но я вижу некоторую ошибку реконструкции больше …
05 дек '18 в 17:13
0
ответов
Обнаружение аномалий с использованием автоэнкодера в категориальных сериях
У меня есть категориальные серии, как показано ниже A, B, R, H, A B, A, C, D, N Q, A, C, D, N Я пытаюсь найти аномалию в этих сериях, используя авто кодировщик. Хотя я получаю ошибку реконструкции, меняя их на числа, но правильно ли это использовать…
05 дек '18 в 22:18
2
ответа
Алгоритм поиска кластеров в 1d кластерах, но не обязательно кластеризация всего
Представьте, что у меня есть массив, подобный следующему: [0.1,0.12,0.14,0.45,0.88,0.91,0.94,14.3,15,16] Я хотел бы определить шаблоны в этом, так что я могу сравнить его с другим набором данных, чтобы увидеть, соответствует ли он. Например, если я …
30 дек '18 в 01:57