Как использовать оценку ядра плотности для обнаружения выбросов?

У меня есть переменная под названием "цена", распределение которой выглядит действительно искаженным. Я планировал обнаружить выбросы, используя оценки плотности ядра. Есть хорошие идеи для этого?

Спасибо!

1 ответ

Если я понимаю, вы ищете локальные максимумы низкой амплитуды? Вы можете проверить плотность ядра для переходов с наклоном. Нормальный дистрибутив должен идти POS-NEG. Если ваша функция сглаживания достаточно гладкая, ваши основные данные должны выглядеть следующим образом. Выбросы добавили бы дополнительный переход POS-NEG на склоне.

Функция наклона рассчитывается аналогично самому ядру, но использует производную от выбранной вами функции управления окнами.

Отрегулируйте параметр сглаживания соответствующим образом и удалите выборки, которые вносят вклад в локальный максимум чрезмерной амплитуды.

Другие вопросы по тегам