Учитывая измерения из ряда событий в качестве входных данных, как я могу генерировать бесконечные входные ряды с одинаковым профилем?
В настоящее время я работаю с системой, которая принимает решения о планировании на основе серии запросов и состояния системы.
Я хотел бы взять поток реальных входных данных, смоделировать некоторые из компонентов и провести симуляции против остальных. Идея состоит в том, чтобы использовать его для планирования в отношении пропускной способности системы (т. Е. Когда нужно масштабировать определенные компоненты), отслеживать определенные режимы сбоев и анализировать последствия изменений в кодовой базе (т. Е. Моделирования с версией A по сравнению с моделированиями с версией B).,
Я могу сделать все, что связано с этим, кроме как генерировать подходящий поток ввода. Воспроизведение точного ввода с производства не было очень полезным, потому что трудно получить достаточно длинный поток данных, чтобы выявить некоторые из поведения, которое я пытаюсь найти. Другими словами, если производство падает на 300 дней ввода, у меня нет достаточно данных, чтобы узнать, пока он не упал. Повторение того же набора входных данных было рассмотрено; но после нескольких первоначальных попыток разработчики все согласны с тем, что имитация, похоже, "нуждается в большем количестве случайных".
Об этой конкретной системе:
- Входные данные представляют собой серию нерегулярно распределенных событий (т.е. случайный процесс с дискретным временем и пространством непрерывного состояния).
- Свойства не являются независимыми друг от друга.
- Еще более независимыми от свойств являются композиты других свойств, которые по природе всегда будут невидимы для меня (что приведет к мультимодальному распределению).
- Интервал запроса не зависит от других свойств (т. Е. Множество запросов на небольшое количество ресурсов поступает в пакете, а большие запросы - нет).
- В нем есть петли обратной связи.
- Это доказуемо хаотично.
Так:
Учитывая поток входных событий с определенным распределением различных свойств (включая интервал), как мне сгенерировать бесконечный поток событий с одинаковым распределением по ряду не независимых свойств?
Посмотрев вокруг, я думаю, что мне нужно сделать симуляцию Маркова-Цепи Монте-Карло. Моя проблема состоит в том, чтобы выяснить, как построить цепь Маркова из существующих входных данных.
1 ответ
Возможно, можно смоделировать ввод с помощью копулы. Есть инструменты, которые помогут вам в этом, например, посмотрите эту статью. Помимо этого, я бы предложил перенести вопрос на http://stats.stackexchange.com/, так как это статистическая проблема, которая, вероятно, привлечет больше внимания.