Учитывая измерения из ряда событий в качестве входных данных, как я могу генерировать бесконечные входные ряды с одинаковым профилем?

В настоящее время я работаю с системой, которая принимает решения о планировании на основе серии запросов и состояния системы.

Я хотел бы взять поток реальных входных данных, смоделировать некоторые из компонентов и провести симуляции против остальных. Идея состоит в том, чтобы использовать его для планирования в отношении пропускной способности системы (т. Е. Когда нужно масштабировать определенные компоненты), отслеживать определенные режимы сбоев и анализировать последствия изменений в кодовой базе (т. Е. Моделирования с версией A по сравнению с моделированиями с версией B).,

Я могу сделать все, что связано с этим, кроме как генерировать подходящий поток ввода. Воспроизведение точного ввода с производства не было очень полезным, потому что трудно получить достаточно длинный поток данных, чтобы выявить некоторые из поведения, которое я пытаюсь найти. Другими словами, если производство падает на 300 дней ввода, у меня нет достаточно данных, чтобы узнать, пока он не упал. Повторение того же набора входных данных было рассмотрено; но после нескольких первоначальных попыток разработчики все согласны с тем, что имитация, похоже, "нуждается в большем количестве случайных".

Об этой конкретной системе:

  • Входные данные представляют собой серию нерегулярно распределенных событий (т.е. случайный процесс с дискретным временем и пространством непрерывного состояния).
  • Свойства не являются независимыми друг от друга.
  • Еще более независимыми от свойств являются композиты других свойств, которые по природе всегда будут невидимы для меня (что приведет к мультимодальному распределению).
  • Интервал запроса не зависит от других свойств (т. Е. Множество запросов на небольшое количество ресурсов поступает в пакете, а большие запросы - нет).
  • В нем есть петли обратной связи.
  • Это доказуемо хаотично.

Так:

Учитывая поток входных событий с определенным распределением различных свойств (включая интервал), как мне сгенерировать бесконечный поток событий с одинаковым распределением по ряду не независимых свойств?

Посмотрев вокруг, я думаю, что мне нужно сделать симуляцию Маркова-Цепи Монте-Карло. Моя проблема состоит в том, чтобы выяснить, как построить цепь Маркова из существующих входных данных.

1 ответ

Возможно, можно смоделировать ввод с помощью копулы. Есть инструменты, которые помогут вам в этом, например, посмотрите эту статью. Помимо этого, я бы предложил перенести вопрос на http://stats.stackexchange.com/, так как это статистическая проблема, которая, вероятно, привлечет больше внимания.

Другие вопросы по тегам