Является ли подмножество случайной последовательности также случайным?

Дано:

  • последовательность случайных чисел
  • X клиенты выбирают Y чисел из последовательности, образуя свои собственные подпоследовательности
  • правила, регулирующие процесс отбора, не известны

Есть ли математическое свойство, которое гарантирует, что каждый клиент получит случайную последовательность чисел? То есть подмножество случайной последовательности также гарантированно будет случайным независимо от процесса выбора?

ОБНОВЛЕНИЕ: я пытался установить, мог ли бы я использовать один генератор случайных чисел для раздачи значений нескольким клиентам: существуют ли генераторы случайных чисел без состояния? - То есть клиенты выбирают элементы из последовательности без замены. При этом мне было интересно и общее дело (когда правила отбора неизвестны).

7 ответов

Решение

Слово "случайный" в "последовательности случайных чисел" обычно понимается как означающее, что нет никакой дополнительной информации о каком-либо элементе последовательности при просмотре любых других элементов последовательности. (то есть априорное и апостериорное распределения вероятностей элемента Xi одинаковы до и после изучения любых других элементов.)

Пока ни один из номеров не используется более чем одним клиентом, все будет в порядке. (изменить: и, как уже упоминали другие, вы не можете принять один из элементов после того, как посмотрите на его значение.)

Подмножество не будет случайным, если правила, регулирующие процесс выбора, включают в себя осведомленность о фактических значениях (что может иметь место, поскольку эти правила не известны).

Да, ваша подпоследовательность будет случайной ( совместная энтропия), при условии, что единственным ограничением ваших критериев выбора является то, что вы "ничего не возвращаете". Другими словами, вы не можете преимущественно фильтровать подпоследовательность по мере ее выбора. Тип выбора тогда не имеет значения... вы всегда можете выбрать нечетные биты или четные биты или первые 10 битов, или как хотите, и ваша подпоследовательность будет иметь именно столько бит энтропии.

Конечно, выбор одного и того же бита не увеличивает вашу общую энтропию, поскольку в этом бите не осталось энтропии, которую можно добавить в вашу систему. Но способ, которым бит был выбран во второй раз (то есть, если это был случайный выбор), сам по себе может добавить некоторую энтропию.

Тем не менее, вероятно, существует высокая степень корреляции между каждой из подпоследовательностей, которые получает каждый клиент, по очевидной причине, что они могут использовать идентичные или перекрывающиеся критерии выбора.

Нет, потому что, если оба клиента выбирают одинаковую или близкую позицию для запуска последовательности, оба имеют одинаковые данные. По отдельности они имеют случайные данные, но не если вы уважаете более 1 пользователя.

Случайные данные могут быть сгенерированы только в том случае, если вы убедитесь, что к каждому номеру может обратиться только один пользователь, а затем, возможно, он будет удален из списка. Конечно, в этом случае вы также можете просто использовать обычный генератор случайных чисел.

Есть ли математическое свойство, которое гарантирует, что...

За исключением контрпримеров, подобных тем, которые дали "MusiGenesis" и "gs", я думаю, что в статистике есть математическое свойство (аксиома или теория, я не знаю, какой): что-то говорит о том, что статистический свойства родительской популяции более или менее хорошо отражаются в свойствах случайно выбранной выборки.

Если

  • количество клиентов было случайным
  • количество пиков было случайным
  • размер первой случайной последовательности был случайным

Тогда... нет, все равно не похоже, что это будет, потому что число пиков у клиента может быть больше, чем в первой последовательности, и в этом случае случайность исчезнет, ​​потому что клиент должен будет решить, что делать, когда он сделал забрать и ничего не получил.

Возможно, это сработало бы, если бы первая последовательность была бесконечного размера.

Редактировать: извините, вы, вероятно, ищете что-то математическое здесь, в форме доказательства. У меня нет таких доказательств:)

Я думаю, что часть того, что делает последовательность случайной, - это способность запускать один и тот же алгоритм и получать разные, непредсказуемые результаты.

В вашем описании, если вы повторили процесс и те же X-клиенты выбрали Y-номера из исходной последовательности, будут ли они выбирать одинаковые подпоследовательности и, следовательно, получать повторяемые, предсказуемые результаты?

Если так, то я бы сказал, что это НЕ случайный процесс. Однако, если ваш выбор подпоследовательности содержит элемент случайности, тогда подпоследовательности будут меняться в последовательных, в противном случае идентичных прогонах, и подпоследовательности могут считаться случайными.

Другие вопросы по тегам