Алгоритм выбора колеса рулетки
Кто-нибудь может предоставить какой-нибудь псевдокод для функции выбора рулетки? Как бы это реализовать: я не очень понимаю, как читать эту математическую нотацию. Мне нужен общий алгоритм для этого.
12 ответов
Другие ответы, кажется, предполагают, что вы пытаетесь реализовать игру в рулетку. Я думаю, что вы спрашиваете о выборе колеса рулетки в эволюционных алгоритмах.
Вот некоторый Java-код, который реализует выбор колеса рулетки.
Предположим, у вас есть 10 элементов на выбор, и вы выбираете, генерируя случайное число от 0 до 1. Вы делите диапазон от 0 до 1 на десять непересекающихся сегментов, каждый из которых пропорционален пригодности одного из десяти элементов. Например, это может выглядеть так:
0 - 0.3 is item 1
0.3 - 0.4 is item 2
0.4 - 0.5 is item 3
0.5 - 0.57 is item 4
0.57 - 0.63 is item 5
0.63 - 0.68 is item 6
0.68 - 0.8 is item 7
0.8 - 0.85 is item 8
0.85 - 0.98 is item 9
0.98 - 1 is item 10
Это ваше колесо рулетки. Ваше случайное число от 0 до 1 - ваше вращение. Если случайное число равно 0,46, то выбранным элементом является пункт 3. Если это 0,92, то это элемент 9.
Вот немного кода на Python:
def roulette_select(population, fitnesses, num):
""" Roulette selection, implemented according to:
<http://stackru.com/questions/177271/roulette
-selection-in-genetic-algorithms/177278#177278>
"""
total_fitness = float(sum(fitnesses))
rel_fitness = [f/total_fitness for f in fitnesses]
# Generate probability intervals for each individual
probs = [sum(rel_fitness[:i+1]) for i in range(len(rel_fitness))]
# Draw new population
new_population = []
for n in xrange(num):
r = rand()
for (i, individual) in enumerate(population):
if r <= probs[i]:
new_population.append(individual)
break
return new_population
Во-первых, сгенерируйте массив процентов, которые вы присвоили, скажем, p[1..n]
и предположим, что сумма является суммой всех процентов.
Затем получить случайное число от 1 до итога, скажем, r
Теперь алгоритм в lua:
local c = 0
for i = 1,n do
c = c + p[i]
if r <= c then
return i
end
end
Для этого есть 2 шага: сначала создайте массив со всеми значениями на колесе. Это может быть двухмерный массив с цветом, а также числом, или вы можете добавить 100 к красным числам.
Затем просто сгенерируйте случайное число между 0 или 1 (в зависимости от того, начинает ли ваш язык нумерацию индексов массива с 0 или 1) и последний элемент в вашем массиве.
Большинство языков имеют встроенные функции случайных чисел. В VB и VBScript
функция RND()
, В JavaScript это Math.random()
Получите значение из этой позиции в массиве, и вы получите ваш случайный номер рулетки.
Последнее замечание: не забудьте запустить генератор случайных чисел, иначе вы получите одинаковую последовательность розыгрышей при каждом запуске программы.
Вот действительно быстрый способ сделать это с помощью выбора потока в Java. Он выбирает индексы массива, используя значения в качестве весов. Нет необходимости в совокупных весах из-за математических свойств.
static int selectRandomWeighted(double[] wts, Random rnd) {
int selected = 0;
double total = wts[0];
for( int i = 1; i < wts.length; i++ ) {
total += wts[i];
if( rnd.nextDouble() <= (wts[i] / total)) selected = i;
}
return selected;
}
Это можно улучшить, используя суммирование по Кахану или считывая двойные числа как итерируемые, если массив слишком велик для инициализации сразу.
Я хотел то же самое и поэтому создал этот автономный класс рулетки. Вы даете ему серию весов (в форме двойного массива), и он просто возвращает индекс из этого массива в соответствии со взвешенным случайным выбором.
Я создал класс, потому что вы можете получить большую скорость, только делая накопительные добавления один раз через конструктор. Это код C#, но наслаждайтесь скоростью и простотой C!
class Roulette
{
double[] c;
double total;
Random random;
public Roulette(double[] n) {
random = new Random();
total = 0;
c = new double[n.Length+1];
c[0] = 0;
// Create cumulative values for later:
for (int i = 0; i < n.Length; i++) {
c[i+1] = c[i] + n[i];
total += n[i];
}
}
public int spin() {
double r = random.NextDouble() * total; // Create a random number between 0 and 1 and times by the total we calculated earlier.
//int j; for (j = 0; j < c.Length; j++) if (c[j] > r) break; return j-1; // Don't use this - it's slower than the binary search below.
//// Binary search for efficiency. Objective is to find index of the number just above r:
int a = 0;
int b = c.Length - 1;
while (b - a > 1) {
int mid = (a + b) / 2;
if (c[mid] > r) b = mid;
else a = mid;
}
return a;
}
}
Начальный вес зависит от вас. Может быть, это может быть пригодность каждого члена или значение, обратно пропорциональное положению члена в "50 лучших". Например: 1-е место = 1,0 взвешивание, 2-е место = 0,5, 3-е место = 0,333, 4-е место = 0,25 взвешивания и т. Д. И т. Д.
Что ж, для колеса американской рулетки вам нужно сгенерировать случайное целое число от 1 до 38. Есть 36 чисел, 0 и 00.
Однако важно учитывать, что в американской рулетке можно делать много разных ставок. Одна ставка может охватывать 1, 2, 3, 4, 5, 6, две разные 12 или 18. Вы можете создать список списков, где у каждого номера есть дополнительные флажки, чтобы упростить это, или сделать все это в программировании.,
Если бы я реализовывал это в Python, я бы просто создал Tuple с 0, 00 и 1 по 36 и использовал random.choice() для каждого вращения.
Вы можете использовать структуру данных следующим образом:
Map<A, B> roulette_wheel_schema = new LinkedHashMap<A, B>()
где A представляет собой целое число, которое представляет карман колеса рулетки, а B представляет собой индекс, который идентифицирует хромосому в популяции. Количество карманов пропорционально пригодности, пропорциональной каждой хромосоме:
количество карманов = (пригодность пропорциональна) · (коэффициент масштабирования)
Затем мы генерируем случайное число от 0 до размера схемы выбора, и с помощью этого случайного числа мы получаем индекс хромосомы из рулетки.
Мы рассчитываем относительную ошибку между пропорциональностью пригодности каждой хромосомы и вероятностью выбора по схеме отбора.
Метод getRouletteWheel возвращает схему выбора на основе предыдущей структуры данных.
private Map<Integer, Integer> getRouletteWheel(
ArrayList<Chromosome_fitnessProportionate> chromosomes,
int precision) {
/*
* The number of pockets on the wheel
*
* number of pockets in roulette_wheel_schema = probability ·
* (10^precision)
*/
Map<Integer, Integer> roulette_wheel_schema = new LinkedHashMap<Integer, Integer>();
double fitness_proportionate = 0.0D;
double pockets = 0.0D;
int key_counter = -1;
double scale_factor = Math
.pow(new Double(10.0D), new Double(precision));
for (int index_cromosome = 0; index_cromosome < chromosomes.size(); index_cromosome++){
Chromosome_fitnessProportionate chromosome = chromosomes
.get(index_cromosome);
fitness_proportionate = chromosome.getFitness_proportionate();
fitness_proportionate *= scale_factor;
pockets = Math.rint(fitness_proportionate);
System.out.println("... " + index_cromosome + " : " + pockets);
for (int j = 0; j < pockets; j++) {
roulette_wheel_schema.put(Integer.valueOf(++key_counter),
Integer.valueOf(index_cromosome));
}
}
return roulette_wheel_schema;
}
Это предполагает некоторый класс "Классификатор", который просто имеет условие String, сообщение String и двойную силу. Просто следуй логике.
-- Павел
public static List<Classifier> rouletteSelection(int classifiers) {
List<Classifier> classifierList = new LinkedList<Classifier>();
double strengthSum = 0.0;
double probabilitySum = 0.0;
// add up the strengths of the map
Set<String> keySet = ClassifierMap.CLASSIFIER_MAP.keySet();
for (String key : keySet) {
/* used for debug to make sure wheel is working.
if (strengthSum == 0.0) {
ClassifierMap.CLASSIFIER_MAP.get(key).setStrength(8000.0);
}
*/
Classifier classifier = ClassifierMap.CLASSIFIER_MAP.get(key);
double strength = classifier.getStrength();
strengthSum = strengthSum + strength;
}
System.out.println("strengthSum: " + strengthSum);
// compute the total probability. this will be 1.00 or close to it.
for (String key : keySet) {
Classifier classifier = ClassifierMap.CLASSIFIER_MAP.get(key);
double probability = (classifier.getStrength() / strengthSum);
probabilitySum = probabilitySum + probability;
}
System.out.println("probabilitySum: " + probabilitySum);
while (classifierList.size() < classifiers) {
boolean winnerFound = false;
double rouletteRandom = random.nextDouble();
double rouletteSum = 0.0;
for (String key : keySet) {
Classifier classifier = ClassifierMap.CLASSIFIER_MAP.get(key);
double probability = (classifier.getStrength() / strengthSum);
rouletteSum = rouletteSum + probability;
if (rouletteSum > rouletteRandom && (winnerFound == false)) {
System.out.println("Winner found: " + probability);
classifierList.add(classifier);
winnerFound = true;
}
}
}
return classifierList;
}
Я разработал Java-код, похожий на код Дана Дайера (упоминавшийся ранее). Однако мое колесо рулетки выбирает один элемент на основе вектора вероятности (входной) и возвращает индекс выбранного элемента. Сказав это, следующий код более уместен, если размер выбора является унитарным, и если вы не предполагаете, как рассчитываются вероятности и допускается нулевое значение вероятности. Код является автономным и включает в себя тест с 20 вращениями колес (для запуска).
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Random;
import java.util.logging.Level;
import java.util.logging.Logger;
/**
* Roulette-wheel Test version.
* Features a probability vector input with possibly null probability values.
* Appropriate for adaptive operator selection such as Probability Matching
* or Adaptive Pursuit, (Dynamic) Multi-armed Bandit.
* @version October 2015.
* @author Hakim Mitiche
*/
public class RouletteWheel {
/**
* Selects an element probabilistically.
* @param wheelProbabilities elements probability vector.
* @param rng random generator object
* @return selected element index
* @throws java.lang.Exception
*/
public int select(List<Double> wheelProbabilities, Random rng)
throws Exception{
double[] cumulativeProba = new double[wheelProbabilities.size()];
cumulativeProba[0] = wheelProbabilities.get(0);
for (int i = 1; i < wheelProbabilities.size(); i++)
{
double proba = wheelProbabilities.get(i);
cumulativeProba[i] = cumulativeProba[i - 1] + proba;
}
int last = wheelProbabilities.size()-1;
if (cumulativeProba[last] != 1.0)
{
throw new Exception("The probabilities does not sum up to one ("
+ "sum="+cumulativeProba[last]);
}
double r = rng.nextDouble();
int selected = Arrays.binarySearch(cumulativeProba, r);
if (selected < 0)
{
/* Convert negative insertion point to array index.
to find the correct cumulative proba range index.
*/
selected = Math.abs(selected + 1);
}
/* skip indexes of elements with Zero probability,
go backward to matching index*/
int i = selected;
while (wheelProbabilities.get(i) == 0.0){
System.out.print(i+" selected, correction");
i--;
if (i<0) i=last;
}
selected = i;
return selected;
}
public static void main(String[] args){
RouletteWheel rw = new RouletteWheel();
int rept = 20;
List<Double> P = new ArrayList<>(4);
P.add(0.2);
P.add(0.1);
P.add(0.6);
P.add(0.1);
Random rng = new Random();
for (int i = 0 ; i < rept; i++){
try {
int s = rw.select(P, rng);
System.out.println("Element selected "+s+ ", P(s)="+P.get(s));
} catch (Exception ex) {
Logger.getLogger(RouletteWheel.class.getName()).log(Level.SEVERE, null, ex);
}
}
P.clear();
P.add(0.2);
P.add(0.0);
P.add(0.5);
P.add(0.0);
P.add(0.1);
P.add(0.2);
//rng = new Random();
for (int i = 0 ; i < rept; i++){
try {
int s = rw.select(P, rng);
System.out.println("Element selected "+s+ ", P(s)="+P.get(s));
} catch (Exception ex) {
Logger.getLogger(RouletteWheel.class.getName()).log(Level.SEVERE, null, ex);
}
}
}
/**
* {@inheritDoc}
* @return
*/
@Override
public String toString()
{
return "Roulette Wheel Selection";
}
}
Ниже образца выполнения для пробного вектора P=[0.2,0.1,0.6,0.1], WheelElements = [0,1,2,3]:
Элемент выбран 3, P(s)=0,1
Элемент выбран 2, P (s) = 0,6
Элемент выбран 3, P(s)=0,1
Элемент выбран 2, P (s) = 0,6
Элемент выбран 1, P(s)=0,1
Элемент выбран 2, P (s) = 0,6
Элемент выбран 3, P(s)=0,1
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 3, P(s)=0,1
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Выбранный элемент 0, P (s) = 0,2
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Элемент выбран 2, P (s) = 0,6
Код также проверяет колесо рулетки с нулевой вероятностью.
Я боюсь, что любой, кто использует встроенный генератор случайных чисел во всех языках программирования, должен знать, что сгенерированное число не является случайным на 100%. Поэтому следует использовать с осторожностью.
Генератор случайных чисел псевдокод
- добавить один к последовательному счетчику
- получить текущее значение последовательного счетчика
- добавить значение счетчика по счетчику тиков компьютера или другому значению таймера с небольшим интервалом
- При желании добавьте дополнительные числа, такие как числа из внешнего устройства, такого как генератор плазмы, или какой-то другой случайный феномен.
- разделите результат на очень большое простое число,например 359334085968622831041960188598043661065388726959079837
- получить несколько цифр в крайнем правом углу десятичной точки результата
- используйте эти цифры как случайное число
Используйте цифры случайных чисел для создания случайных чисел от 1 до 38 (или 37 европейских) для рулетки.