Алгоритм PHP для генерации всех комбинаций определенного размера из одного набора

Я пытаюсь вывести алгоритм, который генерирует все возможные комбинации определенного размера, что-то вроде функции, которая принимает массив символов и размера в качестве параметра и возвращает массив комбинаций.

Пример: допустим, у нас есть набор символов: Set A = {A,B,C}

а) Все возможные комбинации размера 2: (3^2 = 9)

AA, AB, AC
BA, BB, BC
CA, CB, CC

б) Все возможные комбинации размера 3: (3^3 = 27)

AAA, AAB, AAC,
ABA, ABB, ACC,
CAA, BAA, BAC,
.... ad so on total combinations = 27

Обратите внимание, что размер пары может превышать общий размер пары. Ex. если набор содержит 3 символа, то мы также можем создать комбинацию размера 4.

РЕДАКТИРОВАТЬ: Также обратите внимание, что это отличается от перестановки. В перестановке мы не можем иметь повторяющиеся символы, например, AA не может прийти, если мы используем алгоритм перестановки. В статистике это известно как выборка.

3 ответа

Решение

Я бы использовал рекурсивную функцию. Вот (рабочий) пример с комментариями. Надеюсь, что это работает для вас!

function sampling($chars, $size, $combinations = array()) {

    # if it's the first iteration, the first set 
    # of combinations is the same as the set of characters
    if (empty($combinations)) {
        $combinations = $chars;
    }

    # we're done if we're at size 1
    if ($size == 1) {
        return $combinations;
    }

    # initialise array to put new values in
    $new_combinations = array();

    # loop through existing combinations and character set to create strings
    foreach ($combinations as $combination) {
        foreach ($chars as $char) {
            $new_combinations[] = $combination . $char;
        }
    }

    # call same function again for the next iteration
    return sampling($chars, $size - 1, $new_combinations);

}

// example
$chars = array('a', 'b', 'c');
$output = sampling($chars, 2);
var_dump($output);
/*
array(9) {
  [0]=>
  string(2) "aa"
  [1]=>
  string(2) "ab"
  [2]=>
  string(2) "ac"
  [3]=>
  string(2) "ba"
  [4]=>
  string(2) "bb"
  [5]=>
  string(2) "bc"
  [6]=>
  string(2) "ca"
  [7]=>
  string(2) "cb"
  [8]=>
  string(2) "cc"
}
*/

Возможный алгоритм будет:

$array_elems_to_combine = array('A', 'B', 'C');
$size = 4;
$current_set = array('');

for ($i = 0; $i < $size; $i++) {
    $tmp_set = array();
    foreach ($current_set as $curr_elem) {
        foreach ($array_elems_to_combine as $new_elem) {
            $tmp_set[] = $curr_elem . $new_elem;
        }
    }
    $current_set = $tmp_set;
}

return $current_set;

По сути, вы будете брать каждый элемент текущего набора и добавлять все элементы массива элементов.

На первом этапе: в результате вы получите ('a', 'b', 'c')после шага секунд: ('aa', 'ab', 'ac', 'ba', 'bb', 'bc', 'ca', 'cb', 'cc') и так далее.

Вы можете сделать это рекурсивно. Обратите внимание, что согласно вашему определению, "комбинации" длины n+1 могут быть получены из комбинаций длины n взяв каждую комбинацию длины n и добавление одного из писем из вашего набора. Если вы заботитесь, вы можете доказать это с помощью математической индукции.

Так, например, с набором {A,B,C} комбинации длины 1:

A, B, C

Поэтому комбинации длины 2 являются

(A, B, C) + A = AA, BA, CA
(A, B, C) + B = AB, BB, BC
(A, B, C) + C = AC, CB, CC

Это был бы код и здесь на Ideone

function comb ($n, $elems) {
    if ($n > 0) {
      $tmp_set = array();
      $res = comb($n-1, $elems);
      foreach ($res as $ce) {
          foreach ($elems as $e) {
             array_push($tmp_set, $ce . $e);
          }
       }
       return $tmp_set;
    }
    else {
        return array('');
    }
}
$elems = array('A','B','C');
$v = comb(4, $elems);

Вот код, сделанный другом, он генерировал уникальные комбинации чисел X из списка чисел.

Если у вас есть список чисел, например 1,3,4,7,12, вы можете сгенерировать наборы X номеров, все уникальные, без повторения.

Первая функция работает с PHP 7.4 или более поздней версии, а вторая использует ключи для хранения значений. Оба работают очень хорошо на основе тестов.

function get_combos74($map, $size, &$generated = [], $loop = 1, $i = 0, $prefix = [])
{
    if ($loop == 1) {
        sort($map);
    }

    for (; $i < count($map); $i++) {
        if ($loop < $size) {
            get_combos74($map, $size, $generated, $loop + 1, $i + 1, [...$prefix, $map[$i]]);
        } else {
            $generated[] = [...$prefix, $map[$i]];
        }
    }

    return $generated;
}
function get_combosSTR($map, $size, &$generated = [], $loop = 1, $i = 0, $prefix = '')
{
    if ($loop == 1) {
        sort($map);
    }

    for (; $i < count($map); $i++) {
        if ($loop < $size) {
            get_combosSTR($map, $size, $generated, $loop + 1, $i + 1, "$prefix{$map[$i]}:");
        } else {
            $generated["$prefix{$map[$i]}"] = 0;
        }
    }

    return $generated;
}

Другая идея, использующая числовое базовое преобразование

$items = ['a', 'b', 'c', 'd'];
$length = 3;
$numberOfSequences = pow(count($items), $length);
for ($i = 0; $i < $numberOfSequences; $i++) {
    $results[] = array_map(function ($key) use ($items) {
        return $items[base_convert($key, count($items), 10)];
    }, str_split(str_pad(base_convert($i, 10, count($items), $length, 0, STR_PAD_LEFT)));
}

return $results;
Другие вопросы по тегам