Стабилизация стандартной библиотеки qsort?

Я предполагаю, что старая добрая функция qsort в stdlib не стабильна, потому что страница руководства ничего об этом не говорит. Это функция, о которой я говорю:

   #include <stdlib.h>
   void qsort(void *base, size_t nmemb, size_t size,
              int(*compar)(const void *, const void *));  

Я предполагаю, что если я изменю свою функцию сравнения, чтобы включить в нее адрес того, что я сравниваю, она будет стабильной. Это верно?

Например:

int compareFoos( const void* pA, const void *pB ) {
    Foo *pFooA = (Foo*) pA;
    Foo *pFooB = (Foo*) pB;

    if( pFooA->id < pFooB->id ) {
        return -1;
    } else if( pFooA->id > pFooB->id ) {
        return 1;
    } else if( pA < pB ) {
        return -1;            
    } else if( pB > pA ) {
       return 1;
    } else {
       return 0;
    }
}   

3 ответа

Решение

Нет, на это нельзя рассчитывать, к сожалению. Предположим, у вас есть массив (два поля в каждой записи используются для проверки, но только первое поле используется для сортировки):

BBBB,1
BBBB,2
AAAA,3

Быстрая сортировка может сравнить BBBB,1 с AAAA,3 и поменять их местами, давая:

AAAA,3
BBBB,2
BBBB,1

Если следующим шагом будет сравнение BBBB,2 с BBBB,1, ключи будут одинаковыми, и, поскольку BBBB,2 имеет адрес меньше, чем BBBB,1, обмен не будет. Для стабильной сортировки вы должны были получить:

AAAA,3
BBBB,1
BBBB,2

Единственный способ сделать это - прикрепить начальный адрес указателя (а не его текущий адрес) и отсортировать, используя это, а также другие ключи. Таким образом, исходный адрес становится второстепенной частью ключа сортировки, так что BBBB,1 в конечном итоге закончится раньше BBBB,2 независимо от того, где два BBBB линии идут в процессе сортировки.

Каноническое решение состоит в том, чтобы создать (т.е. выделить память и заполнить) массив указателей на элементы исходного массива, и qsort этот новый массив, использующий дополнительный уровень косвенности и отступающий к сравнению значений указателя, когда вещи, на которые они указывают, равны. Этот подход имеет потенциальную побочную выгоду в том, что вы вообще не изменяете исходный массив - но если вы хотите, чтобы исходный массив был отсортирован в конце, вам придется его переставлять, чтобы он соответствовал порядку в массиве указателей после qsort возвращается.

Это не работает, потому что во время процедуры сортировки порядок будет изменяться, и два элемента не будут иметь согласованного вывода. Что я делаю, чтобы сделать старый добрый qsort стабильным, так это добавить начальный индекс в мою структуру и инициализировать это значение перед передачей его в qsort.

typedef struct __bundle {
    data_t some_data;
    int sort_score;
    size_t init_idx;
} bundle_t;

/*
 .
 .
 .
 .
*/

int bundle_cmp(void *ptr1, void *ptr2) {
    bundle_t *b1, *b2;
    b1 = (budnel_t *) ptr1;
    b2 = (budnel_t *) ptr2;
    if (b1->sort_score < b2->sort_score) {
        return -1;
    }
    if (b1->sort_score > b2->sort_score) {
        return 1;
    }
    if (b1->init_idx < b2->init_idx) {
        return -1;
    }
    if (b1->init_idx > b2->init_idx) {
        return 1;
    }
    return 0;
}

void sort_bundle_arr(bundle_t *b, size_t sz) {
    size_t i;
    for (i = 0; i < sz; i++) {
        b[i]->init_idx = i;
    }
    qsort(b, sz, sizeof(bundle_t), bundle_cmp);
}
Другие вопросы по тегам