Как отсортировать массив, но сохранить позицию дублирующего элемента в C?
Итак, на самом деле мне нужно сохранить индекс старого массива после сортировки. Так, например, если я введу [2,4,1,5,7,9,6]
тогда вывод [2,0,1,3,6,4,5]
, У меня уже есть использование qsort
и это работает очень хорошо, если нет повторяющихся элементов.
Если есть повторяющиеся элементы, иногда первый дублирующий элемент помещается последним. Например, если вход [5,4,6,5,2,1,3]
что я хочу получить [5,4,6,1,0,3,2]
, Так, 5
которые имеют индекс 0
поставить перед 5
которые имеют индекс 3
, Но, используя qsort
иногда делаю вывод [5,4,6,1,3,0,2]
,
Можете ли вы помочь мне исправить это? Или я должен создать свою собственную функцию сортировки? Не могли бы вы помочь мне создать его?
Вот мой код:
#include <stdlib.h>
int* sortidx(double *X,int n)
{
int *idx,i,j;
int cmp(const void *a,const void *b)
{
return X[*(int*)a]>=X[*(int*)b]?1:-1;
}
idx=(int*)calloc(n,sizeof(int));
for(i=0;i<n;i++)
{
idx[i]=i;
}
qsort(idx,n,sizeof(int),cmp);
return idx;
}
2 ответа
Вы хотите, чтобы один элемент считался большим, чем другой, если либо его значение больше, либо если значения равны, а его индекс больше. (Это идея стабильного алгоритма сортировки.)
В этом случае вы знаете индексы сравниваемых элементов, поэтому вы можете легко добавить это к своему критерию сравнения:
int cmp(const void *a, const void *b)
{
return X[*(int*)a] > X[*(int*)b] ||
(X[*(int*)a] == X[*(int*)b] && *(int*)a > *(int*)b)
?1:-1;
}
или, возможно, более читабельно и педантично правильно (поскольку не задокументировано, что a
а также b
гарантированно будут разными):
int cmp(const void *a, const void *b)
{
int idxa = *(const int*)a, idxb = *(const int*)b;
if (X[idxa] > X[idxb]) return 1;
if (X[idxa] < X[idxb]) return -1;
return idxa - idxb;
}
Использование вложенной функции, которая ссылается на аргумент X
является расширением gcc и может не работать с другими компиляторами. Gnu-реализация стандартной библиотеки C также содержит функцию qsort_r
, который может быть использован для передачи X
к процедуре сравнения, но более переносимым способом написания функции будет использование массива указателей, а не массива индексов:
int idxcmp(const void *a,const void *b)
{
double *ap = *(double *const*)a, *bp = *(double *const*)b;
if (*ap > *bp) return 1;
if (*ap < *bp) return -1;
return ap - bp;
}
double** sortidx(double *X, size_t n)
{
double **idx = calloc(n, sizeof(double*));
for (size_t i=0; i<n; ++i) idx[i] = X + i;
qsort(idx, n, sizeof(idx[0]), idxcmp);
return idx;
}
(Если вы действительно хотите вернуть индексы, вы можете преобразовать указатель в индекс перед возвратом.)
То, что вы ищете, это стабильный алгоритм сортировки. Вы можете стабилизировать qsort
в С, но это требует дополнительной работы. В C++ std::stable_sort
существует.
Если вам нужно придерживаться C, то вы должны реализовать свою собственную стабильную сортировку. Вот список устойчивых алгоритмов сортировки:
B
Block sort
Bubble sort
Bucket sort
C
Cascade merge sort
Cocktail shaker sort
Counting sort
Cubesort
G
Gnome sort
I
Insertion sort
L
Library sort
M
Merge sort
O
Odd–even sort
Oscillating merge sort
P
Pigeonhole sort
Proxmap sort
R
Radix sort
T
Timsort