Девятка Тьюки для разных перетасовок одних и тех же данных

При реализации улучшений для быстрой сортировки я попытался использовать девятку Тьюки, чтобы найти стержень (заимствуя почти все из реализации sedgewick в QuickX.java)

Мой код ниже дает разные результаты каждый раз, когда массив целых чисел перемешивается.

import java.util.Random;
public class TukeysNintherDemo{    
    public static int tukeysNinther(Comparable[] a,int lo,int hi){
        int N = hi - lo + 1;
        int mid = lo + N/2;
        int delta = N/8;
        int m1 = median3a(a,lo,lo+delta,lo+2*delta);
        int m2 = median3a(a,mid-delta,mid,mid+delta);
        int m3 = median3a(a,hi-2*delta,hi-delta,hi);
        int tn = median3a(a,m1,m2,m3);
        return tn;
    }

    // return the index of the median element among a[i], a[j], and a[k]
    private static int median3a(Comparable[] a, int i, int j, int k) {
        return (less(a[i], a[j]) ?
               (less(a[j], a[k]) ? j : less(a[i], a[k]) ? k : i) :
               (less(a[k], a[j]) ? j : less(a[k], a[i]) ? k : i));
    }

    private static boolean less(Comparable x,Comparable y){
        return x.compareTo(y) < 0;
    }
    public static void shuffle(Object[] a) {
    Random random = new Random(System.currentTimeMillis());
        int N = a.length;
        for (int i = 0; i < N; i++) {
            int r = i + random.nextInt(N-i);     // between i and N-1
            Object temp = a[i];
            a[i] = a[r];
            a[r] = temp;
        }
    }
    public static void show(Comparable[] a){    
        int N = a.length;
        if(N > 20){
            System.out.format("a[0]= %d\n", a[0]);
            System.out.format("a[%d]= %d\n",N-1, a[N-1]);
        }else{
            for(int i=0;i<N;i++){
                System.out.print(a[i]+",");
            }
        }
        System.out.println();

    }
    public static void main(String[] args) {
        Integer[] a = new Integer[]{17,15,14,13,19,12,11,16,18};
        System.out.print("data= ");
        show(a);
        int tn = tukeysNinther(a,0,a.length-1);
        System.out.println("ninther="+a[tn]);
    }
}

Running this a cuople of times gives

data= 11,14,12,16,18,19,17,15,13,
ninther=15

data= 14,13,17,16,18,19,11,15,12,
ninther=14

data= 16,17,12,19,18,13,14,11,15,
ninther=16

Будет ли девятка Такки давать разные значения для разных перемешиваний одного и того же набора данных? когда я попытался вручную найти медиану медиан, я обнаружил, что приведенные выше вычисления в коде верны... это означает, что один и тот же набор данных дает разные результаты в отличие от медианы набора данных. Это правильное поведение? Может кто-то с большим знанием в области статистики прокомментировать?

1 ответ

Решение

Девятка Тьюки исследует 9 предметов и вычисляет медиану, используя только те.

Для разных случайных случайных комбинаций вы можете очень легко получить различную девятку Тьюки, потому что разные предметы могут быть проверены. В конце концов, вы всегда проверяете одни и те же слоты массива, но другой случайный порядок может содержать разные элементы в этих слотах.

Ключевым моментом здесь является то, что девятка Тьюки не является медианой данного массива. Это попытка усреднения медианы, сделанная без особых усилий: нам нужно только прочитать 9 пунктов и сделать 12 сравнений, чтобы получить его. Это намного быстрее, чем получение фактической медианы, и имеет меньше шансов привести к нежелательному повороту по сравнению с "медианой трех". Обратите внимание, что шанс все еще существует.

Это отвечает на ваш вопрос?

С другой стороны, кто-нибудь знает, требует ли перестановка быстрой сортировки с использованием девятки Тьюки? Я предполагаю, что да, но я не уверен.

Другие вопросы по тегам