Почему мой собственный AtomicLong работает медленнее, чем тот, что есть в JDK?

Я писал свой AtomicLong класс, и я только что обнаружил, что функция, которую я имел, намного медленнее, чем та, что предусмотрена в классе Unsafe. Мне интересно почему?

Ниже приведены коды, которые у меня есть:

public interface Counter {
    void increment();
    long get();
}


public class PrimitiveUnsafeSupportCounter implements Counter{

    private volatile long count = 0;
    private Unsafe unsafe;
    private long offset;

    public PrimitiveUnsafeSupportCounter() throws IllegalAccessException, NoSuchFieldException {
        Field f = Unsafe.class.getDeclaredField("theUnsafe");
        f.setAccessible(true);
        this.unsafe = (Unsafe) f.get(null);
        this.offset = this.unsafe.objectFieldOffset(PrimitiveUnsafeSupportCounter.class.getDeclaredField("count"));
    }

    @Override
    public void increment() {

        this.unsafe.getAndAddLong(this, this.offset, 1);
    }

    @Override
    public long get() {
        return this.count;
    }
}

public class CounterThread implements Runnable {

    private Counter counter;

    public CounterThread(Counter counter){
        this.counter = counter;
    }
    @Override
    public void run() {

        for (int i = 0; i < 100000; i ++){
            this.counter.increment();
        }
    }
}

class Test{

    public static void test(Counter counter) throws NoSuchFieldException, IllegalAccessException, InterruptedException {

        ExecutorService executor = Executors.newFixedThreadPool(1000);

        long start = System.currentTimeMillis();
        for (int i = 0 ; i < 1000; i++){
            executor.submit(new CounterThread(counter));
        }

        executor.shutdown();
        executor.awaitTermination(1, TimeUnit.MINUTES);
        long stop = System.currentTimeMillis();

        System.out.println(counter.get());
        System.out.println(stop - start);
    }

}

public class Main {
    public static void main(String[] args) throws NoSuchFieldException, IllegalAccessException, InterruptedException {

        Counter primitiveUnsafeSupportCounter = new PrimitiveUnsafeSupportCounter();
        Test.test(primitiveUnsafeSupportCounter);

    }

}

для завершения вышеуказанных кодов требуется около 3000 мс. однако, если я использовал приведенные ниже коды вместо this.unsafe.getAndAddLong(this, this.offset, 1);,

long before;
do {
     before = this.unsafe.getLongVolatile(this, this.offset);
} while (!this.unsafe.compareAndSwapLong(this, this.offset, before, before + 1));

Я прошел через исходники getAndAddLong и обнаружил, что он делает почти то же самое, что и приведенные выше коды, так что я должен пропустить?

1 ответ

Это встроенная и написанная от руки версия цикла JVM для этой цели имеет крайне неэффективный скомпилированный код. На x86 вы можете иметь атомарную версию таких операций чтения-изменения-записи через lock префикс. См. Руководство Intel 8.1.2.2 "Программная блокировка шины":

Чтобы явно форсировать семантику LOCK, программное обеспечение может использовать префикс LOCK со следующими инструкциями, когда они используются для изменения области памяти.

В частности, вы можете иметь что-то вроде lock add op1 op2, В вашем примере вы проверяете результат cmpxchg и сделать прыжок, который, очевидно, медленнее. Также, насколько я помню, для x86 энергозависимый доступ требует какого-то mfence или же lock обеспечить порядок памяти.

Другие вопросы по тегам