Multi Key Maps - сравнение производительности
контекст
Наше приложение хранит много данных в памяти на разных картах, чтобы обеспечить быстрый поиск. Для простоты (без учета примитивных карт) это всегда карта с одним или несколькими ключами. Производительность является большим требованием для нас.
проблема
Я хотел найти наиболее эффективную реализацию карты и, как предложено здесь, я сравнил эти реализации:
Карта Карт (Nested Maps) основана на java.util.HashMap специально для 3 ключей:
Map<K1, Map<K2, Map<K3, V>>>
Ключ Wrapper (кортежи как ключи) в java.util.HashMap
Map<Triple<K1, K2, K3>, V>
Кортежи в качестве ключей в net.openhft.koloboke.collect.map.hash.HashObjObjMap, которая в соответствии с этим должна быть (одной из) самой быстрой картой.
HashObjObjMap<Triple<K1, K2, K3>, V>
ожидания
- Вложенные карты будут иметь самый быстрый GET и самый медленный PUT.
- Хеш-карта Koloboke будет быстрее, чем JDK HashMap.
Результаты
Benchmark Mode Cnt Score Error Units
TupleVsNestedMapsBenchmark.benchGetFromNestedMap avgt 20 11.586 ± 0.205 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTupleKolobokeMap avgt 20 18.619 ± 0.113 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTupleMap avgt 20 8.985 ± 0.085 ns/op
TupleVsNestedMapsBenchmark.benchPutToNestedMap avgt 20 15.106 ± 0.142 ns/op
TupleVsNestedMapsBenchmark.benchPutToTupleKolobokeMap avgt 20 22.533 ± 0.335 ns/op
TupleVsNestedMapsBenchmark.benchPutToTupleMap avgt 20 8.884 ± 0.084 ns/op
эталонный тест
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@BenchmarkMode(Mode.AverageTime)
@OperationsPerInvocation(100000)
@Fork(1)
@Warmup(iterations = 10)
@Measurement(iterations = 20)
public class TupleVsNestedMapsBenchmark {
public static final int N = 10000;
static ObjObjObjObjHashMap<String, String, String, Integer> sourceNestedMap = new ObjObjObjObjHashMap<>();
static Map<Triple<String, String, String>, Integer> sourceTupleMap = new HashMap<>();
static HashObjObjMap<Triple<String, String, String>, Integer> sourceTupleKMap = HashObjObjMaps.newMutableMap();
static {
for (int i = 0; i < N; i++) {
sourceNestedMap.put("a-" + i, "b-" + i, "c-" + i, i);
sourceTupleMap.put(ImmutableTriple.of("a-" + i, "b-" + i, "c-" + i), i);
sourceTupleKMap.put(ImmutableTriple.of("a-" + i, "b-" + i, "c-" + i), i);
}
}
@Benchmark
public List<Integer> benchGetFromNestedMap() {
return benchmarkGet(sourceNestedMap::get);
}
@Benchmark
public List<Integer> benchGetFromTupleMap() {
return benchmarkGet(((key1, key2, key3) -> sourceTupleMap.get(ImmutableTriple.of(key1, key2, key3))));
}
@Benchmark
public List<Integer> benchGetFromTupleKolobokeMap() {
return benchmarkGet(((key1, key2, key3) -> sourceTupleKMap.get(ImmutableTriple.of(key1, key2, key3))));
}
@Benchmark
public ObjObjObjObjHashMap<String, String, String, Integer> benchPutToNestedMap() {
ObjObjObjObjHashMap<String, String, String, Integer> map = new ObjObjObjObjHashMap<>();
benchmarkPut(map::put);
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTupleMap() {
Map<Triple<String, String, String>, Integer> map = new HashMap<>();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple.of(key1, key2, key3), value));
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTupleKolobokeMap() {
HashObjObjMap<Triple<String, String, String>, Integer> map = HashObjObjMaps.newMutableMap();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple.of(key1, key2, key3), value));
return map;
}
private List<Integer> benchmarkGet(MapValueSupplier<Integer> mapValueSupplier) {
List<Integer> result = new ArrayList<>(N);
for (int i = 0; i < N; i++) {
result.add(mapValueSupplier.supply("a-" + i, "b-" + i, "c-" + i));
}
return result;
}
private void benchmarkPut(PutValueFunction<Integer> putValueFunction) {
for (int i = 0; i < N; i++) {
putValueFunction.apply("a-" + i, "b-" + i, "c-" + i, i);
}
}
private interface MapValueSupplier<T> {
T supply(String key1, String key2, String key3);
}
private interface PutValueFunction<T> {
void apply(String key1, String key2, String key3, T value);
}
}
Примечание: пожалуйста, не предлагайте использовать примитивные карты. Integer as (значение) - это просто пример дешевого объекта.
Вопросы
- почему карта колобка в 2,5 раза медленнее, чем карта JDK?
- почему не вложенные карты быстрее? (Я ожидаю, что накладные расходы для объекта ключа кортежа будут больше.)
- Или мой тест неверен? Тогда, как я могу улучшить это?
Обновить
Основываясь на хороших советах @leventov, я изменил Benchmark и попробовал также реализацию Triple, которая кэширует хэш-код (и имеет лучшее распределение) - тесты называются Tuple2.
@State(Scope.Thread)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@BenchmarkMode(Mode.AverageTime)
@OperationsPerInvocation(TupleVsNestedMapsBenchmark.TOTAL_OPS)
@Fork(1)
@Warmup(iterations = 5)
@Measurement(iterations = 20)
public class TupleVsNestedMapsBenchmark {
static final int N = 30;
static final int TOTAL_OPS = N * N * N;
private ObjObjObjObjHashMap<String, String, String, Integer> sourceNestedMap;
private Map<Triple<String, String, String>, Integer> sourceTupleMap;
private HashObjObjMap<Triple<String, String, String>, Integer> sourceTupleKMap;
private Map<Triple<String, String, String>, Integer> sourceTuple2Map;
private HashObjObjMap<Triple<String, String, String>, Integer> sourceTuple2KMap;
private String[] keys;
@Setup
public void init() {
sourceNestedMap = new ObjObjObjObjHashMap<>();
sourceTupleMap = new HashMap<>(TOTAL_OPS);
sourceTupleKMap = HashObjObjMaps.newMutableMap(TOTAL_OPS);
sourceTuple2Map = new HashMap<>(TOTAL_OPS);
sourceTuple2KMap = HashObjObjMaps.newMutableMap(TOTAL_OPS);
keys = new String[N];
for (int i = 0; i < N; i++) {
keys[i] = "k" + i;
}
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
for (int k = 0; k < N; k++) {
sourceNestedMap.put(keys[i], keys[j], keys[k], i);
sourceTupleMap.put(ImmutableTriple.of(keys[i], keys[j], keys[k]), i);
sourceTupleKMap.put(ImmutableTriple.of(keys[i], keys[j], keys[k]), i);
sourceTuple2Map.put(ImmutableTriple2.of(keys[i], keys[j], keys[k]), i);
sourceTuple2KMap.put(ImmutableTriple2.of(keys[i], keys[j], keys[k]), i);
}
}
}
}
@Benchmark
public List<Integer> benchGetFromNestedMap() {
return benchmarkGet(sourceNestedMap::get);
}
@Benchmark
public List<Integer> benchGetFromTupleMap() {
return benchmarkGet(((key1, key2, key3) -> sourceTupleMap.get(ImmutableTriple.of(key1, key2, key3))));
}
@Benchmark
public List<Integer> benchGetFromTupleKolobokeMap() {
return benchmarkGet(((key1, key2, key3) -> sourceTupleKMap.get(ImmutableTriple.of(key1, key2, key3))));
}
@Benchmark
public List<Integer> benchGetFromTuple2Map() {
return benchmarkGet(((key1, key2, key3) -> sourceTuple2Map.get(ImmutableTriple2.of(key1, key2, key3))));
}
@Benchmark
public List<Integer> benchGetFromTuple2KolobokeMap() {
return benchmarkGet(((key1, key2, key3) -> sourceTuple2KMap.get(ImmutableTriple2.of(key1, key2, key3))));
}
@Benchmark
public ObjObjObjObjHashMap<String, String, String, Integer> benchPutToNestedMap() {
ObjObjObjObjHashMap<String, String, String, Integer> map = new ObjObjObjObjHashMap<>();
benchmarkPut(map::put);
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTupleMap() {
Map<Triple<String, String, String>, Integer> map = new HashMap<>();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple.of(key1, key2, key3), value));
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTupleKolobokeMap() {
HashObjObjMap<Triple<String, String, String>, Integer> map = HashObjObjMaps.newMutableMap();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple.of(key1, key2, key3), value));
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTuple2Map() {
Map<Triple<String, String, String>, Integer> map = new HashMap<>();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple2.of(key1, key2, key3), value));
return map;
}
@Benchmark
public Map<Triple<String, String, String>, Integer> benchPutToTuple2KolobokeMap() {
HashObjObjMap<Triple<String, String, String>, Integer> map = HashObjObjMaps.newMutableMap();
benchmarkPut((key1, key2, key3, value) -> map.put(ImmutableTriple2.of(key1, key2, key3), value));
return map;
}
private List<Integer> benchmarkGet(MapValueSupplier<Integer> mapValueSupplier) {
List<Integer> result = new ArrayList<>(TOTAL_OPS);
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
for (int k = 0; k < N; k++) {
Integer value = mapValueSupplier.supply(keys[i], keys[j], keys[k]);
result.add(value);
}
}
}
return result;
}
private void benchmarkPut(PutValueFunction<Integer> putValueFunction) {
Integer value = 1;
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
for (int k = 0; k < N; k++) {
putValueFunction.apply(keys[i], keys[j], keys[k], value);
}
}
}
}
private interface MapValueSupplier<T> {
T supply(String key1, String key2, String key3);
}
private interface PutValueFunction<T> {
void apply(String key1, String key2, String key3, T value);
}
}
и результаты таковы:
Benchmark Mode Cnt Score Error Units
TupleVsNestedMapsBenchmark.benchGetFromNestedMap avgt 20 24.524 ± 0.144 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTuple2KolobokeMap avgt 20 65.604 ± 1.135 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTuple2Map avgt 20 22.653 ± 0.745 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTupleKolobokeMap avgt 20 34824.901 ± 1718.183 ns/op
TupleVsNestedMapsBenchmark.benchGetFromTupleMap avgt 20 2565.835 ± 57.402 ns/op
TupleVsNestedMapsBenchmark.benchPutToNestedMap avgt 20 43.160 ± 0.340 ns/op
TupleVsNestedMapsBenchmark.benchPutToTuple2KolobokeMap avgt 20 237.300 ± 3.362 ns/op
TupleVsNestedMapsBenchmark.benchPutToTuple2Map avgt 20 40.952 ± 0.535 ns/op
TupleVsNestedMapsBenchmark.benchPutToTupleKolobokeMap avgt 20 52315.769 ± 399.769 ns/op
TupleVsNestedMapsBenchmark.benchPutToTupleMap avgt 20 3205.538 ± 44.306 ns/op
Резюме
- Подход "кортеж" может стать очень медленным, если функция хеш-кода класса ключей не кэширована и / или не распределена должным образом, особенно для koloboke.
- И, как заключено также здесь (в этом (Obj-Obj) случае), java.util.HashMap "экстремально" быстр.
3 ответа
[Ответ на обновленный вопрос.]
Ну, есть еще проблемы с тестами:
- При изготовлении
State
жизненный цикл, вы должны передать объект состояния методу benhcmark в качестве параметра (см. мой код ниже). Бенчмаркинг
put()
s должно быть сделано по-другому: 1) в методе @Setup, коллекция должна быть создана (с достаточным количествомcapacity
или жеsize
аргумент) 2) в другом@Setup(Level.Invocation)
метод, вы должны позвонитьcollection.clear()
3) измерить чистотуput()
с в методе эталонногоВы все еще делаете много распределений в методе сравнительного анализа. Это может быть ваш случай, но это скрывает вклад производительности коллекции.
Итак, что я написал:
package tests;
import net.openhft.koloboke.collect.map.hash.HashObjObjMap;
import net.openhft.koloboke.collect.map.hash.HashObjObjMaps;
import org.apache.commons.lang3.tuple.Triple;
import org.openjdk.jmh.annotations.*;
import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.TimeUnit;
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@BenchmarkMode(Mode.AverageTime)
@Fork(1)
@Threads(1)
@Warmup(iterations = 10)
@Measurement(iterations = 20)
@State(Scope.Thread)
public class SoMultiMap {
public static final int N = Integer.getInteger("runs", 100000);
private static final double kbk = Double.parseDouble(System.getProperty("kbk", "1.0"));
static class ImmutableTriple<L, M, R> extends Triple<L, M, R> {
public final L left;
public final M middle;
public final R right;
private int h;
public static <L, M, R> ImmutableTriple<L, M, R> of(L left, M middle, R right) {
return new ImmutableTriple(left, middle, right);
}
public ImmutableTriple(L left, M middle, R right) {
this.left = left;
this.middle = middle;
this.right = right;
}
public L getLeft() {
return this.left;
}
public M getMiddle() {
return this.middle;
}
public R getRight() {
return this.right;
}
private int innerHash() {
int h = left.hashCode();
h *= 1000003;
h += middle.hashCode();
h *= 1000003;
h += right.hashCode();
return h * 1000003;
}
@Override
public int hashCode() {
return h != 0 ? h : (h = innerHash());
}
@Override
public boolean equals(Object obj) {
if (!(obj instanceof ImmutableTriple))
return super.equals(obj);
ImmutableTriple triple = (ImmutableTriple) obj;
if (h != 0 && triple.h != 0 && h != triple.h)
return false;
return super.equals(obj);
}
}
ImmutableTriple<String, String, String>[] keys = new ImmutableTriple[N];
Integer[] values = new Integer[N];
Map<Triple<String, String, String>, Integer> sourceTupleMap;
HashObjObjMap<Triple<String, String, String>, Integer> sourceTupleKMap;
@Setup
public void fill() {
sourceTupleMap = new HashMap<>((int) (N / 0.75));
sourceTupleKMap = HashObjObjMaps.newUpdatableMap((int) (N * kbk));
for (int i = 0; i < N; i++) {
keys[i] = ImmutableTriple.of("a-" + i, "b-" + i, "c-" + i);
values[i] = i;
sourceTupleKMap.put(keys[i], values[i]);
sourceTupleMap.put(keys[i], values[i]);
}
}
@Benchmark
public int tupleHashMapGet(SoMultiMap st) {
ImmutableTriple<String, String, String>[] keys = st.keys;
Map<Triple<String, String, String>, Integer> map = st.sourceTupleMap;
int s = 0;
for (int i = 0; i < N; i++) {
s += map.get(keys[i]);
}
return s;
}
@Benchmark
public int tupleKolobokeGet(SoMultiMap st) {
ImmutableTriple<String, String, String>[] keys = st.keys;
HashObjObjMap<Triple<String, String, String>, Integer> map = st.sourceTupleKMap;
int s = 0;
for (int i = 0; i < N; i++) {
s += map.get(keys[i]);
}
return s;
}
public static void main(String[] args) {
SoMultiMap st = new SoMultiMap();
st.fill();
st.tupleKolobokeGet(st);
st.tupleHashMapGet(st);
}
}
Теперь, что интересно, это результаты:
С Java 7u55:
HashMap: 65 +- 6 ns/op
Koloboke: 46 +- 2
С Java 8u51:
HashMap: 42 +- 0.5
Koloboke: 49 +- 1
Итак, у нас есть некоторые изменения ВМ, что-то среднее, что сделало HashMap
существенно быстрее, и Koloboke
карты - чуть медленнее. Это требует расследования, на которое у меня сейчас нет времени. См. https://github.com/OpenHFT/Koloboke/issues/42
Также обратите внимание на пару вещей:
- Запуск тестов на виртуальной машине сервера
- Отключить масштабирование процессора во время работы
- закрывать тяжелые приложения (браузер, Intellij и т. д.), если у вас нет 16+ аппаратных потоков
Список проблем с вашими тестами:
- инициализация выполняется в статической области, должна быть сделана с
@Setup
методы и@State
s - Тяжелое распределение в пределах эталона и построение строк! Что вы на самом деле измеряете?
- Обратите внимание на ошибку -
N
10K, ноoperationsPerInvocation
100K, поэтому фактическое время довольно депрессивно - Бедные
String
хэш-код + очень плохойTriple
хеш-код, приводит к некоторой кластеризации в хеш-таблицах - При тестировании вложенных и кортежей обратите внимание, что вы выбрали все части всех ключей как уникальные, то есть все вложенные карты являются картами с одним ключом. Это не то, что вы хотели
Triple как абстракция - это нормально (по крайней мере, я не вижу явно лучшей альтернативы, вы можете переопределить Apache Commons' Triple
абстрактный класс, чтобы определить лучше hashCode()
функция.
final class ImmutableTriple<L, M, R> extends Triple<L, M, R> {
public final L left;
public final M middle;
public final R right;
private int h;
public static <L, M, R> ImmutableTriple<L, M, R> of(L left, M middle, R right) {
return new ImmutableTriple(left, middle, right);
}
public ImmutableTriple(L left, M middle, R right) {
this.left = left;
this.middle = middle;
this.right = right;
}
public L getLeft() {
return this.left;
}
public M getMiddle() {
return this.middle;
}
public R getRight() {
return this.right;
}
private int innerHash() {
int h = left.hashCode();
h *= 1000003;
h += middle.hashCode();
h *= 1000003;
h += right.hashCode();
return (int) LongHashFunction.murmur_3().hashInt(h);
}
@Override
public int hashCode() {
return h != 0 ? h : (h = innerHash());
}
}