Какая самая лучшая бесплатная база данных?

Я разрабатываю систему, которая включает в себя много работы olap. Согласно моим исследованиям, хранилище данных на основе столбцов - лучший выбор. Но я озадачен, выбирая хороший продукт хранилища данных.

  1. Все статьи о сравнении хранилищ данных, которые я вижу, относятся к 2012 году, и, похоже, об этом мало статей. Хранилище данных устарело? Hadoop HBase лучше?

  2. Насколько я знаю, InfiniDB - это высокопроизводительный продукт с открытым исходным кодом для хранения данных, но он не поддерживается уже 2 года https://github.com/infinidb/infinidb. И есть небольшой документ о InfiniDB . InfiniDB был обильным разработчиками?

  3. Какой продукт хранилища данных является лучшим на данный момент?

  4. Как постепенно переместить мои бизнес-данные, хранящиеся в базе данных Mysql, в хранилище данных?

Спасибо за ваш ответ!

2 ответа

Решение
  1. Хранилище данных - все еще горячая тема, и HBase - не быстрые, но очень известные и совместимые (многие приложения основаны на этом)

  2. Несколько лет назад я выбрал "Путешествие" для хорошего магазина Column и, наконец, пошел с InfiniDB из-за легкого перехода с простого mysql. Это хорошая программа, но в ней все еще есть ошибки, поэтому я не могу полностью рекомендовать ее для использования в производстве. (не без второго экземпляра аварийного переключения). Тем не менее, MariaDB внедрила технологию InfiniDB и переносит ее на свой сервер базы данных MariaDB. Этот новый продукт называется MariaDB Columnstore[1], с тестовой сборкой. Они уже приложили немало усилий, поэтому я думаю, что ColumnStore получит крупный продукт MariaDB в течение следующих двух лет.

  3. Я не могу ответить на это. Я все еще с InfiniDB, а также помогаю другим в их проектах.

  4. Это полностью зависит от вашей структуры данных и использования.

InfiniDB отлично справляется с запросами, у него (в моих тестах) производительность была примерно на 8% выше, чем у impala, однако Infinidb поддерживает INSERT, UPDATE, DELETE и транзакции, что не очень хорошо для транзакционной рабочей нагрузки. то есть просто переместить сайт, управляемый сообществом, на infinidb, где посетители, всегда манипулирующие данными, НЕ будут работать хорошо одна вставка с 10000 строками будет работать хорошо, 10000 вставок с 1 строкой убьют ее.

Мы развернули Infinidb для наших клиентов, чтобы "помочь" производительности запросов при обычной установке mariadb - мы создали инструмент, который импортирует и обновляет таблицы базы данных MariaDB в InfiniDB для более быстрого запроса. манипуляции с этой таблицей все еще выполняются в MairaDB, а изменения импортируются пакетно в InfiniDB с 30-секундной задержкой. поскольку исходные таблицы и таблицы infinidb имеют одинаковую структуру и доступны через api mysql, мы можем просто переключать соединение с базой данных и выполнять сверхбыстрые запросы SELECT. это хорошо работает для нашего варианта использования.

Мы также создали новые статистические / аналитические приложения с нуля для работы с infinidb и заменили старую систему на основе MySQL, которая также отлично работает и превосходит любые ожидания в отношении производительности. (теперь у нас есть 15-кратное количество данных, которые мы имели в mariadb, и его все еще проще поддерживать и гораздо быстрее запрашивать).

[1] https://mariadb.com/products/mariadb-columnstore

Я бы дал Splice Machine шанс (Open Source). Он хранит данные в HBase и предоставляет основные функции управления данными, которые предоставляет хранилище (первичные ключи, ограничения, внешние ключи и т. Д.)

Другие вопросы по тегам