Тесты БД: Кассандра против BigTable против Hadoop(s)
Я хочу оценить возможность использования Cassandra, BigTable или Hadoop-решения. Есть ли места, где бы проводилось современное сравнение того, как эти три сравниваются и выполняют набор тестов? Я нашел несколько из, возможно, пять лет назад, но я хотел бы получить более полное представление о трех базах данных - их сильные и слабые стороны - прежде чем погрузиться в.
2 ответа
YCSB (Yahoo! Cloud Serving Benchmark) - это стандарт для тестирования производительности баз данных NoSQL. Эта презентация, как представляется, подводит итог цели YCSB по тестированию задержки и масштабируемости.
В дополнение к задержке и масштабируемости, я проверяю пропускную способность (т. Е. Общую выполненную работу) для высокой пакетной загрузки и хвостовую задержку для систем "онлайн" типа, когда серверы должным образом подготовлены. Под хвостовой задержкой я подразумеваю следующее: насколько быстро медленнее всего 1% (или 0,1%) запросов.
Cloud Bigtable опубликовал некоторые результаты YCSB при первом запуске (к вашему сведению, я работаю над этим продуктом).
- Hadoop - это экосистема, в которой работает множество типов баз данных. Я считаю, что вы хотите сравнить это HBase. Медленнее, что Кассандра в большинстве тестов, которые я видел, вы можете легко найти тесты для сравнения этих двух. И когда вы говорите о Hadoop, вы должны понимать, что это намного более сложная среда, чем Cassandra или BigTable.
- BigTable может съесть почти все, что вы на него бросите, просто заплатите Google, и все будет хорошо. (Видно бенчмарк с 2 миллионами записей в секунду записи).
- Архитектура Cassandra основана на дизайне DynamoDB(AWS) и BigTable. Он очень быстр в рабочих нагрузках, для которых он предназначен (вы можете найти множество тестов на 1 миллион операций записи в секунду).
- Никогда не доверяйте бенчмаркам в интернете:). Вы должны запустить его самостоятельно, с вашими примерами данных. Не все базы данных удовлетворяют всем потребностям. Если вы предоставите немного больше информации о том, какую рабочую нагрузку вы хотите разместить в базах данных, люди здесь могут подсказать вам, какая база данных / базы данных вам нужны. (их намного больше, чем 3, которые вы перечислили).