Hadoop Hypercube

Эй, я запускаю гиперкуб на основе hadoop с гибким количеством измерений. Кто-нибудь знает какие-либо существующие подходы к этому?

Я только что нашел PigOLAPSketch, но нет кода для его использования.

Другой подход - это Zohmg из lastfm, который использует hbase, но, похоже, очень мертв.

Я думаю, что я начну решение свиньи, может быть, у вас есть какие-то советы?

2 ответа

Вы также можете взглянуть на базу данных на базе gpu https://www.kinetica.com/ но это не открытый исходный код, для него требуются отдельные устройства и перемещение данных из Hadoop в инфраструктуру Kinetica.

Это было бы очень круто / полезно. OpenTSDB - это база данных временных рядов HBase, на которую, возможно, будет интересно взглянуть, у них продуманный подход к вторичной индексации.

Другие вопросы по тегам