NoSQL как решение для интеллектуального анализа данных?
Каким образом базы данных NoSQL более полезны для интеллектуального анализа данных, чем базы данных OLAP, или как они менее полезны?
Есть ли преимущество в быстром извлечении данных из гигантского объема данных, а также в наличии базы данных без схемы?
1 ответ
Речь идет о расширенных возможностях запросов
И базы данных NoSQL здесь довольно бесполезны.
Они предназначены для чрезвычайно простых запросов, таких как хранение значения ключа.
Но вы не можете сделать много анализа с этим.
База данных, подходящая для интеллектуального анализа данных, должна позволять:
- поиск похожих записей (k ближайших соседей) с функциями подобия для конкретного домена
- Самосоединение ближайшего соседа, самосоединение радиуса
- парные сравнения
- оптимизация математических уравнений и быстрой векторной математики, предпочтительно с разгрузкой графического процессора
То, что люди делают при майнинге баз данных, это ETL:
- извлечь то, что им нужно с помощью
SELECT
- превратить его в желаемую схему
- загрузить его из базы данных в приложение интеллектуального анализа данных
т.е. база данных делает ETL, но извлечение данных происходит снаружи.