NoSQL как решение для интеллектуального анализа данных?

Каким образом базы данных NoSQL более полезны для интеллектуального анализа данных, чем базы данных OLAP, или как они менее полезны?

Есть ли преимущество в быстром извлечении данных из гигантского объема данных, а также в наличии базы данных без схемы?

1 ответ

Речь идет о расширенных возможностях запросов

И базы данных NoSQL здесь довольно бесполезны.

Они предназначены для чрезвычайно простых запросов, таких как хранение значения ключа.

Но вы не можете сделать много анализа с этим.

База данных, подходящая для интеллектуального анализа данных, должна позволять:

  • поиск похожих записей (k ближайших соседей) с функциями подобия для конкретного домена
  • Самосоединение ближайшего соседа, самосоединение радиуса
  • парные сравнения
  • оптимизация математических уравнений и быстрой векторной математики, предпочтительно с разгрузкой графического процессора

То, что люди делают при майнинге баз данных, это ETL:

  • извлечь то, что им нужно с помощью SELECT
  • превратить его в желаемую схему
  • загрузить его из базы данных в приложение интеллектуального анализа данных

т.е. база данных делает ETL, но извлечение данных происходит снаружи.

Другие вопросы по тегам