Описание тега bigdata

Большие данные - это концепция, которая имеет дело с наборами данных экстремальных объемов. Вопросы могут быть связаны с инфраструктурой, алгоритмами, статистикой и структурами данных.

Большие данные - это концепция, которая имеет дело с наборами данных экстремальных объемов.

Есть несколько особенностей, которые позволяют выделить это понятие в отдельное:

Данные

  • Данные настолько велики, что их невозможно обработать на одном компьютере
  • Связь между элементами данных чрезвычайно сложна

Алгоритмы

  • Локальные алгоритмы, вычисление которых занимает больше времени, чем O(N), вероятно, займет много лет.
  • Вместо этого используются быстрые распределенные алгоритмы

Место хранения

  • Базовое хранилище данных должно быть отказоустойчивым и поддерживать данные в согласованном состоянии независимо от сбоев устройства.
  • Одно устройство хранения не может вместить весь набор данных

Эко-система

  • Большие данные также являются синонимом набора инструментов, которые используются для обработки огромных объемов данных. Это также известно как экосистема больших данных. Популярные инструменты: HDFS, Spark, MapReduce и т. Д.