Описание тега azure-data-lake

Azure Data Lake Analytics - это набор из трех служб больших данных в Microsoft Azure: HDInsight, Data Lake Store и Data Lake Analytics. Эти полностью управляемые службы позволяют легко приступить к работе и легко масштабировать задания с большими данными, написанные на Hive, Pig, Spark, Storm и U-SQL.

Azure Data Lake Analytics - это набор из трех служб больших данных в Microsoft Azure: HDInsight, Data Lake Store и Data Lake Analytics. Эти полностью управляемые службы позволяют легко приступить к работе и легко масштабировать задания с большими данными, написанные на U-SQL, Apache Hive, Pig, Spark и Storm.

  • HDInsight - это полностью управляемая, отслеживаемая и поддерживаемая служба Apache Hadoop, предоставляющая вам возможности кластеров Hadoop несколькими щелчками мыши.
  • Data Lake Store - это облачный масштабируемый сервис, предназначенный для хранения всех данных для аналитики. Data Lake Store позволяет использовать файлы размером в петабайты и неограниченные размеры учетных записей, предоставляемые через API HDFS, позволяя любому компоненту Hadoop получать доступ к данным. Кроме того, дата в Data Lake Store защищена с помощью списков управления доступом, которые можно привязать к удостоверению на основе OAuth2, в том числе из вашей локальной Active Directory.
  • Data Lake Analytics - это распределенная служба, основанная на Apache YARN, которая динамически масштабируется по запросу, в то время как вы платите только за выполняемое задание. Data Lake Analytics также включает U-SQL, язык, разработанный для больших данных, сохраняющий знакомый декларативный синтаксис SQL, легко расширяемый с помощью пользовательского кода, написанного на C#.

Чтобы узнать больше, посетите: https://azure.microsoft.com/en-us/solutions/data-lake/