Описание тега apache-drill

Apache Drill - это механизм распределенных запросов с малой задержкой для крупномасштабных наборов данных, включая структурированные и полуструктурированные / вложенные данные. Он может запрашивать вложенные данные в таких форматах, как JSON и Parquet, и выполнять динамическое обнаружение схем.

Drill - это механизм запросов SQL с открытым исходным кодом Apache для исследования больших данных. Drill разработан с нуля для поддержки высокопроизводительного анализа частично структурированных и быстро развивающихся данных, поступающих из современных приложений для работы с большими данными, при этом обеспечивая знакомство и экосистему ANSI SQL, стандартного языка запросов в отрасли. Drill обеспечивает интеграцию plug-and-play с существующими развертываниями Apache Hive и Apache HBase.

Drill поддерживает множество баз данных и файловых систем NoSQL, включая HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, хранилище BLOB-объектов Azure, облачное хранилище Google, Swift, NAS и локальные файлы. Один запрос может объединять данные из нескольких хранилищ данных.

Рекомендуемые справочные источники: