Описание тега apache-spark-sql
Apache Spark SQL - это инструмент для "обработки SQL и структурированных данных" в Spark, быстрой и универсальной кластерной вычислительной системе. Его можно использовать для извлечения данных из Hive, Parquet и т. Д. И выполнения SQL-запросов по существующим RDD и Datasets.
Apache Spark SQL - это инструмент для "обработки SQL и структурированных данных" на apache-spark. Он предоставляет программную абстракцию под названием DataFrames, а также может действовать как механизм распределенных запросов SQL.
Ресурсы
- Веб-сайт Apache Spark SQL
- Руководство по программированию Spark SQL и DataFrame
- Spark SQL на блоках данных
Связанные теги: apache-spark, apache- spark-dataset, spark-daframe