什麼是Databricks SQL?

Databricks SQL描述了Databricks Lakehouse平台內建的企業數據倉庫。Beplay体育安卓版本Databricks SQL的核心產品是一種優化的計算SQL倉庫

Databricks提供了一組UI工具,稱為SQL的角色編寫和執行SQL查詢可視化,指示板

SQL倉庫為從許多環境(包括第三方環境)執行的SQL查詢提供通用計算BI和可視化工具.Databricks SQL還提供了健壯的API

要了解Databricks SQL的最新功能,請參見Databricks SQL發布說明

Spark SQL vs. Databricks SQL

Databricks SQL是一個優化的計算環境,而Spark SQL描述了一組Apache Spark api。Databricks提供了大量的工具和技術,允許SQL開發人員進行ETL、分析和創建儀表板等工作。磚建議磚的SQL對於企業數據倉庫體驗。

什麼是Spark SQL?

這個詞火花SQL技術上適用於所有使用Spark dataframe的操作。Spark SQL在Spark 2中取代了Spark RDD API。x,為Python、Scala、R和Java引入了對SQL查詢的支持和DataFrame API。

Databricks文檔經常使用Spark SQL來描述SQL查詢和功能。運行在Databricks上的SQL查詢與開源Apache Spark的功能密切相關,並為Delta Lake和專有Databricks特性提供了一些內置擴展協議。屬性可以查看所有可用函數並了解執行上下文之間的差異SQL參考

SQL在Databricks和開源Apache Spark上有什麼不同?

不管執行環境如何,Databricks上的SQL與在其他地方執行的Apache Spark SQL沒有太大區別。可以在Databricks上使用SQL對三種不同的計算選項執行常見查詢和語句。所有這些環境都添加了許多在開源Apache Spark中不可用的命令,並預先配置為運行與Delta Lake相關的所有SQL查詢。

每個計算選項提供了稍微不同的語義和語法。一般來說:

  • SQL on Databricks Runtime計算最類似於開源Apache Spark中的執行。

  • 使用Delta Live表執行的SQL通常繼承Databricks運行時的語法和語義,但為Delta Live表添加了一些專有的關鍵字和函數。

  • 在SQL倉庫上運行的SQL最接近ANSI標準。在Databricks筆記本上運行的針對Databricks Runtime計算的SQL支持的許多特性都不能工作,包括HiveQL語法、變量聲明和引用以及DButils小部件的使用。

Databricks SQL管理任務

如果要查找有關啟用Databricks SQL、管理用戶和數據訪問以及其他管理任務的信息,請參見數據庫SQL管理