數據科學與工程指南
Databricks數據科學與工程是經典的Databricks環境,用於數據科學家、數據工程師和數據分析師之間的協作。它也構成了Databricks機器學習環境.
請注意
如果您是一名主要使用SQL查詢和BI工具的數據分析師,您可能更喜歡磚的SQLpersona-based環境。
Databricks數據科學與工程指南提供了如何指導,以幫助您充分利用Databricks協作分析平台。beplay娱乐iosBeplay体育安卓版本有關入門教程和介紹性信息,請參見從Databricks開始而且介紹磚.
-
在工作區中
了解如何導航Databricks工作空間並訪問工作空間中可用的資產。
-
結構化流
了解如何使用Apache Spark結構化流在Databricks中表示流數據的計算。
-
三角洲生活表
了解如何使用Databricks Delta Live Tables構建數據處理管道。
-
運行時
了解Databricks運行時和運行時內容的類型。
-
集群
了解Databricks集群以及如何創建和管理它們。
-
筆記本電腦
學習如何在Databricks中管理和使用筆記本。
-
工作流
在Databricks中了解如何使用數據處理工具和框架。
-
庫
學習如何在Databricks中使用和管理庫。
-
Git與Databricks Repos集成
了解如何使用Git來管理Databricks筆記本和工作空間文件夾作為共同版本的Databricks Repos。
-
DBFS
了解Databricks文件係統(DBFS),這是一個掛載到Databricks工作空間的分布式文件係統,可在Databricks集群上使用
-
如何處理數據庫上的文件
了解在Databricks上處理文件的選項。
-
遷移
了解如何將工作負載遷移到Databricks。