數據科學與工程指南

Databricks數據科學與工程是經典的Databricks環境,用於數據科學家、數據工程師和數據分析師之間的協作。它也構成了Databricks機器學習環境

請注意

如果您是一名主要使用SQL查詢和BI工具的數據分析師,您可能更喜歡磚的SQLpersona-based環境。

Databricks數據科學與工程指南提供了如何指導,以幫助您充分利用Databricks協作分析平台。beplay娱乐iosBeplay体育安卓版本有關入門教程和介紹性信息,請參見從Databricks開始而且介紹磚

  • 在工作區中

    了解如何導航Databricks工作空間並訪問工作空間中可用的資產。

  • 結構化流

    了解如何使用Apache Spark結構化流在Databricks中表示流數據的計算。

  • 三角洲生活表

    了解如何使用Databricks Delta Live Tables構建數據處理管道。

  • 運行時

    了解Databricks運行時和運行時內容的類型。

  • 集群

    了解Databricks集群以及如何創建和管理它們。

  • 筆記本電腦

    學習如何在Databricks中管理和使用筆記本。

  • 工作流

    在Databricks中了解如何使用數據處理工具和框架。

  • 學習如何在Databricks中使用和管理庫。

  • Git與Databricks Repos集成

    了解如何使用Git來管理Databricks筆記本和工作空間文件夾作為共同版本的Databricks Repos。

  • DBFS

    了解Databricks文件係統(DBFS),這是一個掛載到Databricks工作空間的分布式文件係統,可在Databricks集群上使用

  • 如何處理數據庫上的文件

    了解在Databricks上處理文件的選項。

  • 遷移

    了解如何將工作負載遷移到Databricks。