Databricks數據科學與工程指南

Databricks數據科學與工程是用於數據科學家,數據工程師和數據分析師之間協作的經典數據映環境。它還形成了Databricks機器學習環境

筆記

如果您是主要使用SQL查詢和BI工具的數據分析師,則可能更喜歡Databricks SQL基於角色的環境。

Databricks數據科學與工程指南提供了如何幫助您充分利用Databricks協作分析平台。beplay娱乐iosBeplay体育安卓版本有關入門教程和介紹性信息,請參見開始使用DatabricksDatabricks簡介

  • 導航工作區

    了解如何瀏覽數據助理工作區並訪問工作空間中可用的資產。

  • 運行時間

    了解Databricks Runtimes和運行時內容的類型。

  • 集群

    了解有關數據串群以及如何創建和管理它們。

  • 筆記本

    了解如何管理和使用Databricks中的筆記本。

  • 工作流程

    了解如何使用數據處理中的數據處理工具和框架。

  • 了解如何使用和管理Databricks中的庫。

  • GIT集成存儲庫

    了解如何使用git作為共同的databricks存儲庫來管理數據串筆記本和工作區子文件夾。

  • Databricks文件係統(DBFS)

    了解有關數據磁計文件係統(DBFS),這是一個安裝在數據串件工作區中的分布式文件係統,並在Databricks群集上找到

  • 移民

    了解如何將工作負載遷移到數據映。

  • 應用:基因組學

    了解如何使用Databricks和Glow處理基因組數據。