磚實驗室

Databricks Labs是由該領域創建的項目
幫助客戶更快地將beplay体育app下载地址他們的用例投入生產!

DBX

該工具簡化了跨多個環境的作業啟動和部署過程。它還有助於以版本化的方式打包項目並將其交付到Databricks環境。它以cli優先的方式設計,被構建為在CI/CD管道中積極使用,並作為快速原型的本地工具的一部分。

節奏

這個項目的目的是提供一個API,用於在Apache Spark之上操作時間序列。功能包括使用滯後時間值,滾動統計(平均值,平均值,和,計數等),AS OF連接,以及下降采樣和插值的特性。這一點已經在tb規模的曆史數據上得到了驗證。

馬賽克

Mosaic是一個工具,通過將通用的開源地理空間庫和Apache Spark™️綁定在一起,簡化了可擴展的地理空間數據管道的實現。Mosaic還為常見的地理空間用例提供了一組示例和最佳實踐。它為ST_表達式和GRID_表達式提供api,支持H3和英國國家電網等網格索引係統。

其他項目

看守

分析所有工作區中的所有作業和集群,以快速確定在哪些方麵可以進行最大的調整,以提高性能並節省成本。

了解更多→

Splunk的集成

Splunk插件這款應用允許Splunk Enterprise和Splunk Cloud用戶在Databricks中運行查詢和執行操作,比如運行筆記本電腦和作業。

Github Sources→
了解更多→

悶燒

Smolder提供了一個Apache Spark™SQL數據源,用於從中加載EHR數據HL7v2消息格式。此外,Smolder還提供了helper函數,可以在Spark SQL DataFrame上用於解析HL7消息文本,並從消息中提取段、字段和子字段。

Github Sources→
了解更多→

Geoscan

基於Apache Spark ML估計器的基於密度的空間聚類六邊形層次空間指數

Github Sources→
了解更多→

遷移

幫助客戶在Databricbeplay体育app下载地址ks工作區之間遷移工件的工具。這允許客戶導出配置和代碼beplay体育app下载地址工件作為備份,或者作為不同工作區之間遷移的一部分。

Github Sources→
了解更多:AWS|Azure

數據生成器

為您的項目快速生成相關數據。Databricks數據生成器可用於生成大型模擬/合成數據集,用於測試、POCs和其他用途

Github Sources→
了解更多→

DeltaOMS

集中德爾塔事務日誌收集元數據和操作指標分析您的湖屋。

Github Sources→
了解更多→

請注意,所有項目在https://github.com/databrickslabsDatabricks with Service Level Agreements (sla)並不正式支持該帳戶。它們是按原樣提供的,我們不作任何形式的保證。請不要提交與使用這些項目引起的任何問題有關的支持票。通過使用本項目發現的任何問題都應作為GitHub回購問題存檔。在時間允許的情況下,將對它們進行審查,但是沒有正式的sla來提供支持。