在一個工作空間內跨工程、數據科學和機器學習團隊工作。使用多種語言,內置數據可視化和自動版本控製,所有這些都在筆記本中。
好處
一起工作
使用多種語言(R、Python、SQL和Scala)和您選擇的庫共享筆記本並與跨團隊的同事一起工作。實時合作創作、評論和自動版本控製在提供控製的同時簡化了協作。
分享見解
通過內置的交互式可視化,或利用Matplotlib和ggplot等庫,快速發現新的見解。以HTML或IPYNB格式導出結果和筆記本,或構建並共享始終保持最新的儀表板。
規模化生產
計劃筆記本自動運行大規模的機器學習和數據管道。使用Databricks工作流創建多級管道。設置警報並快速訪問審計日誌,以便輕鬆監控和故障排除。
特性
數據訪問:快速訪問可用的數據集或連接到本地或雲中任何數據源。
多語言支持:使用交互式筆記本探索數據,支持同一筆記本中的多種編程語言,包括R、Python、Scala和SQL。
交互式可視化:通過各種各樣的指向和點擊可視化來可視化見解。或者使用強大的腳本選項,如Matplotlib, ggplot和D3。
實時合著者:在同一筆記本上實時工作,同時跟蹤詳細的修改曆史。
評論:在共享的notebook中留下評論並通知同事。
自動版本:自動更改跟蹤和版本控製,幫助您重新開始。
Git-based回購:簡化了基於git的協作、可再現性和CI/CD工作流程。
分欄:自動將notebook中的實驗、參數和結果作為運行直接記錄到MLflow中,並從側欄中快速查看和加載以前的運行和代碼版本。
指示板:與同事和客戶分享見解,或者讓他們使用spark驅動的儀表板運行交互式查詢。beplay体育app下载地址
將筆記本電腦作為作業運行:通過單擊或API調用,將notebook或jar轉換為有彈性的生產作業。
工作調度程序:按照特定的時間表執行生產管道的作業。
筆記本工作流程:使用源編程語言的控製結構創建多級管道。
通知和日誌:設置警報並快速訪問審計日誌,以便輕鬆監控和故障排除。
權限管理:使用一個通用的安全模型,快速管理對每個筆記本或筆記本集合和實驗的訪問。
集群:快速將筆記本連接到自動管理的集群,以高效且經濟有效地擴展計算。
集成:連接到Tableau, Looker, Power BI, RStudio, Snowflake,也可以通過你最喜歡的ide,如VS Code -允許數據科學家和工程師使用他們選擇的工具。
它是如何工作的
共享和交互式筆記本、實驗和擴展文件支持允許數據科學家團隊在整個生命周期中更有效地組織、共享和管理複雜的數據科學項目。api和Job Scheduler允許數據工程團隊快速自動化複雜的管道,而業務分析師可以通過交互式儀表板直接訪問結果。