上個月,我們宣布Google Cloud上的Databricks這是一項共同開發的服務,允許數據團隊(數據工程,數據科學,分析和ML專業人員)將數據存儲在一個簡單的開放式湖泊平台中,用於所有數據,AI和分析工作負載。Beplay体育安卓版本今天,我們正在啟動Google Cloud上數據映的公共預覽。
在與客戶交談時,一件事很明顯:他們想建立現beplay体育app下载地址代數據架構以推動實際業務影響,無論是通過用ML個性化客戶體驗,,,,改善產品外遊戲體驗或者提供挽救生命的醫療用品(僅舉幾個)。但是,許多人發現自己陷入了跨數據類型(結構化,非結構化和半結構化數據)的難以管理的數據,同時處理各種應用程序。僅需日常工作,數據團隊就必須將各種開源庫和工具縫合在一起以進行進一步的分析。數據科學,ML工程和部署團隊之間的多次交接減慢了發展。在多個不同的數據係統之間傳輸數據的複雜性和成本,以及管理數據和安全模型的多個副本的挑戰增加了開銷。
考慮到這些疼痛點,我們相信建立一流的湖泊平台的方法是建立開放標準。Beplay体育安卓版本開放標準,開放API,開放平台 - 它為客戶提供了基於服務的服務Beplay体育安卓版本,以簡單,協作的體驗來構建現代數據體係結beplay体育app下载地址構。beplay娱乐iosGoogle Cloud分享了這個“開放的願景”有了開放的雲服務,這意味著我們的聯合客戶可以選擇選擇正確的工具來解決任何問題。beplay体育app下载地址
帶有三角洲湖和Google雲存儲的開放數據湖
開放的技術使我們能夠將分析和人工智能(AI)統一與您現有數據湖頂部的湖泊的統一技術是三角洲湖。數據湖是存儲大量原始數據(結構化,非結構化,視頻,文本,音頻)的負擔得起的方法,通常以廣泛使用的Apache Parquet等開源格式。然而,許多公司都在麵對以下列出的許多挑戰時,都在生產中運行其分析和AI應用程序。
Delta Lake是一個開放格式的存儲層,可提供可靠性,性能和治理來解決這些數據湖挑戰。Google Cloud上的Databricks基於Delta Lake和Parquet格式,因此您可以將所有數據保存在Google Cloud Storage(GCS)中,而無需移動或在多個地方複製它。這使您可以在數據湖上存儲和管理所有數據以進行分析。
易於使用的ML&AI服務更快的實驗
一旦擁有一個開放的數據湖,您就為數據科學團隊開發和訓練其機器學習模型奠定了基礎。借助Google雲上數據映的可用性,數據科學家和ML工程師可以使用我們的beplay娱乐ios協作數據科學和托管MLFlow功能使用Google Cloud Storage或BigQuery存儲中的數據。
Google Cloud上的Databricks還與Google Cloud的AI服務套件集成在一起。例如,您可以將MLFlow模型部署到AI平台預測中,以進行在線服務,或使用AI平台的預訓練的MLBeplay体育安卓版本 API和AUTOML進行視覺,視頻,翻譯和自然語言處理。
結論
Google Cloud上的Databricks帶來了共同的願景,將開放平台與開放雲相結合,以簡化數據工程,數據科學和數據分析。Beplay体育安卓版本是否想了解有關該聯合解決方案如何統一所有分析和AI工作負載的更多信息?注冊我們的發布活動Databricks首席執行官兼聯合創始人Ali Ghodsi和Google Cloud首席執行官Thomas Kurian深入了解了開放式Lakehouse平台的好處,以及Google Cloud Drive數據團隊的Databricks如何合作。Beplay体育安卓版本