數據共享

免費試用Databricks

什麼是數據共享?

數據共享是將相同的數據提供給一個或多個消費者的能力。如今,不斷增長的數據量已經成為任何公司的戰略資產。在您的組織內部或外部共享數據是一種使能技術尋找新的商業機會。共享數據以及從外部來源消費數據允許與合作夥伴合作,建立新的合作夥伴關係,並通過數據貨幣化產生新的收入流。

傳統數據共享技術

首先,有諸如SFTP (SSH文件傳輸協議)或雲對象存儲等技術,可以實現自主開發的解決方案。但是,SFTP不能很好地擴展到大量的客戶端,並且隻能提供卸載到FTP服務器上的文件。使用預簽名的對象存儲url共享數據可以擴展到對象存儲雲服務的帶寬,但隻適用於一個特定的雲供應商。

商業/閉源數據共享產品

其次,有一些數據共享解決方案被嵌入到供應商的產品中,如Oracle、AWS Redshift或Snowflake。這些解決方案在一個產品中使用很方便,它們共享表而不是文件,但它們不是開放的,因此不允許與不同的平台共享數據。Beplay体育安卓版本

開源的現代數據共享解決方案

基於開源的解決方案消除了商業解決方案的局限,並帶來了許多額外的好處,例如社區開發的與流行的開源數據處理框架的集成。此外,開放協議允許輕鬆集成商業客戶端,如BI工具。

三角洲分享

Delta Sharing是世界上第一個用於安全數據共享的開放協議,使得與其他組織共享數據變得簡單,無論他們使用哪種計算平台。Beplay体育安卓版本

  • 實時數據直接共享-輕鬆共享Delta Lake中現有的實時數據,無需將其複製到另一個係統。
  • 〇支持多種客戶端數據接收者可以直接從Pandas、Apache Spark™、Rust和其他係統連接到Delta Shares,而無需首先部署特定的計算平台。Beplay体育安卓版本減少將數據傳遞給用戶的阻力。
  • 〇安全和治理Delta Sharing允許您輕鬆地管理、跟蹤和審計對共享數據集的訪問。
  • 可伸縮性——通過利用S3、ADLS和GCS等雲存儲係統,可靠有效地共享大規模數據集。

數據庫上的Delta共享

Databricks本機集成了德爾塔共享在我們統一目錄,為在組織內部和跨組織共享數據提供了簡化的體驗。管理員可以使用新的CREATE SHARE SQL命令或REST api管理共享,並集中審計所有訪問。然後,接收方可以使用來自任何雲上任何平台的數據。Beplay体育安卓版本

數據庫上的Delta共享

三角洲共享:開放的生態係統

由開源和商業合作夥伴組成的三角洲共享生態係統每天都在增長。輕鬆地與任何人共享數據,無論在哪裏。

三角洲共享:開放的生態係統

在Databricks上了解更多關於數據共享的信息

報名加入Databricks Delta Sharing等待列表,以獲得預覽訪問和更新。

額外的資源

回到術語表
Baidu
map