光子

萊克豪斯的下一代引擎

開始了解更多

Photon是Databricks Lakehouse平台上的下一代引擎,以低成本提供極快的查詢性能-從數據攝取,ETL,流媒體,Beplay体育安卓版本數據科學和交互式查詢-直接在您的數據湖上。Photon與Apache Spark™api兼容,因此啟動它就像打開它一樣簡單——無需更改代碼,也無需鎖定。

背景圖像

更便宜更快

為了以更低的成本實現最快的性能,Photon提供高達80%的TCO節省,同時加速數據和分析工作負載-高達12倍的加速。

為所有用例構建

Photon是第一個使數據團隊能夠在一組api上標準化所有工作負載的引擎——ETL、分析和數據科學——批處理或流處理。

沒有代碼更改

Photon是一個兼容ansi的引擎,旨在與現代Apache Spark api兼容,隻與您現有的代碼- SQL, Python, R, Scala和Java -不需要重寫。

為什麼光子?

在Apache Spark的支持下,Databricks上的查詢性能多年來穩步提高,Databricks運行時(DBR)中封裝了數千個優化。Photon——一個完全用c++編寫的全新原生向量化引擎——在TPC-DS 1TB基準測試中提供了額外的2倍加速,與最新的DBR版本相比,根據客戶的工作負載,他們已經觀察到平均3 - 8倍的加速。beplay体育app下载地址

背景圖像

用例

生產工作

加速SQL和Spark dataframe上的大規模生產作業

物聯網應用

與Spark和傳統的Databricks Runtime相比,使用Photon進行更快的時間序列分析

數據隱私和遵從性

使用Delta Lake、生產作業和Photon查詢pb級數據集,識別和刪除記錄,無需重複數據

正在向Delta Lake和Parquet加載數據

Photon的向量化I/O加速了Delta Lake和Parquet表的數據加載,降低了總體運行時間和數據工程作業的成本

它是如何工作的?

雲分析的最佳價格/性能

Photon由c++從頭開始編寫,利用現代硬件實現更快的查詢,與其他雲數據倉庫相比,提供高達12倍的更好的價格/性能-所有這些都在您的數據湖上。

使用現有代碼並避免供應商鎖定

Photon被設計為與Apache Spark DataFrame和SQL api兼容,以確保工作負載無縫運行而無需更改代碼。所有你要做的就是從Photon中受益。Photon將無縫地協調工作和資源,透明地加速SQL和Spark查詢的部分。不需要調優或用戶幹預。

針對所有數據用例和工作負載進行優化

當我們開始Photon時,主要專注於SQL,為客戶的數據湖提供世界級的數據倉庫性能,從那時起,我們顯著增加了Photonbeplay体育app下载地址支持的輸入源、格式、api和方法的範圍。因此,客戶在所有現代Spabeplay体育app下载地址rk工作負載(例如Spark SQL和DataFrame)上都看到了巨大的基礎設施成本節約和Photon的加速。

資源

所有你需要的資源。都在一個地方。圖像

所有你需要的資源。都在一個地方。

探索資源庫,在Databricks上找到有關數據工程好處的電子書和視頻。

準備好了
開始了嗎?

免費試用Databricks

Baidu
map