光子

萊克豪斯的下一代引擎

Photon是Databricks Lakehouse平台上的下一代引擎，以低成本提供極快的查詢性能-從數據攝取，ETL，流媒體，Beplay体育安卓版本數據科學和交互式查詢-直接在您的數據湖上。Photon與Apache Spark™api兼容，因此啟動它就像打開它一樣簡單——無需更改代碼，也無需鎖定。

更便宜更快

為了以更低的成本實現最快的性能，Photon提供高達80%的TCO節省，同時加速數據和分析工作負載-高達12倍的加速。

為所有用例構建

Photon是第一個使數據團隊能夠在一組api上標準化所有工作負載的引擎——ETL、分析和數據科學——批處理或流處理。

沒有代碼更改

Photon是一個兼容ansi的引擎，旨在與現代Apache Spark api兼容，隻與您現有的代碼- SQL, Python, R, Scala和Java -不需要重寫。

為什麼光子?

在Apache Spark的支持下，Databricks上的查詢性能多年來穩步提高，Databricks運行時(DBR)中封裝了數千個優化。Photon——一個完全用c++編寫的全新原生向量化引擎——在TPC-DS 1TB基準測試中提供了額外的2倍加速，與最新的DBR版本相比，根據客戶的工作負載，他們已經觀察到平均3 - 8倍的加速。beplay体育app下载地址

用例

生產工作

加速SQL和Spark dataframe上的大規模生產作業

物聯網應用

與Spark和傳統的Databricks Runtime相比，使用Photon進行更快的時間序列分析

數據隱私和遵從性

使用Delta Lake、生產作業和Photon查詢pb級數據集，識別和刪除記錄，無需重複數據

正在向Delta Lake和Parquet加載數據

Photon的向量化I/O加速了Delta Lake和Parquet表的數據加載，降低了總體運行時間和數據工程作業的成本

它是如何工作的?

雲分析的最佳價格/性能

Photon由c++從頭開始編寫，利用現代硬件實現更快的查詢，與其他雲數據倉庫相比，提供高達12倍的更好的價格/性能-所有這些都在您的數據湖上。

使用現有代碼並避免供應商鎖定

Photon被設計為與Apache Spark DataFrame和SQL api兼容，以確保工作負載無縫運行而無需更改代碼。所有你要做的就是從Photon中受益。Photon將無縫地協調工作和資源，透明地加速SQL和Spark查詢的部分。不需要調優或用戶幹預。

針對所有數據用例和工作負載進行優化

當我們開始Photon時，主要專注於SQL，為客戶的數據湖提供世界級的數據倉庫性能，從那時起，我們顯著增加了Photonbeplay体育app下载地址支持的輸入源、格式、api和方法的範圍。因此，客戶在所有現代Spabeplay体育app下载地址rk工作負載(例如Spark SQL和DataFrame)上都看到了巨大的基礎設施成本節約和Photon的加速。