取消
顯示的結果
而不是尋找
你的意思是:

我應該使光子在SQL端點?

User16826992666
價值貢獻

我看到的選項使光子在創建新的SQL端點。描述說,使其有助於加快查詢,這聽起來不錯,但是我需要知道有什麼缺點?

1接受解決方案

接受的解決方案

Ryan_Chynoweth
尊敬的貢獻者三世

一般來說,是的你應該使光子。大部分的功能都是可用的,並將表現得非常好。有一些限製,可以發現在這裏

限製:

  • 三角洲和拚花表上隻適合讀和寫。
  • 不支持數據類型如下:
    • 地圖
    • 數組
  • 不支持窗口和運營商
  • 不支持結構化流火花。
  • 不支持udf。
  • 不會提高業務通過網絡或掃描的I / O瓶頸。
  • 不會提高短時間運行的查詢(< 2秒),例如,對小數據。

優點:

  • 支持SQL和等效DataFrame操作對三角洲和拚花表。
  • 將加快查詢,處理大量的數據(100 gb +),包括聚合和連接。
  • 多次訪問數據和可能的三角洲湖緩存。
  • 更健壯的掃描性能表和許多列和許多小文件。
  • 更快的三角洲和鋪寫使用更新、刪除、合並,並創建表選擇,尤其是對寬表(到成千上萬的列)。
  • 光子取代分類合並連接散列連接。

在原帖子查看解決方案

1回複1

Ryan_Chynoweth
尊敬的貢獻者三世

一般來說,是的你應該使光子。大部分的功能都是可用的,並將表現得非常好。有一些限製,可以發現在這裏

限製:

  • 三角洲和拚花表上隻適合讀和寫。
  • 不支持數據類型如下:
    • 地圖
    • 數組
  • 不支持窗口和運營商
  • 不支持結構化流火花。
  • 不支持udf。
  • 不會提高業務通過網絡或掃描的I / O瓶頸。
  • 不會提高短時間運行的查詢(< 2秒),例如,對小數據。

優點:

  • 支持SQL和等效DataFrame操作對三角洲和拚花表。
  • 將加快查詢,處理大量的數據(100 gb +),包括聚合和連接。
  • 多次訪問數據和可能的三角洲湖緩存。
  • 更健壯的掃描性能表和許多列和許多小文件。
  • 更快的三角洲和鋪寫使用更新、刪除、合並,並創建表選擇,尤其是對寬表(到成千上萬的列)。
  • 光子取代分類合並連接散列連接。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map