取消
顯示的結果
而不是尋找
你的意思是:

如何引爆一個數組的列和重新打包DB SQL的不同值到一個數組?

Tom_Jones
新的貢獻者二世

嗨,我是新數據庫SQL。我有一個表數組的列(城市)包含多個數組和一些有多個重複的值。我需要解壓數組值進行我可以列出不同值。下麵的查詢在這一步工作。

選擇不同的關鍵,爆炸(城市)作為城市綠色。城市集團的關鍵,城市

下一步我想重新打包截然不同的城市到一個數組中分組的關鍵。

我可以很容易的用兩dataframes pyspark,首先通過一個爆炸的數組列第一dataframe然後做一個未來dataframe collect_set在同一列。

任何建議我如何可以使用磚SQL ?

3回複3

Hubert_Dudek1
尊敬的貢獻者三世

您可以在SQL中使用collect_set。如果你分享示例輸入行和所需的輸出,這將是更容易的幫助。

Tom_Jones
新的貢獻者二世

謝謝休伯特。到目前為止我不收集expolded列分組的不同值的關鍵。

輸入是一個例子:

關鍵,城市

1,“米蘭”、“巴黎”、“紐約”)

1,“倫敦”

1,(“倫敦”、“巴黎”)

1,(“倫敦”、“巴黎”)

1,(“倫敦”、“巴黎”)

1,(“米蘭”,“巴黎”)

1,(“巴黎”,“紐約”)

1,“紐約”

1,“紐約”

2,“米蘭”、“巴黎”、“紐約”)

2,“巴黎”

2,“巴黎”

2,(“米蘭”,“巴黎”)

2,(“巴黎”,“紐約”)

2,“東京”

2,“紐約”

2,(“拉”,“東京”)

2,(“拉”,“東京”)

所需的輸出是:

關鍵,城市

1,“米蘭”、“巴黎”、“紐約”,“倫敦”)

2,“米蘭”、“巴黎”、“紐約”,“拉”,“東京”)

Aviral-Bhardwaj
尊敬的貢獻者三世

嚐試使用SQL窗口函數

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map