取消
顯示的結果
而不是尋找
你的意思是:

我怎麼讓approxSimilarityJoin工作25日k 300 - d向量?

maffeenAF
新的因素

我試圖用激光衝徊化approxSimilarityJoin數據集上~ 25 k 300 - d向量的花車。它卡住和最終失敗的奴隸了錯誤。集群的大小和內存有可能不是問題,發生故障時即使16節點,16個核心,64 g RAM(相同大小的司機)。你的建議是什麼,我怎麼讓它工作嗎?

使用火花2.4.5豐富DataProc

1回複1

Dan_Z
尊敬的貢獻者

使用箭頭PandasUDF啟用。他們改善在火花3中,但是你可以在火花2.4.5中使用它們。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map