08-05-202104:47點
我試圖用激光衝徊化approxSimilarityJoin數據集上~ 25 k 300 - d向量的花車。它卡住和最終失敗的奴隸了錯誤。集群的大小和內存有可能不是問題,發生故障時即使16節點,16個核心,64 g RAM(相同大小的司機)。你的建議是什麼,我怎麼讓它工作嗎?
使用火花2.4.5豐富DataProc
08-06-202104:13點
使用箭頭PandasUDF啟用。他們改善在火花3中,但是你可以在火花2.4.5中使用它們。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。