你好,
我有一個問題想從引發數據幀連續值。
我和索引列DF,我需要返回一個行基於指數以最快的方式。
我試圖partitionBy索引列,優化與zorder索引列但它仍然需要太多時間。(zorder沒有變化的表文件)
檢索一行值取0.5秒~ 4秒
我試過一些代碼:
行= df.where (df。指數= = x) .collect = df.where (df()行。指數= = x), (1)
當使用火花繼續所有索引哪裏?或者當它找到正確的跳過所有的休息嗎?
如果有人有更好的,所以我想知道。
謝謝你的幫助!