取消
顯示的結果
而不是尋找
你的意思是:

toPandas()導致Apache IndexOutOfBoundsException箭頭

ivanychev
貢獻者

使用DBR 10.0

當調用toPandas()職工與IndexOutOfBoundsException失敗。它看起來像ArrowWriter。sizeInBytes(這看起來像一個專有的方法,因為我找不到它在OSS)調用箭頭的getBufferSizeFor失敗錯誤。這個問題的根源是什麼?

這是一個完整的堆棧跟蹤的樣品:

. lang。IndexOutOfBoundsException:指數:16384,長度:4(預期:範圍(0,16384))在org.apache.arrow.memory.ArrowBuf.checkIndexD (ArrowBuf.java: 318) org.apache.arrow.memory.ArrowBuf.chk (ArrowBuf.java: 305) org.apache.arrow.memory.ArrowBuf.getInt (ArrowBuf.java: 424) org.apache.arrow.vector.complex.BaseRepeatedValueVector.getBufferSizeFor (BaseRepeatedValueVector.java: 229) org.apache.arrow.vector.complex.ListVector.getBufferSizeFor (ListVector.java: 621) org.apache.spark.sql.execution.arrow.ArrowFieldWriter.getSizeInBytes (ArrowWriter.scala: 165) org.apache.spark.sql.execution.arrow.ArrowWriter.sizeInBytes (ArrowWriter.scala: 118) org.apache.spark.sql.execution.arrow.ArrowConverters立刻1美元。anonfun美元下1美元(ArrowConverters.scala: 224) scala.runtime.java8.JFunction0專門sp.apply美元(JFunction0專門sp.java美元:23)org.apache.spark.util.Utils .tryWithSafeFinally美元(Utils.scala: 1647) org.apache.spark.sql.execution.arrow.ArrowConverters不久美元1.美元未來(ArrowConverters.scala: 235) org.apache.spark.sql.execution.arrow.ArrowConverters不久美元1.美元未來(ArrowConverters.scala: 199) scala.collection.Iterator不久美元10.美元未來(Iterator.scala: 461) scala.collection.Iterator.foreach (Iterator.scala: 943) scala.collection.Iterator.foreach美元(Iterator.scala: 943)

16日回複16

匿名
不適用

@Sergey Ivanychev,我認為這是試圖返回太多數據熊貓和重載的記憶。你想做什麼?你不應該需要使用熊貓與3.2引入了熊貓的API火花//www.eheci.com/blog/2021/10/04/pandas - api -在即將到來的- apache -火星- 3 - 2. - html

我喂DataFrame毫升模型。“toPandas()的作品與“spark.sql.execution.arrow.pyspark非常好。啟用”設置為“false”。

但禁用箭頭管道管道遠非完美。上麵的錯誤並不能解釋很多失敗發生在專有代碼。在這一點上我不知道去哪裏找一個錯誤

奇怪,“getBufferSizeFor”是失敗的原因。國際海事組織這樣一個名字的方法不應該導致的錯誤。

Hubert_Dudek1
尊敬的貢獻者三世

to_pandas()隻有一個小的數據集。

請使用:

to_pandas_on_spark ()

必須使用熊貓火花而不是普通的熊貓,這樣它將工作在一個分布式的方式。這裏有更多的信息https://spark.apache.org/docs/latest/api/python/user_guide/pandas_on_spark/index.html

所以總是進口熊貓:

進口pyspark。熊貓作為ps

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map