取消
顯示的結果
而不是尋找
你的意思是:

致命錯誤:Python的內核是反應遲鈍

Orianh
重視貢獻二世

嘿,夥計們,

我用petastorm培訓款,首先我將火花df make_spark_convertor物化數據集,然後打開一個讀者。

雖然我隻在開始訓練子集的數據沒問題,但每件事當我用所有數據集與Python 500批我的筆記本崩潰後的內核是反應遲鈍,你們知道這發生了什麼嗎?

我看到有點類似的問題,我已把線程轉儲,但沒有理解它。

除了我得到很多未來的警告petastorm pyarrow,知道如何避免所有這些警告嗎?

25日回複25

lizou
因素二世

如果一個python過程不使用火花,如熊貓(不是火花大熊貓),隻有一個節點使用。我跑同樣的錯誤經常與多個節點集群。

一個解決方案是使用一個單節點的內存如128克以上。這意味著分配足夠的分辨率成一個單一的節點,而不是分裂成多個節點。

然而,我盡量避免熊貓因為大多數問題可以解決使用火花,除了一些特殊的實用程序,沒有其他選擇。

@lizou

今天,我也有同樣的問題,當我火花結構化數據矩陣轉置1000列x 4284行。大小約為2 gb的數據。

這是代碼:

https://github.com/NikhilSuthar/TransposeDataFrame

從pyspark.sql。函數從pyspark進口*。sql進口SparkSession def TransposeDF (df、列pivotCol): columnsValue =列表(地圖(λx: str(“的”)+ str (x) + str (“。”) + str (x)列)stackCols = ', '。加入(x x columnsValue) df_1 = df。selectExpr (pivotCol,“堆棧(“+ str (len(列))+”、“+ stackCols +”)”) \ .select (pivotCol、“col0”、“col1”) final_df = df_1.groupBy(坳(“col0”)) .pivot (pivotCol)。gg (concat_ws (“collect_list(坳(“col1”)))) \ .withColumnRenamed (“col0 pivotCol)返回final_df df = TransposeDF (df, df。列1:,“AAPL_dateTime”)

(上麵的代碼在更換一個小的數據矩陣(如工作。5列x 252行)

我VM部署一個32 gb的內存,還有一個“致命錯誤:Python內核是反應遲鈍的

更換一個數據矩陣應該隻有O (C x R)空間複雜性和運行時的複雜性。

就我而言,應該是2 gb的空間複雜度。

我檢查了磚生活指標。隻使用20%的CPU,還有20 GB的空閑內存。然而,有一個“驅動程序,但沒有反應,可能由於GC在事件日誌。

我不知道為什麼還有致命錯誤:Python內核是反應遲鈍的:face_with_tears_of_joy:。也許,這不僅是相關的記憶?:dizzy_face:

現在,我在一個112 GB的內存GPU轉置一個2 GB的數據矩陣。也沒有的驅動程序,但沒有反應,可能是因為GC的在事件日誌中。希望這個工作。但仍然無法理解為什麼改換一個2 GB的數據矩陣需要的內存數量:grinning_face_with_sweat:

@Cheuk欣克利斯朵夫Poon

我不知道圖書館利用的內存,可能有額外的內存必須持有數據轉換過程。

我還發現了一篇關於熊貓不會快20節點集群上。

https://learn.microsoft.com/en-us/azure/databricks/migration/single-node

@lizou

我也這麼認為。每一次,當內存使用%達到50% +,磚將自動定量更多的工人。

3天前,我用熊貓的轉置數據,但似乎由於GC超級緩慢而失敗。昨天,我試圖隻用PySpark轉置數據。

我認為磚需要解釋更多關於他們如何分配內存和內存計算方法。

順便說一句,就現在,我完成了我的數據轉換。

這是我做的:

  1. 部署一個128 gb的內存虛擬機轉置17個小時的數據,盡管遠低於128 gb的數據大小(實際數據大小是2 GB,但磚活指標表示,20 GB。也許,我忘了真空三角洲表嗎?這就是為什麼它說20 gb ?)和複雜性理論是O (RxN)。

這是我的猜測:置換一個數據矩陣需要收集所有的數據到一個節點,所以許多較小的vm部署可能會失敗數據轉換。更換數據隻能在單節點模式。

RachelGomez123
新的貢獻者二世

建議修複一個致命錯誤

尋找錯誤代碼找到具體的指示。

更新軟件。

更新驅動程序。

卸載最近安裝的程序。

恢複窗口的狀態。

禁用不必要的後台程序。

刪除臨時文件。

釋放硬盤上的空間。

問候,

瑞秋·戈麥斯

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map