取消
顯示的結果
而不是尋找
你的意思是:

dataFrame拆分為1 mb的塊和創建一個json數組中的每一行作為一個數組元素

rusty9876543
新的貢獻者二世

嗨,我有一個dataFrame我已經能夠轉換成結構每一行是一個JSON對象。

我希望能夠把數據幀分割成1 mb的塊。一旦我有塊,我想在每個各自的所有行塊添加到一個JSON數組。

5回複5

匿名
不適用

@Tamoor閣下:

您可以使用to_json DataFrame的方法將每個塊轉換為一個JSON字符串,然後將這些列表JSON字符串。下麵是一個示例代碼片段分割DataFrame為1 mb的塊和創建一個JSON數組列表,每一行中每一塊是一個數組元素:

進口json #假設df是你DataFrame chunk_size = 1 _000_000 # 1 mb的塊大小json_arrays =[]開始的範圍(0 len (df) chunk_size):結束= min (+ chunk_size開始,len (df))塊= df。iloc[開始:結束]json_str = chunk.to_json(東方=“記錄”)json_array = json.loads (json_str) json_arrays.append (json_array) #所有JSON數組合並為一個數組merged_json_array = (json_arrays[]) #和合並後的JSON數組轉換為一個JSON字符串merged_json_str = json.dumps (merged_json_array)

在上麵的代碼中,我們首先定義塊大小為1 mb。然後循環DataFrame,切成塊使用iloc指定大小的方法。對於每個塊,我們使用to_json方法,將它轉換為一個JSON字符串與東方參數設置為“記錄”,產生一個JSON對象列表(為每一行一個)。然後,我們使用json。解析JSON字符串裝入一個字典列表。我們將每個列表的字典(對應於一個大塊DataFrame)

json_arrays列表。

我們處理所有的塊之後,我們所有的JSON數組合並為一個數組使用內置的求和函數。最後,我們將合並後的JSON數組轉換為一個JSON字符串使用json.dumps。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map