取消
顯示的結果
而不是尋找
你的意思是:

Python讀csv——不要考慮逗號引號內,即使不直接引用分隔符

ASN
新的貢獻者二世

下麵我有數據,當閱讀CSV,我不想考慮逗號引號內即使不直接引用分離器(如記錄# 2)。1和3的記錄很好如果我們使用分隔符,但失敗2記錄

輸入:

col1, col2 col3

a, b, c

”b1, b2, b3“b4 c

“a1, a2, b, c

輸出:

輸入和預期輸出

5回複5

匿名
不適用

ASN
新的貢獻者二世

你好約瑟夫……我試過但”b1, b2, b3“b4 c行需要轉換為3列如下(預期的輸出),但是b係列數據分為2列,而不是單一的列,要求是忽略逗號引號內第二列。

預期的輸出:

1)

2)b1 b2, b3 b4

3)c

實際輸出:

1)

2)b1”b2

3)b3“b4

謝謝,

薩提亞

dhara1314
新的貢獻者二世

可以采取以下方法

  1. 代替你從逗號分隔符到別的像管,分號
  2. 當你使用spark.read提供escapeQuote選項為真

嗨@SATYANARAYANA ALAMANDA,

隻是一個友好的後續。做任何反應幫助你解決你的問題嗎?如果是,請其標記為最好。否則,請讓我們知道如果你還需要幫助。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map