06-09-202202:39點
下麵我有數據,當閱讀CSV,我不想考慮逗號引號內即使不直接引用分離器(如記錄# 2)。1和3的記錄很好如果我們使用分隔符,但失敗2記錄
輸入:
col1, col2 col3
a, b, c
”b1, b2, b3“b4 c
“a1, a2, b, c
輸出:
06-09-202204:39點
https://spark.apache.org/docs/latest/sql-data-sources-csv.html data-source-option
轉義引號配置你所要找的。
06-10-202206:36我
你好約瑟夫……我試過但”b1, b2, b3“b4 c行需要轉換為3列如下(預期的輸出),但是b係列數據分為2列,而不是單一的列,要求是忽略逗號引號內第二列。
預期的輸出:
1)
2)b1 b2, b3 b4
3)c
實際輸出:
2)b1”b2
3)b3“b4
謝謝,
薩提亞
06-29-202203:19點
可以采取以下方法
07-29-2022上午11點
嗨@SATYANARAYANA ALAMANDA,
隻是一個友好的後續。做任何反應幫助你解決你的問題嗎?如果是,請其標記為最好。否則,請讓我們知道如果你還需要幫助。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。