取消
顯示的結果
而不是尋找
你的意思是:

之間的區別是什麼傳遞模式的選項或在pyspark . schema()函數使用一個csv文件嗎?

irfanaziz
因素二世

我發現一個很奇怪的行為與我們的一些集成管道。本周的一個csv文件變得破碎時讀,讀下麵的函數。

def ReadCSV(文件、schema_struct標題分隔符,timestampformat,編碼=“utf8 ",多行= " true "): deltas_df =火花。讀\ .format (csv) \ .options(標題=標題分隔符=分隔符,timestampFormat = timestampFormat enoding =編碼,多行=多行). schema(模式= schema_struct) \ .load df(文件)回報

我做了改變和移動模式的選項。這個工作能夠讀取文件對象。但它開始為其他對象失敗。所以我想知道為什麼它會表現不同。

def ReadCSV2(文件、schema_struct標題分隔符,timestampformat,編碼=“use utf8”): deltas_df =火花。讀\ .format (csv) \ .options(標題=標題分隔符=分隔符,timestampFormat = timestampFormat enoding =編碼,多行= " true ",模式= schema_struct) \ .load df(文件)回報

我想保持一個函數和解決這個問題。現在我需要使用兩個函數。

1接受解決方案

接受的解決方案

Hubert_Dudek1
尊敬的貢獻者三世

如何失敗?

也許有不同的csv頭包括casesensivity enforceSchema = False也許可以幫助。

關於scala模式下罩它指向相同的功能。

在原帖子查看解決方案

3回複3

匿名
不適用

你好@nafri——我的名字是風笛手,我是主持人磚。歡迎來到社區和謝謝你的問題。我很抱歉聽到你有麻煩。我們會給社區回應的機會在我們左右再循環。提前感謝你的耐心。

Hubert_Dudek1
尊敬的貢獻者三世

如何失敗?

也許有不同的csv頭包括casesensivity enforceSchema = False也許可以幫助。

關於scala模式下罩它指向相同的功能。

jose_gonzalez
主持人
主持人

嗨@nafri,

你有什麼錯誤,你能分享它嗎?像@Hubert杜德克提到的,都將調用相同的api

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map