我發現一個很奇怪的行為與我們的一些集成管道。本周的一個csv文件變得破碎時讀,讀下麵的函數。
def ReadCSV(文件、schema_struct標題分隔符,timestampformat,編碼=“utf8 ",多行= " true "): deltas_df =火花。讀\ .format (csv) \ .options(標題=標題分隔符=分隔符,timestampFormat = timestampFormat enoding =編碼,多行=多行). schema(模式= schema_struct) \ .load df(文件)回報
我做了改變和移動模式的選項。這個工作能夠讀取文件對象。但它開始為其他對象失敗。所以我想知道為什麼它會表現不同。
def ReadCSV2(文件、schema_struct標題分隔符,timestampformat,編碼=“use utf8”): deltas_df =火花。讀\ .format (csv) \ .options(標題=標題分隔符=分隔符,timestampFormat = timestampFormat enoding =編碼,多行= " true ",模式= schema_struct) \ .load df(文件)回報
我想保持一個函數和解決這個問題。現在我需要使用兩個函數。