數據是這樣的:
pageId】|【頁麵】|【位置】|【sysId】|【carId 0005] |(寶馬)|(南)| (AD6) | (OP4
有至少50列和數百萬行。
我嚐試使用以下代碼來讀取:
dff = sqlContext.read.format (“com.databricks.spark.csv”)。選項(“頭”,“真正的”)。選項(“inferSchema”,“真正的”)。選項(“分隔符”、“)| (”).load (trainingdata +“- 00000一部分”)
它給了我以下錯誤:
IllegalArgumentException: u 'Delimiter不能超過一個字符:]| ['
這個作品。謝謝。
是的這個是有用的但如果我們需要使用CSV格式隻比其他任何查詢,如果有你可以分享。@ROHIT阿加瓦爾