取消
顯示的結果
而不是尋找
你的意思是:

如何讀取excel文件使用磚

PraveenSaini
新的因素

0

我有一個excel文件作為源文件,我想從excel文件讀取數據在數據幀使用磚和轉換數據。我已經添加了maven依賴對Excel文件格式。當我一個特林下麵代碼錯誤。(錯誤:. io .FileNotFoundException: / FileStore /表/航空公司。xlsx(沒有這樣的文件或目錄),但文件是可用的。請幫我在這段代碼。

val df = spark.read.format (“com.crealytics.spark.excel”)

.option(“位置”、“/ FileStore /表/ Airline.xlsx”)

.option (“useHeader”,“真正的”)

.option (“treatEmptyValuesAsNulls”,“假”)

.option (“inferSchema”,“假”)

.option (“addColorColumns”,“假”)

.load (“/ FileStore /表/ Airline.xlsx”)

17日回複17

Devarsh
貢獻者

首先檢查你的火花和scala版本。

然後安裝與Maven庫坐標根據你的火花和scala版本。

進一步檢查這個鏈接了解更多關於使用Maven坐標:

https://mvnrepository.com/artifact/com.crealytics/spark-excel_2.12

選擇集群- - >庫- - >安裝新- - > Maven - - >

坐標- com.crealytics: spark-excel_2.12:3.2.1_0.16.4

pyspark使用下麵的代碼:

df2 = spark.read.format (“com.crealytics.spark.excel”)。選項(“頭”,“真正的”)。選項(“inferSchema”,“真正的”).load (“dbfs: / FileStore / shared_uploads /(電子郵件保護)/ book.xlsx”)顯示(df2)

Ananth
新的貢獻者二世

這真的奏效了。但是我看到這個誤差較大的excel文件。

shadeio.poi.util。RecordFormatException:試圖分配一個數組的長度208933193,但這個記錄類型的最大長度是100000000。

匿名
不適用

另一種方法也有助於你的案子是usign熊貓讀取excel然後把熊貓Dataframe Pyspark Dataframe:slightly_smiling_face:

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map