取消
顯示的結果
而不是尋找
你的意思是:

無法加載鋪文件使用自動裝卸機。有人可以幫忙嗎?

瑪雅
新的貢獻者三世

我試圖加載使用自動裝卸機鋪文件。下麵是代碼

def autoload_to_table (data_source、source_format table_name checkpoint_path):查詢=(火花。readStream .format .option (“cloudFiles (“cloudFiles”)。形式at', source_format) .schema("VendorID long,tpep_pickup_datetime timestamp, tpep_dropoff_datetime timestamp, passenger_count long, trip_distance long, RateCodeID long, Store_and_fwd_flag string,PULocationID int, DOLocationID long, payment_type long, fare_amount long, extra long, mta_tax long,Tip_amount long, tolls_amount long, improvement_surcharge long, total_amount long, congestion_Surcharge long, airport_fee long ") .option('cloudFiles.schemaLocation', checkpoint_path) .load(data_source) .writeStream .option('checkpointLocation', checkpoint_path) .option('mergeSchema', "true") .table(table_name) ) return query query = autoload_to_table (data_source = "/mnt/landing/nyctaxi", source_format = "parquet", table_name = "yellow_trip_data", checkpoint_path='/tmp/delta/yellowdata/_checkpoints' )

然而,我遇到以下錯誤。我也附加ipython筆記本/

引起的:org.apache.spark。SparkException:工作階段失敗而終止:任務0階段3011.0失敗了4次,最近的失敗:在舞台上失去了任務0.3 3011.0 (TID 11673)(10.139.64.5執行人0):. lang。UnsupportedOperationException:方式org.apache.parquet.column.values.dictionary.PlainValuesDictionary PlainDoubleDictionary美元

在org.apache.parquet.column.Dictionary.decodeToLong (Dictionary.java: 49)

org.apache.spark.sql.execution.datasources.parquet.ParquetDictionary.decodeToLong (ParquetDictionary.java: 54)

8回答說8

Hubert_Dudek1
尊敬的貢獻者三世

太棒了!謝謝你!

VartikaNain
主持人
主持人

嘿@Mayank斯利瓦斯塔瓦

希望你是好!

我們很高興知道你可以解決你的問題。真的很棒,如果你能答案標記為最佳。它對其他成員也將很有幫助。

幹杯!

瑪雅
新的貢獻者三世

完成了! !

VartikaNain
主持人
主持人

嗨再次@Mayank斯利瓦斯塔瓦

感謝你回到美國,標誌著回答最好。

我們非常感謝你的時間。

祝您旅途大磚吧!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map