取消
顯示的結果
而不是尋找
你的意思是:

磚火花的XML解析器:支持名稱空間聲明在祖先的水平。

Ben_Spark
新的貢獻者三世

我試圖使用Spark-XML API和麵臨問題與XSD驗證選項。

其實當我解析一個XML文件使用“rowValidationXSDPath”選項解析器不能識別前綴/根級別的名稱空間聲明。

為此我不得不向下移動RowTag水平的名稱空間聲明。

例子

< RootTag xmlns: myPrefix1 = " http: ..... " xmlns: myPrefix2 = " http: .....”... >

< myPrefix1: ParentMember >

< myPrefixe2: ChildMember >

............

< / myPrefixe2: ChildMember >

< myPrefix1: ParentMember >

< / RootTag >

閱讀上麵的結構使用rowValidationXSDPath選項會用以下錯誤:前綴“myPrefixe2”元素“myPrefixe2: ChildMember”卻不被捆綁。

我知道這是一個錯誤在之前的版本中,但想知道固定選項啟用rowValidationXSDPath時也。

提前感謝您的幫助。

1接受解決方案

接受的解決方案

Ben_Spark
新的貢獻者三世

抱歉遲到的響應有忙著尋找一個永久的解決這個問題。

最後我們都放棄XSDpath解析器。這個選項不工作當前綴的名稱空間聲明在祖先的水平。

無論如何,感謝您的幫助和支持

在原帖子查看解決方案

9回複9

Kaniz
社區經理
社區經理

嗨@Ben本,文章描述如何讀和寫一個XML文件作為一個Apache火花數據源。

Ben_Spark
新的貢獻者三世

嗨Kaniz

謝謝你們的回答。

我知道文章的閱讀XML沒有XSD並不是一個問題。

問題是,我需要驗證對XSD使用“行”rowValidationXSDPath不支持行級的前綴和名稱空間聲明在祖先的水平。

Kaniz
社區經理
社區經理

嗨@Ben本,你可以驗證個人行針對XSD模式使用

rowValidationXSDPath。您使用效用com.databricks.spark.XML.util。XSDToSchema提取火花DataFrame模式一些XSD文件。

它隻支持簡單的,複雜的序列類型,隻有基本的XSD功能,是實驗。

如果你想添加任何功能要求,請繼續分享你的想法。我們很樂意聽的。

Kaniz
社區經理
社區經理

嗨@Ben本,你想提高一個特性的請求嗎?

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map