Azure DBR——必須列表json文件加載到數據幀,然後從DF磚數據表但列特殊字符,得到以下錯誤。
兩列(鍵)和價值(json)記錄在json文件中特殊字符。
#不能創建一個表有一個嵌套列的名稱包含無效字符(',',':',';')在蜂巢metastore。表:“分貝”。“表”;專欄:九頭蛇:xxxx
還需要struct類型轉換成字符串。
例:
{
:“@context /環境/ xxxxx”,
:“@ id / xxxxx”,
“@type”:“九頭蛇:集合”,
“九頭蛇:xxxx”:【
{
:“@ id / xxxxx / 1”,
“@type”:“產品”,
“類型”:“更新”,
“id”:空,
“pid”: 2
“pCode”:空,
“詳情”:“abcdefgh”,
“updt”:“2019 - 01 - 09年t03:04:27 + 01:00”,
“代碼”:[
“123456789101”
]
},
{
“@ id”:“/ xxxxx / 2”,
“@type”:“產品”,
“類型”:“更新”,
“id”:空,
“pid”: 2
“pCode”:空,
“詳情”:“abcdefgh”,
“updt”:“2019 - 01 - 09年t03:04:27 + 01:00”,
“代碼”:[
“123456789101”
]
}
),
“九頭蛇:totalItems”: 2
“九頭蛇:視圖”:{
:“@ id / xxxxx ? page = 1”,
“@type”:“九頭蛇:大眾”,
“九頭蛇:第一”:“/ xxxxx ? page = 1”,
“九頭蛇:最後一次”:“/ xxxxx ? = 12頁”,
“九頭蛇:下一個”:“/ xxxxx ? page = 245”
},
“九頭蛇:搜索”:{
“@type”:“九頭蛇:IriTemplate”,
“九頭蛇:模板”:“xxxxxxxxxxxxxxxxx”,
“九頭蛇:variableRepresentation”:“BasicRepresentation”,
“九頭蛇:映射”:【
{
“九頭蛇:價值”:“zzzzz”
“@type”:“xx”,
“變量”:“yy(前)”,
“財產”:“yy”,
“要求”:假的
},
{
“九頭蛇:價值”:“嘶嘶”
“@type”:“科幻小說”,
“變量”:“asf”,
“財產”:“四強”,
“要求”:假的
}
]
}
}
請提供你的建議來解決它。我用pyspark azure磚。
最好的就是手動定義模式。有不錯的文章從人完全相同的問題https://towardsdev.com/create-a-spark-hive-meta-store-table-using-nested-json-with-invalid-field-nam..。