取消
顯示的結果
而不是尋找
你的意思是:

如何處理列名。(點)pyspark dataframe ? ?

MithuWagh
新的因素

  • 我們流數據從卡夫卡源與json但在一些列我們。(點)在列名。
  • 流json數據:

df1 = df。selectExpr(“鑄(值作為字符串)”)

{“pNum”:“阿”,“從”:“電信”、“有效載荷”:{“目標”:“1”,“國家”:“印度”、“EMAIL.1”:“(電子郵件保護)”、“PHONE.1 ": " 1122334455 "}}

  • 在上麵的json (EMAIL.1 PHONE.1)。(點)的名字。
  • 我們提取的json數據get_json_object像下麵,但我們的電子郵件和電話值是null

df2 = df1。選擇(get_json_object (df1(“價值”),“.pNum美元”).alias (“pNum”), get_json_object (df1(“價值”),“從今以後美元”).alias(“的”),get_json_object (df1(“價值”),“.payload.TARGET美元”).alias(“目標”),get_json_object (df1(“價值”),“.payload.COUNTRY美元”).alias(“中國”),get_json_object (df1(“價值”),“.payload.EMAIL.1美元”).alias(電子郵件),get_json_object (df1(“價值”),“.payload.PHONE.1美元”).alias('電話'))

那麼如何處理這種類型的列名字? ?

1回複1

shyam_9
價值貢獻

嗨@Mithu Wagh可以使用引號將列名。

df.select (“col0.1”)
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map