如何添加惟一的連續id三角洲湖選項卡……-磚- 13733

StackP · ‎07-12-2022

在磚我有一個現有的三角洲表,我想添加一個列,為Id,這樣每一行沒有惟一的Id,連續(主鍵是如何在sql)。

到目前為止我已經嚐試把δ表pyspark dataframe並添加新列

從pyspark.sql。窗口導入窗口,W

從pyspark。sql導入函數F

df1 = df1。withColumn (“idx F.monotonically_increasing_id ())

windowSpec = W.orderBy (“idx”)

F.row_number () .over (windowSpec)),告訴()

我試著寫回差值表,

df.write.mode(“追加”).format(“δ”).save(位置/ db.tablename)

它寫道但是查詢後的數據值是null新id列。我讀,覆蓋模式將刪除所有之前的數據。我怎麼能把δ表和列id數據插入數據時保持遞增id列?

我想實現添加一個自動增量δ表列。磚運行時是7.3。

Sandeep · ‎07-14-2022

如何定義一個標識列如下?

生成的{總是默認|}作為身份(((從開始)[增量步)))

磚