當我試圖訪問特定版本的數據和設置的參數值的具體數字,我得到所有版本數據。
data1 = delta_sharing。load_table_changes_as_spark (table_url starting_version = 1, ending_version = 1)
data2 = delta_sharing。load_table_changes_as_spark (table_url starting_version = 2, ending_version = 2)
這裏data1以及data2給了相同的數據。當我檢查相同版本的數據使用load_table_changes_as_pandas(),它給特定版本的數據。
data1 = delta_sharing。load_table_changes_as_pandas (table_url starting_version = 1, ending_version = 1)
data2 = delta_sharing。load_table_changes_as_pandas (table_url starting_version = 2, ending_version = 2)
在熊貓的場景中,data1有版本1的數據和data2有版本2的數據。這兩個,data1 data2有不同的數據如預期。
我們必須做些什麼來獲得特定版本的數據在火花dataframe使用load_table_changes_as_spark函數?