我一直在努力實現三角洲住表已有的工作流。目前試圖創建兩個表:appointments_raw和notes_raw notes_raw appointments_raw的“下遊”。後這作為參考,我試圖加載使用dlt appointments_raw表。讀(內部notes_raw),但由於dlt.read (“appointments_raw”)似乎是一個空DataFrame。任命原始數據幀似乎是根據管道儲存和蜂巢metastore正確讀取。我們是下麵這個例子:https://docs.www.eheci.com/_extras/notebooks/source/dlt-wikipedia-python.html
具體來說,所指的“頁麵”代碼引用dlt.read (“clickstream_prepared”)。我們試圖做同樣的事情,但麵對一個錯誤。
你的意思是這個嗎?
@dlt.table (
評論=“生從倉庫預約表”,
)
def appointments_raw ():
fetch_data返回。fetch_appointments(=火花,火花secret_handler = secret_handler)
@dlt.table (
評論=“SOLR的原始表的筆記”,
)
def notes_raw ():
任命= dlt.read (“appointments_raw”)
print(類型(任命))
print (appointments.head ())
任命= appointments.pandas_api ()
mrns = fetch_data.select_mrns (
約會,今天=時間戳,days_ahead = APPOINTMENTS_DAYS_AHEAD
)
筆記= fetch_data.fetch_notes (
mrns cohort_id = cohort_id secret_handler = secret_handler,火花=火花
)
返回記錄