pyspark.sql.functions.to_utc_timestamp¶
-
pyspark.sql.functions。
to_utc_timestamp
( 時間戳:ColumnOrName,tz:ColumnOrName )→pyspark.sql.column.Column¶ -
這是一種常見的函數數據庫支持沒有時區的時間戳。timezone-agnostic這個函數需要一個時間戳,在給定的時區,並把它解釋為一個時間戳,並呈現時間戳在UTC時間戳。
然而,時間戳在火花代表數微秒的Unix紀元,這不是timezone-agnostic。所以在火花這個函數就將時間戳的值從給定的UTC時區的時區。
這個函數可以返回令人困惑的結果與時區如果輸入是一個字符串,例如“2018 - 03 - 13 - t06:18:23 + 00:00”。原因在於,火花首先把字符串根據時區的時間戳字符串,最後顯示結果通過將時間戳轉換為字符串根據會話當地時區。
- 參數
例子
> > >df=火花。createDataFrame(((“1997-02-28 10:30:00”,“JST”)),(“t”,' tz '])> > >df。選擇(to_utc_timestamp(df。ts,“太平洋標準時間”)。別名(“已知的”utc_time表示))。收集()(行= datetime已知的(utc_time表示。datetime(1997 2, 28歲,18歲,30))> > >df。選擇(to_utc_timestamp(df。ts,df。tz)。別名(“已知的”utc_time表示))。收集()(行= datetime已知的(utc_time表示。datetime(1 1997 2, 28日,30))