取消
顯示的結果
而不是尋找
你的意思是:

磚發布—訂閱數據的偵察

ajaypanday6781
尊敬的貢獻者二世

我想設置一個偵察活動GCP -訂閱和磚之間,有什麼方法可以獲取過去24小時記錄從發布—訂閱數?

我試過但是沒有任何直接的解決方案,這將是偉大的如果任何一個能顯示我的方式t # pubsub # databrickso實現它。

# pubsub #磚

3回複3

Prabakar
尊敬的貢獻者三世
尊敬的貢獻者三世

獲取過去24小時的記錄從Pub / Sub數,您可以使用publishTimestampInMillis在發布/訂閱模式過濾記錄根據發布時間戳。您可以使用current_timestamp ()函數在磚當前時間戳和減去24小時得到24小時前的時間戳。然後您可以使用filter ()根據他們的功能來過濾記錄publishTimestampInMillis字段。

這裏有一個例子代碼片段演示了如何獲取過去24小時的記錄使用磚從Pub / Sub數:

進口org.apache.spark.sql.functions。_ val authOptions:地圖(字符串,字符串)= (- > clientId“clientId”,“clientEmail”- > clientEmail,“privateKey”- > privateKey,“privateKeyId”- > privateKeyId) val pubsubDF =火花。readStream .format (“pubsub”) .option (“subscriptionId”、“mysub”) .option .option (“topicId”、“mytopic”) (“projectId”、“。”) .options (authOptions) .load () val last24HoursTimestamp = current_timestamp () - expr(“間隔24小時”)val last24HoursCount = pubsubDF .filter (col (publishTimestampInMillis) > = last24HoursTimestamp.cast(“長”)).count () println (s“記錄數:24小時last24HoursCount美元”)

注意,這個代碼片段假設您已經配置了Pub / Sub連接器在磚和有必要的授權選項。如果你還沒有這樣做,請參閱文檔訂閱穀歌Pub / Sub |磚在穀歌的雲為更多的信息。

ajaypanday6781
尊敬的貢獻者二世

@Prabakar

謝謝你的快速回複,我在尋找直接數據指望PUBSUB磚作為我們必須驗證有多少記錄PUBSUB在磚和多少記錄我們已經收到最後的24小時。

Vidula_Khanna
主持人
主持人

@ajaypanday6781

希望你是好。隻是想看看你是否能夠找到一個回答你的問題,你想要一個答案標記為最好?它對其他成員也將很有幫助。

幹杯!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map