我需要106000 + api的調用,而不是叫他們一個接一個,我想創建一個循環,我有位置Id的列表,從那裏我叫api位置列表,這些將坐在url的最後來獲得更多的信息在每個位置的位置列表是有限的。
e。克我想要帶回106000 api的鏈接“IdColumn”從我的列表加載
請看下麵的代碼如果任何人都可以幫助它會有幫助的。
從pyspark.sql。類型進口StructField、StructType StringType,數據類型,行
Idlist = spark.read.load (“loadedfile.paquet”)
locid = Idlist.select (“IdColumn”)
LookUppy = str (“https://apilink/locations/”) + str (Idlist [' IdColumn '])
打印(LookUppy)
我把這個作為輸出=
@Kay Connolly:
它看起來像你想連接字符串列對象,這是導致錯誤。你需要先列對象轉換為一個字符串連接URL。這是一個修改過的代碼片段應該工作:
從pyspark.sql。功能導入concat_ws Idlist = spark.read.load (“loadedfile.paquet”) locid = Idlist.select (IdColumn) # IdColumn轉換為字符串和連接URL lookup_urls = locid。withColumn (“url”, concat_ws (“、“https://apilink/locations/”locid.IdColumn.cast('字符串')))#顯示生成的url lookup_urls.show ()
這將創建一個名為url的新列,其中包含完整的API為每個位置鏈接dataframe ID。然後,您可以使用本專欄API調用在一個循環中。