你好,
我知道如何創建.shp文件從Geopandas dataframe使用代碼類似於這個,提到如此:
gpd_df = geopandas。GeoDataFrame (pandas_df、幾何=“幾何學”)gpd_df .to_file(“用戶名/ nh.shp”)
但是我有.parquet文件可以直接加載到火花DataFrame我想這樣形狀創建並保存文件。不幸的是我不知道這是可能的。我不能看到.shp格式支持的格式。我還檢查塞多納,但隻發現Shapefilereader不允許保存/寫。先進的操作形狀文件是什麼?
@Bartosz Maciejewski:
引發對寫作沒有原生支持直接shapefile。不過,您可以使用一個第三方庫如GeoPandas或PyShp寫你的火花DataFrame Shapefile。
這裏有一個例子如何使用GeoPandas火花DataFrame轉換為GeoDataFrame Shapefile並保存它。
進口geopandas pyspark加侖日。sql進口SparkSession秀氣。幾何導入點#創建SparkSession火花= SparkSession.builder.appName (SparkGeoPandas) .getOrCreate() #創建示例火花DataFrame df =火花。createDataFrame([(1點(0,0)),(2)點(1,1))],[“id”、“幾何”])#將火花DataFrame GeoDataFrame使用GeoPandas * * * = gpd.GeoDataFrame (df.toPandas(),幾何=“幾何”)#保存GeoDataFrame Shapefile * * * .to_file(“路徑/ / Shapefile。軸馬力”,司機= " ESRI Shapefile”)
您還可以使用另一個庫的PyShp代替GeoPandas。