pyspark.pandas.range

pyspark.pandas。 範圍 ( 開始:int,結束:可選(int]=沒有一個,一步:int=1,num_partitions:可選(int]=沒有一個 )→pyspark.pandas.frame.DataFrame

創建一個DataFrame範圍的數字。

結果DataFrame隻有一個int64列命名id,包含元素的範圍從開始結束(獨家)值一步。如果第一個參數指定(即開始),我們把它當作價值值0開始。

這類似於函數範圍SparkSession和主要用於測試。

參數
開始 int

開始值(包容)

結束 int,可選

最終值(獨家)

一步 int,可選的,默認1

增量步

num_partitions int,可選

DataFrame分區的數量

返回
DataFrame

例子

當第一個參數是指定的,我們到這個數字生成一係列的值。

> > >ps範圍(5)id0 012 - 23個34個4

當開始、結束和步驟指定:

> > >ps範圍(開始=One hundred.,結束=200年,一步=20.)id100年01 1202 140年3 160180年4