pyspark.pandas.range¶
-
pyspark.pandas。
範圍
( 開始:int,結束:可選(int]=沒有一個,一步:int=1,num_partitions:可選(int]=沒有一個 )→pyspark.pandas.frame.DataFrame¶ -
創建一個DataFrame範圍的數字。
結果DataFrame隻有一個int64列命名id,包含元素的範圍從
開始
來結束
(獨家)值一步
。如果第一個參數指定(即開始),我們把它當作價值值0開始。這類似於函數範圍SparkSession和主要用於測試。
- 參數
-
- 開始 int
-
開始值(包容)
- 結束 int,可選
-
最終值(獨家)
- 一步 int,可選的,默認1
-
增量步
- num_partitions int,可選
-
DataFrame分區的數量
- 返回
-
- DataFrame
例子
當第一個參數是指定的,我們到這個數字生成一係列的值。
> > >ps。範圍(5)id0 012 - 23個34個4
當開始、結束和步驟指定:
> > >ps。範圍(開始=One hundred.,結束=200年,一步=20.)id100年01 1202 140年3 160180年4