pyspark.sql.DataFrame.sample¶
-
DataFrame。
樣本
( withReplacement:聯盟(浮動,bool,沒有)=沒有一個,分數:聯盟(整數、浮點數、沒有)=沒有一個,種子:可選(int]=沒有一個 )→pyspark.sql.dataframe.DataFrame¶ -
返回一個樣本子集
DataFrame
。- 參數
-
- withReplacement bool,可選
-
樣品與替換(默認
假
)。 - 分數 浮動,可選
-
分數的行生成、範圍[0.0,1.0]。
- 種子 int,可選
-
隨機種子種子取樣(默認)。
筆記
這是不能保證提供完全指定的分數的總計數
DataFrame
。分數是必需的,withReplacement和種子是可選的。
例子
> > >df=火花。範圍(10)> > >df。樣本(0.5,3)。數()7> > >df。樣本(分數=0.5,種子=3)。數()7> > >df。樣本(withReplacement=真正的,分數=0.5,種子=3)。數()1> > >df。樣本(1.0)。數()10> > >df。樣本(分數=1.0)。數()10> > >df。樣本(假,分數=1.0)。數()10