pyspark.sql.DataFrame.select

DataFrame。 選擇 ( *關口:ColumnOrName )→DataFrame

項目一組表達式並返回一個新的DataFrame

參數
關口 str,,或列表

列名(字符串)或表達式()。如果其中一個列名是‘*’,這一列是當前擴大到包括所有列DataFrame

例子

> > >df選擇(‘*’)收集()行(= 2歲name =“愛麗絲”)、行(= 5歲name = '鮑勃'))> > >df選擇(“名字”,“年齡”)收集()行(name =“愛麗絲”,年齡= 2),行(name =“鮑勃”、年齡= 5)]> > >df選擇(df的名字,(df年齡+10)別名(“年齡”))收集()行(name =“愛麗絲”,年齡= 12),行(name =“鮑勃”、年齡= 15))