pyspark.pandas.DataFrame.melt¶

DataFrame。 融化 ( id_vars:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]],沒有)=沒有一個,value_vars:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]],沒有)=沒有一個,var_name:聯盟(str,列表(str),沒有一個)=沒有一個,value_name:str=“價值” )→pyspark.pandas.frame.DataFrame¶

透視的DataFrame寬格式長格式,選擇離開標識符變量集。

這個函數是有用的按摩DataFrame格式在一個或多個列標識符變量(id_vars),而所有其他列,考慮測量變量(value_vars),是“透視”行軸,隻留下兩個non-identifier列,“變量”和“價值”。

參數

框架 DataFrame
id_vars 元組、列表或ndarray,可選的: 列(s)作為標識符變量。
value_vars 元組、列表或ndarray,可選的: 列(s)透視。如果不指定,不設置為使用所有列id_vars。
var_name 標量,默認“變量”: 名稱使用變量的列。如果沒有使用frame.columns.name或“變量”。
value_name 標量,默認的“價值”: 使用“價值”列名稱。

返回

DataFrame: 透視DataFrame。

例子

           > > >df=ps。DataFrame({“一個”:{0:“一個”,1:“b”,2:“c”},…“B”:{0:1,1:3,2:5},…“C”:{0:2,1:4,2:6}},…列=(“一個”,“B”,“C”])> > >dfA B C0 1 21 b 3 42 c 5 6
          

           > > >ps。融化(df)變量值0一個1 B 12 C 23 b4 B 35 C 46 c7 B 58 C 6
          

           > > >df。融化(id_vars=“一個”)一個變量值0 B 11 C 22 b b 33 b C 44 c B 55 c c 6
          

           > > >df。融化(value_vars=“一個”)變量值0一個1一個b2 c
          

           > > >ps。融化(df,id_vars=(“一個”,“B”])B變量值0 1 C 21 b 3 C 42 c 5 c 6
          

           > > >df。融化(id_vars=(“一個”),value_vars=(“C”])一個變量值0 C 21 b C 42 c c 6
          

“變量”和“價值”的名字列可以定製:

           > > >ps。融化(df,id_vars=(“一個”),value_vars=(“B”),…var_name=“myVarname”,value_name=“myValname”)一個myVarname myValname0 B 11 b b 32 c B 5
          

以前的

pyspark.pandas.DataFrame.unstack

下一個

pyspark.pandas.DataFrame.explode