pyspark.sql.DataFrame.sameSemantics¶
-
DataFrame。
sameSemantics
( 其他:pyspark.sql.dataframe.DataFrame )→bool¶ -
返回真正的當內部邏輯查詢計劃
DataFrame
年代是相等的,因此返回相同的結果。筆記
這裏的平等比較簡化的容忍化妝品等不同屬性名稱。
這個API可以比較
DataFrame
年代非常快但仍然可以返回假在DataFrame
返回相同的結果,例如,從不同的計劃。這樣的假陰性時可以有用的語義緩存作為一個例子。這個API是一個開發人員API。
例子
> > >df1=火花。範圍(10)> > >df2=火花。範圍(10)> > >df1。withColumn(“col1”,df1。id*2)。sameSemantics(df2。withColumn(“col1”,df2。id*2))真正的> > >df1。withColumn(“col1”,df1。id*2)。sameSemantics(df2。withColumn(“col1”,df2。id+2))假> > >df1。withColumn(“col1”,df1。id*2)。sameSemantics(df2。withColumn(“col0”,df2。id*2))真正的