pyspark.sql.DataFrame.sameSemantics

DataFrame。 sameSemantics ( 其他:pyspark.sql.dataframe.DataFrame )→bool

返回真正的當內部邏輯查詢計劃DataFrame年代是相等的,因此返回相同的結果。

筆記

這裏的平等比較簡化的容忍化妝品等不同屬性名稱。

這個API可以比較DataFrame年代非常快但仍然可以返回DataFrame返回相同的結果,例如,從不同的計劃。這樣的假陰性時可以有用的語義緩存作為一個例子。

這個API是一個開發人員API。

例子

> > >df1=火花範圍(10)> > >df2=火花範圍(10)> > >df1withColumn(“col1”,df1id*2)sameSemantics(df2withColumn(“col1”,df2id*2))真正的> > >df1withColumn(“col1”,df1id*2)sameSemantics(df2withColumn(“col1”,df2id+2))> > >df1withColumn(“col1”,df1id*2)sameSemantics(df2withColumn(“col0”,df2id*2))真正的