核心類¶
|
入口點和數據集和DataFrame API編程火花。 |
|
麵向用戶的目錄的API,可以通過SparkSession.catalog。 |
|
一個分布式數據分為命名列的集合。 |
|
在DataFrame一列。 |
|
類來觀察(命名)指標 |
一行在 |
|
|
一組的聚合方法 |
|
一兩的邏輯分組 |
處理缺失數據的功能 |
|
功能和統計功能 |
|
在DataFrames效用函數定義窗口。 |
|
|
接口用於負載 |
|
接口用於編寫一個 |