核心火花功能。
核心火花功能。org.apache.spark.SparkContext作為火花的主要入口點,org.apache.spark.rdd.RDD是代表一個分布式的數據類型集合,並提供大多數並行操作。
此外,org.apache.spark.rdd.PairRDDFunctions包含操作隻能在抽樣鍵值對,等groupByKey
和加入
;org.apache.spark.rdd.DoubleRDDFunctions包含操作隻能在雙打的抽樣;和org.apache.spark.rdd.SequenceFileRDDFunctions包含操作可以在抽樣SequenceFiles能得救。這些操作是自動上可用任何抽樣的類型(如抽樣((Int, Int))通過隱式轉換。
Java程序員應該引用org.apache.spark.api.java包火花在Java編程api。
類和方法標注實驗是麵向用戶的功能還沒有被正式采用火花項目。這些小版本中更改或刪除。
類和方法標注開發人員API僅供高級用戶希望延長火花通過低層接口。這些小版本中更改或刪除。