工程數據
取消
顯示的結果
而不是尋找
你的意思是:

論壇的帖子

我怎麼能拚花文件讀取壓縮時髦?

嗨,我想讀parqet文件壓縮時髦到火花抽樣輸入文件的名字是:- 00000. m -時髦的一部分。拚花我用sqlContext.setConf (“spark.sql.parquet.compression.codec。”、“時髦的”)val inputRDD = sqlContext.parqetFile (args(0))當……

Mallesh 通過 新的因素
  • 6940年的觀點
  • 1回複
  • 0榮譽

解決了!寫作DataFrame通過JDBC PostgreSQL極慢(火花1.6.1)

你好,我是剛剛開始與火花和我有一個中等大小的DataFrame創建在S3中從整理csv(88列,860 k行)這似乎是采取不合理的時間(使用SaveMode.Append)插入Postgres。我…

longcao 通過 新的貢獻者三世
  • 4242年的觀點
  • 5回複
  • 0榮譽

如何避免空/空鍵DataFrame groupby嗎?

嗨我有火花的工作這組,我不能避免它,因為我的用例。我有我需要處理大型數據集1 TB DataFrame /更新。現在我的工作打亂龐大的數據,減緩由於洗牌和groupby的事情。一個r……

UmeshKacha 通過 新的貢獻者二世
  • 3654年的觀點
  • 3回複
  • 0榮譽

我怎麼逃避火花SQL的查詢字符串?

嘿,所有的,我想過濾字符串但字符串有一個單引號——我怎麼逃避Scala中的字符串?我試過一個舊版本的StringEscapeUtils但沒有運氣。對不起如果一個愚蠢的問題- Scala。進口org.apache.commons.lan……

johnmcauley 通過 新的貢獻者二世
  • 5378年的觀點
  • 2回複
  • 0榮譽
Baidu
map