取消
顯示的結果
而不是尋找
你的意思是:

QuantileDiscretizer不尊重NumBuckets

山姆
新的貢獻者三世

我有設置numBuckets和numBucketsArray本為一組列成5桶。

不幸的是桶的數量似乎並沒有被尊重所有列即使有變化。

我試過設置relativeerror為0。

https://spark.apache.org/docs/latest/api/python/reference/api/pyspark.ml.feature.QuantileDiscretizer..。

你知不知道這是為什麼和如何解決它強製指定的桶數?

1接受解決方案

接受的解決方案

山姆
新的貢獻者三世

謝謝你!

我所做的是:

  1. QuntileBucketizer適用於非零和指定一個很小的值(1%)捕捉下桶包括0。

固定的問題!你可以定義自己的分裂將工作但分裂本身是重要的在這種情況下。

在原帖子查看解決方案

4回複4

Kaniz
社區經理
社區經理

你好@山姆!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在論壇上有一個回答你的問題。否則我們將很快跟進與回複。

werners1
尊敬的貢獻者三世

QuantileDiscretizer並不能保證桶afaik的數量。根據你的數據可能會不如問桶。

Bucketizer然而,但你必須定義您的分裂。

山姆
新的貢獻者三世

謝謝你!

我所做的是:

  1. QuntileBucketizer適用於非零和指定一個很小的值(1%)捕捉下桶包括0。

固定的問題!你可以定義自己的分裂將工作但分裂本身是重要的在這種情況下。

赫曼特
重視貢獻二世

你能解釋更多嗎?

赫曼特索尼
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map