我們有一個來自于大眾點評的數(shù)據(jù),數(shù)據(jù)集保存了用戶對商家的點評數(shù)據(jù),每個商家都有一個點評數(shù)量,假設(shè)我們的任務(wù)是使用協(xié)同過濾方法預(yù)測某用戶給某商家的打分,點評數(shù)量會是一個非常有用的特征,因為人氣和高評分之間有很強(qiáng)的相關(guān)性?,F(xiàn)在我們將點評數(shù)量的分布繪制出來,如圖所示

(2)在這個分布中,數(shù)量的否是不是很均衡,如果我們想要讓離散化后的每個分箱中的數(shù)量接近,應(yīng)該使用的分箱方法是: