午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

考試報名
考試報名
考試內(nèi)容
考試大綱
在線客服
返回頂部

備考刷題,請到

CDA認證小程序

以下哪兩個算法最容易受到離群值的影響?(多選)
A. KNN
B. 決策樹
C. 等寬裝箱法
D. 等分裝箱法
上一題
下一題
收藏
點贊
評論
題目解析
題目評論(0)

在給定的選項中,以下兩個算法最容易受到離群值的影響:

1. **A: KNN(K-近鄰算法)**
2. **C: 等寬裝箱法**

### 專業(yè)分析:

#### 1. KNN(K-近鄰算法)
- **影響原因**:KNN 是一種基于距離的算法,在進行分類或回歸時,通常使用歐氏距離等度量方法來計算樣本之間的相似度。離群值會顯著影響距離計算,使得這些異常點可能會不成比例地影響模型的預測。
- **表現(xiàn)**:離群值可能會成為 KNN 算法中的“近鄰”,從而錯誤地影響待分類點的類別或數(shù)值預測。

#### 2. 等寬裝箱法
- **影響原因**:等寬裝箱法是將數(shù)據(jù)劃分為等寬的區(qū)間,在這種方法中,離群值可能會導致某些區(qū)間包含的數(shù)據(jù)量非常少或者非常多,從而影響數(shù)據(jù)的分布描述。
- **表現(xiàn)**:如果離群值落在區(qū)間的邊緣,它可能會導致某些區(qū)間幾乎為空或集中大量異常值,這會影響基于分箱進行的任何后續(xù)分析(如直方圖的形態(tài)等)。

### 其他選項分析:

#### B: 決策樹
- 決策樹通常對離群值具有一定的魯棒性,因為它們基于信息增益或基尼指數(shù)來選擇特征和分割點。但是,在極端情況下,離群值可能會影響樹的分裂點。

#### D: 等分裝箱法
- 等分裝箱法是根據(jù)數(shù)據(jù)的分位數(shù)進行分箱,使得每個箱包含相等數(shù)量的樣本,這種方法對離群值有一定的抵抗力,因為離群值不會改變箱的數(shù)量。

因此,KNN 和等寬裝箱法是最容易受到離群值影響的兩個算法。