對于連續(xù)變量的缺失值填補,較為合適的統(tǒng)計量通常是:
A: 均值
C: 中位數(shù)
### 專業(yè)分析
- **均值填補**:
- **優(yōu)點**:使用均值填補是最常見的方法,適用于數(shù)據分布較為對稱的情況。均值能夠利用所有非缺失值的信息。
- **缺點**:對于有顯著偏斜的數(shù)據集,均值可能受到極端值的影響,導致填補后的數(shù)據失真。
- **中位數(shù)填補**:
- **優(yōu)點**:中位數(shù)不受極端值的影響,適用于偏斜分布的數(shù)據集。此外,中位數(shù)能夠更好地代表數(shù)據的中心趨勢。
- **缺點**:不如均值利用所有數(shù)據的信息量,因為它僅依賴于排序后的中間值。
#### 其他選項分析
- **最大值和最小值填補**:
- 這兩種方法通常不用于缺失值填補,因為它們會引入極端值,改變數(shù)據的分布特性。這些方法可能導致模型的偏差,尤其是在機器學習應用中。
### 結論
在選擇填補方法時,應考慮數(shù)據的分布特性和對分析結果的影響。均值適合對稱分布的情況,而中位數(shù)更適用于偏斜分布的數(shù)據。