正確答案是:A: 數(shù)據(jù)清洗
### 專業(yè)分析:
在知識發(fā)掘處理(Knowledge Discovery Process)過程中,處理錯誤值(Wrong Value)通常屬于數(shù)據(jù)預(yù)處理的任務(wù),而數(shù)據(jù)清洗是數(shù)據(jù)預(yù)處理的一個關(guān)鍵階段。以下是對各個選項(xiàng)的分析:
1. **數(shù)據(jù)清洗(Data Cleaning)**:
- **定義**:數(shù)據(jù)清洗是指識別、修正或刪除數(shù)據(jù)中的錯誤(例如:輸入錯誤、缺失值、重復(fù)數(shù)據(jù)等),以提高數(shù)據(jù)質(zhì)量。
- **任務(wù)**:包括處理錯誤值、缺失值、重復(fù)數(shù)據(jù)、不一致數(shù)據(jù)等。
- **定位**:由于錯誤值直接影響數(shù)據(jù)的準(zhǔn)確性,數(shù)據(jù)清洗階段是處理這些錯誤值的關(guān)鍵所在。
2. **數(shù)據(jù)選擇(Data Selection)**:
- **定義**:從大量的原始數(shù)據(jù)集中選擇與分析目標(biāo)相關(guān)的數(shù)據(jù)。
- **任務(wù)**:基于特定的標(biāo)準(zhǔn)或需求選擇數(shù)據(jù)子集。
- **定位**:此階段不直接處理數(shù)據(jù)中的錯誤值。
3. **數(shù)據(jù)編碼(Data Transformation/Encoding)**:
- **定義**:將數(shù)據(jù)轉(zhuǎn)換為適合建模的格式,通常涉及數(shù)據(jù)的規(guī)范化、離散化和編碼。
- **任務(wù)**:對數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使之適應(yīng)機(jī)器學(xué)習(xí)算法的需求。
- **定位**:主要關(guān)注數(shù)據(jù)格式的轉(zhuǎn)換與編碼,不針對錯誤值的處理。
4. **數(shù)據(jù)擴(kuò)充(Data Augmentation)**:
- **定義**:通過生成新數(shù)據(jù)來增加數(shù)據(jù)集的規(guī)模,以提高模型的泛化能力。
- **任務(wù)**:主要在圖像處理、自然語言處理中使用,通過擾動、變換原始數(shù)據(jù)生成新樣例。
- **定位**:此階段與錯誤值處理無關(guān)。
綜上所述,錯誤值的處理屬于數(shù)據(jù)清洗階段,因?yàn)檫@一階段專門針對數(shù)據(jù)質(zhì)量問題進(jìn)行處理,包括但不限于錯誤值的修正和去除。