正確答案是:A: 數(shù)據(jù)清洗
在知識發(fā)掘處理(Knowledge Discovery Process)中,數(shù)據(jù)清洗是處理空值(NULL Value)等數(shù)據(jù)質(zhì)量問題的關(guān)鍵階段。數(shù)據(jù)清洗的主要任務(wù)是識別和修正數(shù)據(jù)中的錯誤、遺漏和不一致之處,以提高數(shù)據(jù)的質(zhì)量和完整性。
具體分析如下:
1. **數(shù)據(jù)清洗**:這一階段的主要目標是處理數(shù)據(jù)中的噪聲和缺失值,包括空值(NULL Value)。常見的方法有刪除空值、填補空值(例如使用均值、中位數(shù)或其他統(tǒng)計方法)、以及通過其他數(shù)據(jù)推斷出合理的值。
2. **數(shù)據(jù)選擇**:這是選擇相關(guān)數(shù)據(jù)以用于進一步分析的階段。雖然數(shù)據(jù)選擇可能涉及到考慮數(shù)據(jù)的完整性,但它通常不涉及具體的空值處理。
3. **數(shù)據(jù)編碼**:這一階段涉及將數(shù)據(jù)轉(zhuǎn)換為適合分析的格式,比如將分類數(shù)據(jù)轉(zhuǎn)換為數(shù)值編碼。這一階段通常不直接處理空值問題。
4. **數(shù)據(jù)擴充**:這一階段涉及增加新的特征或數(shù)據(jù)以增強模型的表現(xiàn),通常不涉及直接處理空值。
因此,空值的處理主要是在數(shù)據(jù)清洗階段進行的,因為這是確保數(shù)據(jù)質(zhì)量的關(guān)鍵步驟。