本題考查異常值發(fā)現(xiàn)方法。選項A表述的信息指的是均值加減3倍標(biāo)準(zhǔn)差構(gòu)造閾值范圍來篩選異常數(shù)據(jù)。梯度下降法適用于計算最優(yōu)值。相關(guān)性分析是對兩個或多個具備相關(guān)性的變量元素進行分析,從而衡量兩個變量因素的相關(guān)密切程度其余選項方法幾乎無法發(fā)現(xiàn)異常值。歸一化處理是對于原始數(shù)據(jù)映射到統(tǒng)一范圍內(nèi),主要是為了數(shù)據(jù)處理更加方便。因此本題選A。
正確答案是:A: 使用均值加減3倍標(biāo)準(zhǔn)差設(shè)置閾值。
專業(yè)分析:
異常值(Outliers)是指在數(shù)據(jù)集中偏離其他數(shù)據(jù)點的值。發(fā)現(xiàn)異常值是數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析中的重要步驟。以下是對各選項的分析:
A: 使用均值加減3倍標(biāo)準(zhǔn)差設(shè)置閾值
這是統(tǒng)計學(xué)中常用的一種方法,基于正態(tài)分布的性質(zhì)。對于正態(tài)分布的數(shù)據(jù),約99.7%的數(shù)據(jù)點會落在均值加減3倍標(biāo)準(zhǔn)差的范圍內(nèi)。因此,超出這個范圍的數(shù)據(jù)點可以被視為異常值。這種方法簡單且有效,適用于數(shù)據(jù)呈正態(tài)分布的情況。
B: 梯度下降法
梯度下降法主要用于優(yōu)化問題,特別是在機器學(xué)習(xí)模型訓(xùn)練過程中用于最小化損失函數(shù)。它不是用于發(fā)現(xiàn)異常值的方法。
C: 相關(guān)性分析
相關(guān)性分析用于衡量兩個變量之間的線性關(guān)系。雖然它可以幫助理解數(shù)據(jù)的結(jié)構(gòu)和變量之間的關(guān)系,但它并不是直接用于發(fā)現(xiàn)異常值的方法。
D: 歸一化處理
歸一化處理是數(shù)據(jù)預(yù)處理的一種方法,目的是將數(shù)據(jù)縮放到一個特定范圍(例如0到1)以便于模型訓(xùn)練。歸一化處理本身并不用于發(fā)現(xiàn)異常值,但在某些情況下,它可以幫助減小異常值的影響。
綜上所述,選項A是直接用于發(fā)現(xiàn)異常值的方法,因此正確答案是A。