午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

考試報(bào)名
考試報(bào)名
考試內(nèi)容
考試大綱
在線客服
返回頂部

備考刷題,請(qǐng)到

CDA認(rèn)證小程序

由于競(jìng)爭(zhēng)加劇,某電信公司用戶(hù)流失情況日趨嚴(yán)重,為了更好的預(yù)測(cè)用戶(hù)的未來(lái)流失的可能性,數(shù)據(jù)分析團(tuán)隊(duì)準(zhǔn)備建立客戶(hù)流失的預(yù)測(cè)模型,用于提前了解用戶(hù)流失的傾向,進(jìn)行提前挽留和客戶(hù)關(guān)懷,結(jié)合客戶(hù)流失建模過(guò)程中的具體問(wèn)題,請(qǐng)回答以下2道題目。 (2)以下關(guān)于數(shù)據(jù)診斷清洗的說(shuō)法哪些是正確的:
A. 數(shù)據(jù)在人工輸入時(shí)是會(huì)出現(xiàn)數(shù)據(jù)錯(cuò)誤,比如年齡,性別等數(shù)據(jù)項(xiàng)
B. python數(shù)據(jù)清洗中,對(duì)于二分類(lèi)的分類(lèi)變量0-1數(shù)值化后可以不用再做get_dummies處理,同理多分類(lèi)變量也只需數(shù)值化即可
C. 數(shù)據(jù)誤差不會(huì)影響模型建立的準(zhǔn)確性,因?yàn)轭A(yù)測(cè)是概率性的
D. 線性回歸建模,一般不用關(guān)注異常值
上一題
下一題
收藏
點(diǎn)贊
評(píng)論
題目解析
題目評(píng)論(0)

多分類(lèi)變量需要做啞變量轉(zhuǎn)換。數(shù)據(jù)誤差當(dāng)然會(huì)影響準(zhǔn)確性。線性回歸很容易受到異常值的影響

關(guān)于數(shù)據(jù)診斷清洗的說(shuō)法,以下是正確的分析:

A: 數(shù)據(jù)在人工輸入時(shí)是會(huì)出現(xiàn)數(shù)據(jù)錯(cuò)誤,比如年齡,性別等數(shù)據(jù)項(xiàng)。
- **正確**。人工輸入數(shù)據(jù)時(shí)確實(shí)可能會(huì)出現(xiàn)錯(cuò)誤,例如年齡輸入超出合理范圍、性別輸入錯(cuò)誤等。這些錯(cuò)誤需要在數(shù)據(jù)清洗過(guò)程中進(jìn)行檢查和糾正。

B: python數(shù)據(jù)清洗中,對(duì)于二分類(lèi)的分類(lèi)變量0-1數(shù)值化后可以不用再做get_dummies處理,同理多分類(lèi)變量也只需數(shù)值化即可。
- **不正確**。對(duì)于二分類(lèi)變量,確實(shí)可以使用0和1進(jìn)行編碼,不需要額外的處理。但是對(duì)于多分類(lèi)變量,直接數(shù)值化(如將類(lèi)別1編碼為1,類(lèi)別2編碼為2,類(lèi)別3編碼為3等)是不合適的,因?yàn)檫@樣會(huì)引入虛假的順序關(guān)系。正確的做法是使用`get_dummies`或其他方法進(jìn)行獨(dú)熱編碼(one-hot encoding)。

C: 數(shù)據(jù)誤差不會(huì)影響模型建立的準(zhǔn)確性,因?yàn)轭A(yù)測(cè)是概率性的。
- **不正確**。數(shù)據(jù)誤差會(huì)影響模型的準(zhǔn)確性。無(wú)論預(yù)測(cè)是否是概率性的,數(shù)據(jù)中的誤差和噪聲都會(huì)影響模型的訓(xùn)練效果,導(dǎo)致模型的預(yù)測(cè)能力下降。因此,數(shù)據(jù)清洗是非常重要的步驟。

D: 線性回歸建模,一般不用關(guān)注異常值。
- **不正確**。線性回歸對(duì)異常值非常敏感,異常值會(huì)對(duì)模型的擬合產(chǎn)生很大影響。異常值可能會(huì)導(dǎo)致模型的系數(shù)估計(jì)偏離,影響模型的預(yù)測(cè)性能。因此,在線性回歸建模過(guò)程中,識(shí)別和處理異常值是必要的。

綜合分析,正確的答案是:

A: 數(shù)據(jù)在人工輸入時(shí)是會(huì)出現(xiàn)數(shù)據(jù)錯(cuò)誤,比如年齡,性別等數(shù)據(jù)項(xiàng)。