k越大, bias越小, 訓(xùn)練時(shí)間越長. 在訓(xùn)練時(shí), 也要考慮數(shù)據(jù)集間方差差別不大的原則. 比如, 對于二類分類問題, 使用2-折交叉驗(yàn)證, 如果測試集里的數(shù)據(jù)都是A類的, 而訓(xùn)練集中數(shù)據(jù)都是B類的, 顯然, 測試效果會(huì)很差.
正確答案是:D: 以上所有。
以下是對各選項(xiàng)的專業(yè)分析:
- **A: k越大, 不一定越好, 選擇大的k會(huì)加大評(píng)估時(shí)間**
- 解析:當(dāng)k增加時(shí),會(huì)使得每一個(gè)驗(yàn)證的數(shù)據(jù)集變小,但每個(gè)模型需要訓(xùn)練的次數(shù)增多。雖然增加k可能會(huì)提供更穩(wěn)定的估計(jì),但同時(shí)也顯著增加了計(jì)算時(shí)間和資源消耗。因此,選擇過大的k確實(shí)會(huì)加大評(píng)估時(shí)間。
- **B: 選擇更大的k, 就會(huì)有更小的bias (因?yàn)橛?xùn)練集更加接近總數(shù)據(jù)集)**
- 解析:隨著k的增加,每次訓(xùn)練模型的訓(xùn)練集規(guī)模就會(huì)增大,接近于完整的數(shù)據(jù)集,這通常會(huì)導(dǎo)致偏差(bias)的降低,因?yàn)槟P陀?xùn)練會(huì)更全面。然而,雖然bias可能減小,方差可能會(huì)增加,因?yàn)槊總€(gè)驗(yàn)證集變小。
- **C: 在選擇k時(shí), 要最小化數(shù)據(jù)集之間的方差**
- 解析:在k折交叉驗(yàn)證中,目標(biāo)是選擇一個(gè)合適的k,使得在各折之間評(píng)估指標(biāo)的方差盡量小,這樣可以確保模型的評(píng)估結(jié)果更具穩(wěn)定性和可靠性。
因此,結(jié)合各個(gè)選項(xiàng)的解析,正確的答案是D:以上所有。選擇k時(shí)需要在評(píng)估時(shí)間、bias和方差之間進(jìn)行權(quán)衡,以滿足特定的模型訓(xùn)練需求和計(jì)算資源限制。