Boostrap方法是傳統(tǒng)地隨機(jī)抽樣,驗(yàn)證一次的驗(yàn)證方法,只需要訓(xùn)練1次模型,所以時(shí)間最少。留一個(gè)測(cè)試樣本的交叉驗(yàn)證,需要n次訓(xùn)練過程(n是樣本個(gè)數(shù)),這里,要訓(xùn)練1000個(gè)模型。5折交叉驗(yàn)證需要訓(xùn)練5個(gè)模型。重復(fù)2次的5折交叉驗(yàn)證,需要訓(xùn)練10個(gè)模型。
為了判斷這些交叉驗(yàn)證方法在樣本數(shù)為1000時(shí)的執(zhí)行時(shí)間順序,我們需要先了解每種方法的基本操作以及計(jì)算成本:
1. **Bootstrap方法(有放回重采樣)**:
- 從1000個(gè)樣本中有放回地隨機(jī)抽取樣本形成新的樣本集,這樣的過程重復(fù)多次(通常幾十到幾百次)。
- 計(jì)算成本較高,因?yàn)槊看尾蓸佣夹枰?xùn)練模型,重復(fù)次數(shù)較多。
2. **留一法交叉驗(yàn)證(Leave-One-Out Cross-Validation, LOOCV)**:
- 每次將一個(gè)樣本作為驗(yàn)證集,其余樣本作為訓(xùn)練集,重復(fù)1000次。
- 計(jì)算成本很高,因?yàn)樾枰?xùn)練1000次模型。
3. **5折交叉驗(yàn)證**:
- 將數(shù)據(jù)分成5份,每次用1份作為驗(yàn)證集,剩余4份作為訓(xùn)練集,重復(fù)5次。
- 計(jì)算成本相對(duì)較低,因?yàn)橹恍枰?xùn)練5次模型。
4. **重復(fù)兩次的5折交叉驗(yàn)證**:
- 在5折交叉驗(yàn)證的基礎(chǔ)上重復(fù)2次,總共需要訓(xùn)練模型10次。
- 比單次5折交叉驗(yàn)證稍高,但仍比留一法和Bootstrap方法低。
**分析執(zhí)行時(shí)間的順序**:
- **最耗時(shí)**的是留一法交叉驗(yàn)證(ii),因?yàn)樾枰?xùn)練1000次。
- **其次耗時(shí)**的是Bootstrap方法(i),雖然具體次數(shù)取決于設(shè)置,但通常在幾十到幾百次之間。
- **接下來耗時(shí)**的是重復(fù)兩次的5折交叉驗(yàn)證(iv),總共需要訓(xùn)練10次。
- **最不耗時(shí)**的是普通的5折交叉驗(yàn)證(iii),只需訓(xùn)練5次。
因此,執(zhí)行時(shí)間順序?yàn)椋篿i > i > iv > iii。
正確答案是:**D: ii > iii > iv > i**。
但根據(jù)我們的分析,似乎選項(xiàng)的描述存在問題。應(yīng)該是:
實(shí)際正確順序:ii > i > iv > iii