午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

考試報(bào)名
考試報(bào)名
考試內(nèi)容
考試大綱
在線客服
返回頂部

備考刷題,請(qǐng)到

CDA認(rèn)證小程序

下列哪些公式是決策樹用來(lái)挑選字段時(shí)使用的?(多選)
A. Information Gain
B. Gain Ratio
C. Silhouette Coefficient
D. Chi-Square Statistic
上一題
下一題
收藏
點(diǎn)贊
評(píng)論
題目解析
題目評(píng)論(0)

在決策樹模型中,用于選擇最佳分割字段(屬性)的常用算法主要包括 Information Gain 和 Gain Ratio。以下是對(duì)所有選項(xiàng)的分析:

1. **A: Information Gain**
- **正確**。信息增益是一種常用的決策樹分裂標(biāo)準(zhǔn)。它通過(guò)計(jì)算某個(gè)屬性對(duì)數(shù)據(jù)集的不確定性的減少量來(lái)選擇最佳屬性。決策樹算法如 ID3 就是基于信息增益進(jìn)行字段選擇的。

2. **B: Gain Ratio**
- **正確**。增益率是信息增益的一種改進(jìn),通過(guò)對(duì)信息增益進(jìn)行標(biāo)準(zhǔn)化來(lái)避免信息增益傾向于選擇取值較多的字段的偏差。C4.5 決策樹算法就是使用增益率來(lái)選擇字段的。

3. **C: Silhouette Coefficient**
- **錯(cuò)誤**。輪廓系數(shù)主要用于評(píng)估聚類效果,衡量數(shù)據(jù)在聚類分析中的分布質(zhì)量,與決策樹字段選擇無(wú)關(guān)。

4. **D: Chi-Square Statistic**
- **錯(cuò)誤**(部分正確)??ǚ綑z驗(yàn)常用于統(tǒng)計(jì)分析中,用于判斷兩個(gè)分類變量之間的獨(dú)立性。在某些決策樹變體(如 CART 中的分類樹)中可以用于屬性選擇,但并不是最廣泛使用的標(biāo)準(zhǔn)。

綜上所述,選擇 A 和 B 作為決策樹用來(lái)挑選字段的公式。