日韩中文字幕在线一区二区三区 ,香蕉久久av一区二区三区,无码人妻精品一区二区三区66

備考刷題，請(qǐng)到

CDA認(rèn)證小程序

下列哪些公式是決策樹用來(lái)挑選字段時(shí)使用的？（多選）

A. Information Gain

B. Gain Ratio

C. Silhouette Coefficient

D. Chi-Square Statistic

上一題

下一題

點(diǎn)贊

評(píng)論

題目解析

題目評(píng)論(0)

在決策樹模型中，用于選擇最佳分割字段（屬性）的常用算法主要包括 Information Gain 和 Gain Ratio。以下是對(duì)所有選項(xiàng)的分析：

1. **A: Information Gain**
- **正確**。信息增益是一種常用的決策樹分裂標(biāo)準(zhǔn)。它通過(guò)計(jì)算某個(gè)屬性對(duì)數(shù)據(jù)集的不確定性的減少量來(lái)選擇最佳屬性。決策樹算法如 ID3 就是基于信息增益進(jìn)行字段選擇的。

2. **B: Gain Ratio**
- **正確**。增益率是信息增益的一種改進(jìn)，通過(guò)對(duì)信息增益進(jìn)行標(biāo)準(zhǔn)化來(lái)避免信息增益傾向于選擇取值較多的字段的偏差。C4.5 決策樹算法就是使用增益率來(lái)選擇字段的。

3. **C: Silhouette Coefficient**
- **錯(cuò)誤**。輪廓系數(shù)主要用于評(píng)估聚類效果，衡量數(shù)據(jù)在聚類分析中的分布質(zhì)量，與決策樹字段選擇無(wú)關(guān)。

4. **D: Chi-Square Statistic**
- **錯(cuò)誤**（部分正確）?？ǚ綑z驗(yàn)常用于統(tǒng)計(jì)分析中，用于判斷兩個(gè)分類變量之間的獨(dú)立性。在某些決策樹變體（如 CART 中的分類樹）中可以用于屬性選擇，但并不是最廣泛使用的標(biāo)準(zhǔn)。

綜上所述，選擇 A 和 B 作為決策樹用來(lái)挑選字段的公式。

午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽