午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

考試報名
考試報名
考試內(nèi)容
考試大綱
在線客服
返回頂部

備考刷題,請到

CDA認證小程序

在文本特征表示方法中,下面說法正確的是:
A. TF-IDF統(tǒng)計當前文檔和語料庫的詞頻來實現(xiàn)特征詞提取和詞之間關系的確認
B. 用戶信息作為特征詞和類別之間的測度,如果特征詞屬于某類,則它們的互信息量最大
C. Glove采用三層神經(jīng)網(wǎng)絡進行訓練,最后一層采用霍夫曼樹(Huffuman)來預測
D. 卡方統(tǒng)計量是基于顯著統(tǒng)計性來選擇特征,所以不會出現(xiàn)低頻詞缺陷
上一題
下一題
收藏
點贊
評論
題目解析
題目評論(0)

在分析選項之前,讓我們首先理解每個選項所涉及的概念:

A. **TF-IDF**:TF-IDF(Term Frequency-Inverse Document Frequency)是一種統(tǒng)計方法,用于評估一個詞在文檔集合或語料庫中的重要程度。TF-IDF考慮的是詞頻(TF)和逆文檔頻率(IDF),用于衡量一個詞在特定文檔中的重要性。它并不關注詞之間關系的確認,而是注重詞在文檔中相對語料庫的權重。

B. **互信息量**:互信息(Mutual Information)是一種用于評估兩個變量之間相互依賴程度的度量。在特征選擇中,互信息可以用來衡量特征詞與類別標簽之間的信息共享程度。一個特征詞如果對某個類別具有高度的信息量,則互信息量較大。

C. **GloVe**:GloVe(Global Vectors for Word Representation)是一種用于獲取詞向量的無監(jiān)督學習算法。GloVe基于全局詞共現(xiàn)矩陣來學習詞向量,而不是通過神經(jīng)網(wǎng)絡和霍夫曼樹來實現(xiàn)。霍夫曼樹通常與Word2Vec中的Skip-gram模型結(jié)合用于負采樣的高效實現(xiàn),而不是GloVe。

D. **卡方統(tǒng)計量**:卡方(Chi-square)是一種用于特征選擇的統(tǒng)計方法,評估特征與類別標簽之間的獨立性。雖然卡方統(tǒng)計量能夠識別出具有統(tǒng)計顯著性的特征,但它并不能完全解決低頻詞的問題,因為低頻詞在統(tǒng)計上可能不顯著。

基于以上分析,正確的說法是:
- **B: 用戶信息作為特征詞和類別之間的測度,如果特征詞屬于某類,則它們的互信息量最大**

此選項準確地描述了互信息在特征選擇中的應用,而其他選項存在一些技術性錯誤或誤解。