色www永久免费视频,天堂网在线最新版www资源

備考刷題，請到

CDA認(rèn)證小程序

下面關(guān)于注意力機制的描述中，正確的是：

A. 與Encoder-Decoder相比，注意力模型中編碼器將輸入信息編碼成一個向量

B. 在計算權(quán)重值時，與當(dāng)前詞越近，影響因子越大，權(quán)重值越大

C. Hard Attention會選擇整個編碼器的輸出做為其輸入，而Soft Attention則相反

D. 目前研究更傾向于使用Hard Attention，因為其可以直接求導(dǎo)，進行梯度反向傳播

上一題

下一題

點贊

評論

題目解析

題目評論(0)

關(guān)于注意力機制的描述，正確的選項是：B。

以下是對各個選項的分析：

A: 與Encoder-Decoder相比，注意力模型中編碼器將輸入信息編碼成一個向量。
- 這是不正確的。在傳統(tǒng)的Encoder-Decoder模型中，編碼器將輸入信息編碼成一個固定長度的上下文向量，這個向量被傳遞給解碼器。而注意力機制的引入正是為了克服這一限制，通過動態(tài)地為解碼器的每一步生成不同的上下文向量。

B: 在計算權(quán)重值時，與當(dāng)前詞越近，影響因子越大，權(quán)重值越大。
- 這是正確的。在注意力機制中，通常計算上下文向量時會根據(jù)輸入序列中每個位置的權(quán)重進行加權(quán)求和。與當(dāng)前解碼位置相關(guān)性越高的輸入位置通常會被分配更大的權(quán)重，這在某些實現(xiàn)中可能與距離有關(guān)，但不一定總是如此，因為權(quán)重的計算是基于內(nèi)容相似度而非物理距離。

C: Hard Attention會選擇整個編碼器的輸出作為其輸入，而Soft Attention則相反。
- 這是不正確的。Soft Attention是指對所有位置的編碼器輸出進行加權(quán)求和，生成一個上下文向量，而Hard Attention是指選擇一個具體的位置進行處理，通常涉及采樣，Hard Attention是非確定性的。

D: 目前研究更傾向于使用Hard Attention，因為其可以直接求導(dǎo)，進行梯度反向傳播。
- 這是不正確的。實際上，Soft Attention更為常用，因為它是可微的，可以通過標(biāo)準(zhǔn)的反向傳播進行訓(xùn)練。而Hard Attention由于涉及非確定性選擇，通常需要使用強化學(xué)習(xí)或其他方法進行訓(xùn)練，反而更難以直接求導(dǎo)。

因此，正確的選項是B。

^{<blockquote id="knht0"><i id="knht0"></i></blockquote>}

午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽