天堂网资源www,我们的2018在线观看免费高清,午夜免费视频

備考刷題，請到

CDA認證小程序

在進行數(shù)據(jù)分析時，經(jīng)常要分割訓(xùn)練集、測試集，并且還要考慮數(shù)據(jù)預(yù)處理、特征抽取、特征工程等，那么要仔細分析這些步驟之間的相互聯(lián)系。關(guān)于訓(xùn)練集、測試集、數(shù)據(jù)預(yù)處理、特征工程，請回答以下問題：（3）建模中對數(shù)據(jù)中的某變量x做了z標準化，那么在模型實際上線后，怎么對x做標準化處理？

A. 使用訓(xùn)練數(shù)據(jù)集的均值和方差

B. 使用測試數(shù)據(jù)集的均值和方差

C. 使用驗證數(shù)據(jù)集的均值和方差

D. 使用全部數(shù)據(jù)集的均值和方差

上一題

下一題

點贊

評論

題目解析

題目評論(0)

還是從訓(xùn)練集和測試集的定義、界限劃分理解。

在建模過程中，如果對某變量 \( x \) 進行了 z 標準化處理，那么在模型上線后也需要對新輸入的數(shù)據(jù)進行相同的標準化處理。z 標準化的公式為：

\[ z = \frac{x - \mu}{\sigma} \]

其中，\( \mu \) 是均值，\( \sigma \) 是標準差。

為了確保模型在上線后對新數(shù)據(jù)的處理與訓(xùn)練時一致，應(yīng)該使用訓(xùn)練數(shù)據(jù)集的均值和方差來進行標準化。這是因為模型在訓(xùn)練過程中已經(jīng)基于訓(xùn)練數(shù)據(jù)集的均值和方差進行了學(xué)習(xí)，如果上線后使用不同的數(shù)據(jù)集的均值和方差，可能會導(dǎo)致數(shù)據(jù)分布不一致，從而影響模型的表現(xiàn)。

因此，正確答案是：A: 使用訓(xùn)練數(shù)據(jù)集的均值和方差

### 專業(yè)分析：
1. **一致性**：使用訓(xùn)練數(shù)據(jù)集的均值和方差可以確保新數(shù)據(jù)的標準化處理與模型訓(xùn)練時的處理一致，保證了數(shù)據(jù)分布的一致性。
2. **避免數(shù)據(jù)泄露**：在實際應(yīng)用中，測試數(shù)據(jù)集和驗證數(shù)據(jù)集的均值和方差不能用于模型訓(xùn)練階段的標準化處理，以避免數(shù)據(jù)泄露的問題。
3. **模型的泛化能力**：使用訓(xùn)練數(shù)據(jù)集的均值和方差可以更好地評估模型的泛化能力，因為測試數(shù)據(jù)集和驗證數(shù)據(jù)集的均值和方差可能會引入偏差，影響模型的評估結(jié)果。

總結(jié)，使用訓(xùn)練數(shù)據(jù)集的均值和方差進行標準化處理是確保模型在訓(xùn)練和上線過程中保持一致性和準確性的關(guān)鍵步驟。

午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽