使用sklearn中的classification_report輸出分類報(bào)告時(shí),橫坐標(biāo)應(yīng)為數(shù)據(jù)的真實(shí)標(biāo)簽,縱坐標(biāo)為數(shù)據(jù)的預(yù)測標(biāo)簽,故選C。
正確答案是C: `classification_report(data['是否違約'], Y_hat)`
**專業(yè)分析:**
在使用 `sklearn` 中的 `classification_report` 函數(shù)時(shí),函數(shù)的參數(shù)需要傳入真實(shí)標(biāo)簽和預(yù)測標(biāo)簽。具體來說:
1. `data['是否違約']` 是數(shù)據(jù)集中客戶是否違約的真實(shí)標(biāo)簽。
2. `Y_hat` 是基于邏輯回歸模型 `model` 和判斷閾值 0.5 得到的預(yù)測標(biāo)簽。
`classification_report` 的作用是生成分類任務(wù)的主要指標(biāo),包括精確率(precision)、召回率(recall)、F1-score 等,用來評估分類模型的性能。因此,正確的調(diào)用方式是將真實(shí)標(biāo)簽和預(yù)測標(biāo)簽傳入 `classification_report` 函數(shù)。
分析各個(gè)選項(xiàng):
A: `classification_report(data['是否違約'], p)` - 錯(cuò)誤。`p` 是預(yù)測的概率值,而不是標(biāo)簽。`classification_report` 需要的是標(biāo)簽而不是概率。
B: `classification_report(p, data['是否違約'])` - 錯(cuò)誤。同樣地,`p` 是概率值,不是標(biāo)簽。
C: `classification_report(data['是否違約'], Y_hat)` - 正確。`data['是否違約']` 是真實(shí)標(biāo)簽,`Y_hat` 是預(yù)測標(biāo)簽。
D: `classification_report(Y_hat, data['是否違約'])` - 錯(cuò)誤。參數(shù)順序不對,`classification_report` 的第一個(gè)參數(shù)應(yīng)為真實(shí)標(biāo)簽,第二個(gè)參數(shù)應(yīng)為預(yù)測標(biāo)簽。
因此,正確答案是C。