在數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)中,主要涉及以下幾大類問(wèn)題:
1. **分類 (A)**:
- 分類問(wèn)題是指通過(guò)使用已知類別的訓(xùn)練數(shù)據(jù)集構(gòu)建模型,以便對(duì)新數(shù)據(jù)進(jìn)行分類。經(jīng)典的例子包括垃圾郵件檢測(cè)(郵件是垃圾郵件還是正常郵件)和圖像分類(識(shí)別圖片中的物體類型)。
2. **回歸 (B)**:
- 回歸問(wèn)題的目標(biāo)是預(yù)測(cè)一個(gè)連續(xù)值。常見(jiàn)的例子包括房?jī)r(jià)預(yù)測(cè)(根據(jù)房屋特征預(yù)測(cè)其價(jià)格)和股票市場(chǎng)預(yù)測(cè)(根據(jù)市場(chǎng)歷史數(shù)據(jù)預(yù)測(cè)未來(lái)股票價(jià)格)。
因此,A: 分類 和 B: 回歸 是數(shù)據(jù)挖掘中典型的預(yù)測(cè)建模任務(wù)。
**聚類 (C)** 和 **關(guān)聯(lián)規(guī)則挖掘 (D)** 則主要屬于描述性建模任務(wù):
- **聚類 (C)**:
- 聚類是將數(shù)據(jù)分組,使得同一組中的數(shù)據(jù)點(diǎn)在某種程度上相似。常用于市場(chǎng)細(xì)分、天文數(shù)據(jù)分析等領(lǐng)域。雖然可以用于預(yù)處理或特征工程,但其本身不屬于預(yù)測(cè)建模任務(wù)。
- **關(guān)聯(lián)規(guī)則挖掘 (D)**:
- 關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)數(shù)據(jù)集中變量之間的有趣關(guān)系,如超市購(gòu)物籃分析中的“啤酒和尿布”現(xiàn)象。這也是一種描述性任務(wù),而非預(yù)測(cè)性。
總結(jié):預(yù)測(cè)建模任務(wù)主要包括 A: 分類 和 B: 回歸。