A選項(xiàng)是正確的,序列模式發(fā)現(xiàn)的任務(wù)是找出支持度大于或等于用戶指定的最小支持度閾值的所有序列。B選項(xiàng)是正確的,候選序列的個(gè)數(shù)通常比候選項(xiàng)集的個(gè)數(shù)大,因?yàn)樾蛄心J降拈L(zhǎng)度可能比項(xiàng)集模式的長(zhǎng)度更長(zhǎng),所以候選序列的個(gè)數(shù)更多。D選項(xiàng)是正確的,序列的支持度是指包含該序列的所有數(shù)據(jù)序列所占的比例,如果序列的支持度大于或等于用戶指定的閾值,則稱其為序列模式或頻繁序列。C選項(xiàng)是不正確的,序列模式的每個(gè)元素并不一定與一個(gè)時(shí)間窗口相關(guān)聯(lián)。時(shí)間窗口的概念在一些序列模式挖掘算法中被引入,但并不適用于所有序列模式的定義和算法。因此,C選項(xiàng)是不正確的。
問題中涉及序列模式的說法,下列選項(xiàng)不正確的是:
C: 序列模式的每個(gè)元素都與一個(gè)時(shí)間窗口[L,u]相關(guān)聯(lián),其中L是該時(shí)間窗口內(nèi)事件的最晚發(fā)生時(shí)間,而u是該時(shí)間窗口內(nèi)事件的最早發(fā)生時(shí)間。
### 分析:
A: 給定數(shù)據(jù)集D和用戶指定的最小支持度閾值minsup,序列模式發(fā)現(xiàn)的任務(wù)是找出支持度大于或等于minsup的所有序列。
- 這句話是正確的。序列模式挖掘的目標(biāo)就是在給定的支持度閾值minsup下,找出所有支持度大于或等于minsup的序列。
B: 候選序列的個(gè)數(shù)比候選項(xiàng)集的個(gè)數(shù)大的多。
- 這句話也是正確的。由于序列模式不僅考慮項(xiàng)集的組合,還需要考慮順序關(guān)系,因此候選序列的數(shù)量通常比候選項(xiàng)集的數(shù)量多。
C: 序列模式的每個(gè)元素都與一個(gè)時(shí)間窗口[L,u]相關(guān)聯(lián),其中L是該時(shí)間窗口內(nèi)事件的最晚發(fā)生時(shí)間,而u是該時(shí)間窗口內(nèi)事件的最早發(fā)生時(shí)間。
- 這句話是不正確的。通常,時(shí)間窗口的表示是[L, u],其中L是該時(shí)間窗口內(nèi)事件的最早發(fā)生時(shí)間,而u是該時(shí)間窗口內(nèi)事件的最晚發(fā)生時(shí)間。因此,選項(xiàng)C中的描述與常規(guī)的時(shí)間窗口定義不符。
D: 序列s的支持度是包含s的所有數(shù)據(jù)序列所占的比例。如果序列s的支持度大于或等于用戶指定的閾值minsup,則稱s是一個(gè)序列模式(或頻繁序列)。
- 這句話也是正確的。支持度是指包含特定序列的所有數(shù)據(jù)序列在整個(gè)數(shù)據(jù)集中的比例,如果該比例大于或等于minsup,則該序列被認(rèn)為是頻繁序列。
因此,正確答案是C。