正確答案是 A, C, D。
分析如下:
A: ds上的操作都作用于其中的每個(gè)RDD上
- 正確。DStream是一個(gè)由連續(xù)的RDD序列組成的抽象。對(duì)DStream的任何操作都會(huì)轉(zhuǎn)換為對(duì)底層RDD的操作。
B: ds.count結(jié)果返回一個(gè)RDD
- 錯(cuò)誤。`ds.count`會(huì)返回一個(gè)新的DStream,其中的每個(gè)RDD包含的是原RDD中元素的計(jì)數(shù)。DStream的操作通常會(huì)返回DStream,而不是單個(gè)RDD。
C: ds.reduceByKey結(jié)果返回一個(gè)DStream類型實(shí)例
- 正確。`reduceByKey`是一個(gè)對(duì)鍵值對(duì)類型的DStream進(jìn)行的操作,返回一個(gè)新的DStream,其中每個(gè)RDD是通過對(duì)原RDD進(jìn)行按鍵聚合得到的。
D: ds中的每個(gè)RDD是一個(gè)批處理時(shí)間間隔內(nèi)SparkStreaming獲取的實(shí)時(shí)數(shù)據(jù)
- 正確。Spark Streaming將實(shí)時(shí)數(shù)據(jù)流分成小批次,每個(gè)批次都作為一個(gè)RDD進(jìn)行處理。因此,DStream中的每個(gè)RDD代表一個(gè)批處理時(shí)間間隔內(nèi)采集到的數(shù)據(jù)。
因此,選項(xiàng) A, C, D 是正確的。