正確答案是:C: Spark采用MPP架構(gòu),并發(fā)處理。
分析:
A: Spark 支持DAG(有向無環(huán)圖),這是Spark比Hadoop MapReduce更高效的一個重要原因。DAG允許更復(fù)雜的計算流程,可以優(yōu)化執(zhí)行計劃,提高計算效率。
B: Spark中間數(shù)據(jù)不存儲磁盤,進行緩存處理。Spark通過內(nèi)存計算來提高速度,避免了Hadoop MapReduce頻繁的磁盤讀寫操作,這顯著提升了計算效率。
C: Spark采用MPP架構(gòu),并發(fā)處理。這并不是Spark比Hadoop MapReduce更高效的主要原因。MPP(大規(guī)模并行處理)是一種數(shù)據(jù)庫技術(shù),雖然Spark確實支持并行計算,但其高效性主要來自于其他特性。
D: 高度抽象API。Spark提供了高度抽象的API,如DataFrame和Dataset,這使得開發(fā)人員可以更簡單高效地編寫復(fù)雜的處理邏輯,提高了開發(fā)效率和程序執(zhí)行效率。
因此,C選項不包含在Spark比Hadoop MapReduce更高效的主要原因中。