在對(duì)數(shù)據(jù)集進(jìn)行聚類時(shí),使用 Mahout 的 `kmeans` 命令所需的參數(shù)解釋如下:
- `-i`:指定輸入文件路徑。
- `-o`:指定輸出目錄。
- `-c`:指定初始聚類中心點(diǎn)文件路徑。
- `-k`:指定聚類的類別數(shù)量。
- `-x`:指定最大迭代次數(shù)。
題目要求:
- 聚類類別數(shù)量 `k` 應(yīng)為 6。
- 迭代次數(shù) `x` 應(yīng)為 7。
分析選項(xiàng):
- **A: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 6 -x 7`**
- 符合要求,其中 `k 6` 是類別數(shù)量,`x 7` 是迭代次數(shù)。
- **B: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7 -x 6`**
- 這選項(xiàng)不符合要求,因?yàn)?`k` 為 7,且 `x` 為 6。
- **C: `mahout kmenas -i input/part-m-0000 -o output -c clusters -x 6`**
- 缺少 `-k` 參數(shù),未指定類別數(shù)量。
- **D: `mahout kmenas -i input/part-m-0000 -o output -c clusters - k 7`**
- 缺少 `-x` 參數(shù),且 `k` 為 7,不符合要求。
綜上所述,選項(xiàng) A 是正確的聚類語(yǔ)句。