本題考查調(diào)查問卷的設(shè)計(jì)。題目中要求從方便數(shù)據(jù)處理的角度出發(fā),則采用二分變量的方式會(huì)極為方便地提升數(shù)據(jù)處理效率。尤其是題目中是需要收集用戶是否購(gòu)買指定產(chǎn)品,只需要二分變量為是或否,將會(huì)更方便統(tǒng)計(jì)數(shù)據(jù)。因此本題選D。
正確答案是D: 需要編碼為二分變量。
專業(yè)分析:
在調(diào)查中,收集用戶“是否購(gòu)買過(guò)指定產(chǎn)品”的數(shù)據(jù)實(shí)際上是一個(gè)典型的二分類問題。用戶的回答只有兩種可能:“是”或者“否”。為了方便數(shù)據(jù)處理,尤其是在統(tǒng)計(jì)分析和建模過(guò)程中,通常將這種二分類數(shù)據(jù)編碼為二分變量。
編碼為二分變量的優(yōu)勢(shì)包括:
1. **簡(jiǎn)潔性**:二分變量只有兩個(gè)取值,如0和1,便于存儲(chǔ)和處理。
2. **計(jì)算效率**:在統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)模型中,二分變量可以直接用于邏輯回歸、決策樹等算法,計(jì)算效率高。
3. **易于解釋**:二分變量的含義明確,0和1可以分別表示“否”和“是”,容易理解和解釋。
其他選項(xiàng)的分析:
A: 編碼為數(shù)值變量不適合,因?yàn)閿?shù)值變量通常用于表示連續(xù)數(shù)值,而“是否購(gòu)買過(guò)”是一個(gè)離散的二分類問題。
B: 編碼為字符變量雖然可以,但在數(shù)據(jù)處理和建模時(shí)不如二分變量方便,字符變量需要額外的處理步驟如轉(zhuǎn)換為數(shù)值。
C: 編碼為多分類變量也不適合,因?yàn)槎喾诸愖兞坑糜诒硎径嘤趦蓚€(gè)類別的情況,而“是否購(gòu)買過(guò)”只有兩個(gè)類別。
因此,從方便數(shù)據(jù)處理的角度出發(fā),最適宜的方法是將“是否購(gòu)買過(guò)指定產(chǎn)品”編碼為二分變量。