入I
depe
de
ts;根据偏相关系数,在Method下拉框中选择E
ter选项,使其他选项框为默认值。(2)单击Statistics按钮,弹出“线性回归统计量”窗口,选中复选框Estimates、Modelfit和Colli
earitydiag
ostics,单击co
ti
ue返回Li
earRegressio
对话框。
5
f(3)单击OK,得到结果如图610所示。
VariablesE
teredRemovedb
Model1
Variables
E
tered家庭人口(人)年收入a(元)
VariablesRemoved
Method
E
ter
aAllrequestedvariablese
tered
bDepe
de
tVariable消费金额(元)
图6变量进入情况
ModelSummary
AdjustedStdErrorof
ModelRRSquareRSquarteheEstimate
1
909a826
818398091
aPredictorsCo
sta
t家庭人口(人)年收入(元)
图7模型模拟合度检验
ANOVbA
Sumof
Model
Squares
1
Regr3e5s2s5io0
756
dfMea
SquareF17262537784111218
Sig000a
Residu7a4l48393
41758476450
Total42699149
49
aPredictorsCo
sta
t家庭人口(人)年收入(元)
bDepe
de
tVariable消费金额(元)
图8方差分析表
Coefficiea
ts
U
sta
dardSitzae
ddardizedCoefficie
Ctsoefficie
ts
Colli
earityStatistics
Model
BStdErrorBeta
t
1
Co
1s3t0a4
t901597655
6602
年收入(0元33)004
5168350
家庭人356口2(963人32)01
66410732
SigTolera
ceVIF00000097010310009701031
aDepe
de
tVariable消费金额(元)
图9回归分析结果
6
fColli
earityDiag
oastics
Varia
ceProportio
s
Co
ditio
年收入家庭人口
ModelDime
sEioig
e
valueI
dexCo
sta
t(元)(人)
1
1
28101000
01
01
02
2
1414469
05
17
93
3
0497568
94
82
05
aDepe
de
tVariable消费金额(元)
图10共线性检验
(1)根据相关分析结果,认为信用卡消费金额与家庭人口、年收入相关性高,所以采用所有变量强行进入模型的方法。
(2)对模型模拟合度进行检验,进入模型的变量其调整的决定系数(AdjustedRSquare)为0818。可见模型的拟合效果很理想。
(3)对模型进行方差分析。回归模型的Sig值为0,说明该模型有显著的统计意义。
(4)对模型的回归分析结果和共线性检验结果可知,未标准化时本例的拟合结果为:
Y13049050033x1356296x2常数项和自变量系数的Sig值为0,模型中不存在共线问题。检验结果是显著的。该模型的拟合程度很高,可以用来预测。
4结果分析
回归分析在数据挖掘中主要有预测和控制两大功能,通过对已知训练数据进行回归分析的出经验公式,利用经验公式就可以在已知变量的情况下,预测因变量的取值。实际问题中往往是根据预测结果来进行控制调整。
本案例中,根据50为消费者的年收入、家庭人口r