全球旧事资料 分类
不像线性回归模型中的决定系数那么大。
表8Classificatio
Tablea
Step1
Observed是否患冠心病
未患病患病
Predicted
是否患冠心病
未患病
患病
Perce
tageCorrect
25
12
676
10
31
756
OverallPerce
tage
718
aThecutvalueis500
这是应用引入三个自变量后重新拟合的回归模型进行预测的分类表格,P05判断为出现阳性结果。可见已经出现了被预测为未患病的研究对象,此处78例研究对象中共有56
(2531)例判断正确,总正确率为5678=718,如表8所示。
表9输出了模型中各自变量的偏回归系数及其标准误、Wald2、自由度、P值,及OR
值(即表格最右侧的ExpB)。由此可以得出结论,男性(sex1)较女性更容易患冠心病、
7
f心电图异常程度越高,越容易被诊断为冠心病,年龄越大的越容易患冠心病。由于年龄不可能为0,这也超出了样本所观察的自变量age取值范围,因此这里的常数项无实际意义。
表9Variablesi
theEquatio

B
SE
Wald
df
Sig
ExpB
Step1asex
1356
546
6162
1
013
3882
ecg
873
384
5162
1
023
2395
age
093
035
7000
1
008
1097
Co
sta
t
5642
1806
9757
1
002
004
aVariablese
teredo
step1sexecgage
到此为止,可建立如下Logistic回归方程:
Pyexp56421356sex0873ecg0093age1exp56421356sex0873ecg0093age
或LogitP56421356sex0873ecg0093age
第二节分类自变量的定义与比较方法
一、使用哑变量的必要性在回归模型中,回归系数b表示其他自变量不变,x每改变一个单位时,所预测的y的平
均变化量,当x为连续性变量时这样解释没有问题,二分类变量由于只存在两个类别间的比较,也可以对系数得到很好的解释,但是当x为多分类变量时拟合一个回归系数就不太合适了,此时需要使用哑变量(DummyVariable)方式对模型加以定义,为说明该问题,先引入下面的一个实例。
例2Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素。结果变量为是否娩出低出生体重儿(变量名为LOW,1为低出生体重,即婴儿出生体重2500g,0为非低出生体重),考虑的影响(自变量)有:产妇妊娠前体重(1wt,磅)、产妇年龄(age,岁)、产妇在妊娠期间是否吸烟(smoke,0=未吸、1=吸烟)、本次妊娠前早产次数(ptl,次)、是否患有高血压(ht,0=未患,1=患病)、子宫对按摩、催产素等刺激引起收缩的应激性(ui,0=无、1=有)、妊娠前三个月社区医生随访次数(ftv,次)、种族(race,1=白人,2=黑人,3=其他民族)。
本例包含的自变量种类齐全,有连续性变量、二分类、无序多分类变量。SPSS默认将所有的自变量均视作连续性r
好听全球资料 返回顶部