Logistic回归分析
二分类(因变量Y有(如发病1与未发病0)两种可能出现的结果)资料的Logistic回归分析,至于多分类Logistic回归分析,与二分类操作过程类似,只是在数据编制及分析方法选择处不同。分析的一般步骤:变量的编码哑变量的设置和引入各个自变量的单因素分析变量的筛选交互作用的引入建立多个模型选择较优的模型模型应用条件的评价输出结果的解释
实例操作111某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析。
1各变量及其赋值说明
x1:确诊时患者的年龄岁x2:肾细胞癌血管内皮生长因子VEGF,其阳性表述由低到高共3个等级(13)x3:肾细胞癌组织内微血管数MVCx4:肾癌细胞核组织学分级,由低到高共4级(14)x5:肾细胞癌分期,由低到高共4期(14)y:肾细胞癌转移情况有转移y1无转移y0。为二分类变量。
若作单因素的Logistic回归分析,也就是分别作Y与各自变量间的回归分析,如Y与X1、Y与X2等的单因素Logistic回归分析。2建立数据库
f3分析步骤(1)
f(2)
f上图中若为单因素回归分析,只需在Covariates协变量框内导入单一自变量如X1即可。(3)
4分析结果(1)数据描述
CaseProcessi
gSummary
U
weightedCasesa
N
Perce
t
SelectedCases
I
cludedi
A
alysis
26
1000
Missi
gCases
0
0
U
selectedCasesTotal
Total
26
1000
0
0
26
1000
aIfweightisi
effectseeclassificatio
tableforthetotal
umberofcases
Depe
de
tVariableE
codi
g
Origi
alValue无转移转移
I
ter
alValue01
(2)Block1MethodForwardStepwiseLikelihoodRatio
fOm
ibusTestsofModelCoefficie
ts
Chisquare
df
Sig
Step1
Step
15538
1
000
Block
15538
1
000
Model
15538
1
000
Step2
Step
6178
1
013
Block
21716
2
000
Model
21716
2
000
表示两步变量的引入均有统计学意义,方法合理。
ModelSummary
Step
2Loglikelihood
CoxS
ellRSquare
NagelkerkeRSquare
1
18004a
450
621
2
11826b
566
781
aEstimatio
termi
atedatiteratio
umber6becauseparameterestimatescha
gedbylesstha
001bEstimatio
termi
atedatiteratio
umber7becauseparameterestimatescha
gedbylesstha
001
可见第二步比第一步变量引入后决定系数有所增加,表明第二步变量引入后模型
的拟合效果更好。
(3)
Classificatio
Tablea
Predicted肾细胞癌转移情况
Step1
Observed肾细胞癌转移情况
Step2
OverallPerce
tage肾细胞癌转移情况
OverallPerce
tage
无转移转移
无转移转移
无转移152
160
转移
Perce
tageCorrect
2
882
7
778r