检验p值
0000176
总平方和
8798294
回归平方和
7754112
残差平方和
1044181
序号常数项家庭年收入x
表216分组Logistic回归系数检验
均值
回归系数系数标准误t统计量
2837815084888201135787473994
14901140014932300207117209865
自由度df77
表217XTX1
0086479001451700145170002876
检验P值00000560000056
本例Logistic模型的回归方程:
pi
x084888201493231eex08488820149323
对于多分类无序自变量的Logistic回归,即某个自变量为m个水平的名义变量(如治疗方法ABC),只需要引入m1(2个)个哑变量,然后采用上述方法进行分析。
例213研究三种治疗方法对不同性别病人的治疗效果2,数据如表214
f表214性别和治疗法对某病治愈情况的影响
性别治疗方法有效mi无效总例数
i
A
男
B
C
A
女
B
C
78
28
106
101
11
112
68
46
114
40
5
45
54
5
59
34
6
40
由于治疗方法有三种,没有等级关系,所以属于无序的名义变量,故引入两个哑变量x2x3分别代表
A和B疗法,其中x21x30表示方法Ax20x31表示方法Bx20x30表示方法C,将
上述数据转化成标准格式,得表215。表215性别和治疗法对某病治愈情况的影响
性别x1
x2
x3有效mi总例数
i
1
1
0
78
106
1
0
1
101
112
1
0
0
68
114
0
1
0
40
45
0
0
1
54
59
0
0
0
34
40
对于分类数据,也可以采用极大似然法进行参数估计,具体见22节最后部分内容。
22两分类未分组连续非条件Logistic回归
应变量y取值为0和1,设事件发生记为y1,否则为0,设自变量xx1x2xkT,
组观测数
据记为xi1xi2xikyii12
。记Xi1xi1xi2xikT,xi01,则yi与xi1xi2xik的
Logistic回归模型是:
Eyii
f0
1xi1
e01xi1kxikkxik1e01xi1kxik
eTXi
1eTXi
(10)
易知,yi是均值为i的01型分布,其分布律为
fyiiyi1i1yi,yi01i12
则y1y2y
的似然函数和对数似然函数分别为:
Liyi1i1yii1
fl
L
yi
i1
l
i
1
yil
1i
yi
i1
l
i1i
l
1i
代入
01xi1kxik
1eei
01xi1kxik得
l
L
yi01xi1kxikl
1e01xi1kxiki1
yiTXil
1eTXii1
(11)
记LLl
L,选取01kT的估计01kT使得LL达到极大,
这就是Logistic回归模型的极大似然估计,该过程的求解需要采用牛顿迭代法。
构造得分函数
Fg
LLg
g
012
k
,共
k1
个非线性方程组,令其0
求解
,其中
Fg
yixig
i0
xigeTXi1eTXi
g
012k
12
构造信息矩阵
I
gh
r