据的标准格式
表211改造表
表212改造表
序年家庭收入号X万元
1
15
2
25
3
35
4
45
5
55
6
65
7
75
8
85
9
95
实际购买
人数mi
81326222022161210
签订意向
总人数
i
253258524339282115
序治疗分年龄分有效例观察例
号组x1
组x2
数mi
数
i
1
1
1
32
50
2
1
0
40
60
3
0
1
21
52
4
0
0
18
58
经过改造后,可得我们关心的事件的发生的频率为
pi
该组发生事件数该组总例数
i
mi
i
12
。其中
f为分组数,然后作Logit变换,即pi
Logit
pi
l
1
pipi
。变换后的数据,形式上已经可以采用一般
的线性回归的处理方式来估计回归参数了。此时方程变为:pi0kjxiji12
j1
当然这样处理并没有解决异方差性,当
i较大时,pi的近似方差为:
Dpi
ii
11i
iEyi
(7)
所以选择权重i
ipi1pii12
,最后采用加权最小二乘法估计参数。
注意,分组数据的Logistic回归只适用于大样本分组数据,对小样本的为分组数据不适用,并且以组
数
为回归拟合的样本量,明显降低了拟合精度,在实际应用中必须谨慎。
求解算法及步骤:
1.依据分组数据的标准格式,计算频率pi、Logit变换pi和权重i
2.构建加权最小二乘估计:
k
k
mi
iyi0jxij2mi
iyii0ijxij2
i1
j1
i1
j1
(8)
令yi
i
yi,
X
i
i
ixi1
ixikT,01kT
则方程又变成一般的线性回归模型:mi
yi
T
X
i
2
i1
(9)
3.构造增广矩阵XTXXTYk1k2利用消去法得IVar矩阵,得到估计
其中IK1K2为残差平方和SE
回归方差2
SE
k1
各系数检验采用ti
it
k1Iii
iyi2
总平方和ST
iyi2
i1
,回归平方和SRSTSE
i1
i2
i1
f总平方和求解相当于拟合
yi
0
i方程的残差平方和,故得上式ST
所以方程的检验为FSRkFk
k1SE
k1
例211的求解过程如下(由LLLStat统计软件计算):
家庭年收入x150000025000003500000450000055000006500000750000085000009500000
实际购买mi81326222022161210
表214签订意向
i
253258524339282115
数据Logit变换及权重比例pi逻辑变换Logit
032000007537720406250037949004482760207639042307703101550465116013976205641030257829057142902876820571429028768206666670693147
权重
ipi1pi544000077187501434482812692308106976749589744685714351428573333333
表215回归模型基本信息
总样本
9
求解方法
加权最小二乘
仅常数项beta00095029
方程F统计量
51982160
F分布自由度
17
方程r