§5
化妆品销售量的预测
某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数x1和人均收入x2。数据见下表:城市123456789101112131415销售量(箱)yi162120223131671698119211655252232144103212适用人数(千人)xi1274180375205862659833019553430372236157370人均收入(元)xi2245032543802283823473782300824502137256040204427266020882605
要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入x1x2时,能够预测在这个城市的销售量。这个问题本质上就是多元线性回归模型,如果随机变量Y与固定变量x1x2xm之间有显著的线性相关关系,即
Yb0b1x1b2x2bmxm
N0
2
称为m元线性回归模型。一、模型中的参数估计设通过实验或历史资料得到观测数据yixi1xi2xim
Yy1y2y
11X1x11x21x
1x12x22x
2x1mx2mx
m
i12
。令
b0b1Bbm
由最小二乘估计,得
BX
T
X
1
XY
T
称yb0b1x1b2x2bmxm为变量Y关于变量x1x2xm的线性回归方程。
同样还可以得到的估计量为
2
f
2
1
m1
y
i1
i
2yi
这里yib0b1xi1b2xi2bmximi12
。
二、回归模型的显著性检验1、检验回归模型的显著性即检验假设
H0b1b2bm0H1bi不全为零
令
SR
yiy
2
Se
i1
y
i1
i
2yi
检验统计量
F
SRmSe
m1
Fm
m1
对一个小概率,若FFm
m1,则认为所建的回归方程有意义。2、各自变量的显著性检验,剔除变量计算即检验假设
H0jbj0H1jbj0
bjcjjSe
m1
T1
j12m
检验统计量
tj
t
m1
j12m
这里cjj是矩阵CXX
中相应位置的元素。对一个小概率,若tjt
m1,则
2
应保留变量xj,否则应剔除变量xj。剔除变量时,从tj最小的开始,直到不显著的变量全部剔除为止。设tkmi
tj,则剔除xk,重新建立回归方程如下:
yb0b1x1bk1xk1bk1xk1br