回归分析的基本思想及其初步应用知识梳理
一.线性回归方程的确定如果一组具有相关关系的数据x1y1x2y2x
y
作出散点图大致分布在一条直线附近那么我们称这样的变量之间的关系为线性相关关系也称一元线性相关这条直线就是回归直线记为ybxa.那么如何求得参数a和b使得各点与此直线的距离的平方和为最小即如何求得线性回归方程呢在所求回归直线方程ybxa中当x取xi时,yibxia与实际收集到的数据yi之间的偏差为yiyiyibxia偏差的平方为yiyi2yibxia2如图1
即Qyibxia2来刻画出
个点与回归直线在整体上的偏差的平i1
方和显然Q取最小值时的ab的值就是我们所求的
xixyiy
bi1
xix2
i1
xiyi
xy
i1
xi2
2
x
i1
aybx
其中
xi
yi
为样本数据
x
1
i
1xiy
i
yi为样本平均数,xy称为样本
点中心,且所求线性回归直线经过样本点中心(如图2所示).
当回归直线斜率b0时为线性正相关b0时为线性负相关
应注意这个最小距离不是通常所指的各数据的点xiyi到直线的距离而是
各数据点xiyi沿平行y轴方向到直线的距离(如图1所示).
y
yiyi2yi
yi
ybxa
y
ybxa
y
f对于上面参数a和b的求法原理及方法是简单的但是运算量较大需要将
Qyibxia2展开再合并然后配方整理从而求得abi1
例如当abm
取怎样实数时a
2bm2k的值为最小显然当
amb
时最小值为k像这样配方求最值的方法是经常用到的线性回归方
程ybxa中的参数ba就是这样求出的
教材中用了添项法较为简捷的求出了截距a和斜率b分别是使
Qyixi2取最小值时的值.i1
xixyiy
求得i1
,yx的值,请同学们体会其解法.
xix2
i1
线性回归方程的确定是进行回归分析的基础
二.回归分析:是对具有相关关系的两个变量进行统计分析的一种常用方
法.
1.线性相关关系的强弱
两个变量之间线性相关关系的样本相关系数r
xixyiy
i1
衡
xix2yiy2
i1
i1
量线性相性关系的强弱,由于分子与斜率b的分子一样,因此,当r0时,两个
变量正相关;当r0时两个变量负相关.当r的绝对值接近1,表明两个变量的
fr