Excel回归分析结果详解
利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。
图1连续10年的最大积雪深度与灌溉面积(1971-1980)回归结果摘要(SummaryOutput)如下(图2):
图2利用数据分析工具得到的回归结果
1
f第一部分回归统计表
这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):表1回归统计表
逐行说明如下:
Multiple对应的数据是相关系数correlatio
coefficie
t,即R0989416。RSquare对应的数值为测定系数determi
atio
coefficie
t,或称拟合优度good
essoffit,它是相关系数的平方,即有R2098941620978944。Adjusted对应的是校正测定系数adjusteddetermi
atio
coefficie
t,计算公式为
Ra
1
11R2
m1
式中
为样本数,m为变量数,R2为测定系数。对于本例,
10,m1,R20978944,
代入上式得
Ra
1
101109789441011
0976312
标准误差(sta
darderror)对应的即所谓标准误差,计算公式为
sSSe
m1
这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe1610676,代入上式可得
s1610676114189241011
最后一行的观测值对应的是样本数目,即有
10。
第二部分方差分析表
方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。表2方差分析表(ANOVA)
逐列、分行说明如下:第一列df对应的是自由度(degreeoffreedom),第一行是回归自由度dfr,等于变量数目,即dfrm;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe
m1;
2
f第三行为总自由度dft,等于样本数目减1,即有dft
1。对于本例,m1,
10,因此,dfr1,dfe
m18,dft
19。
第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有
SSryiyi27488542
它表征的是因变量的预测值对其平均值的总偏差。
第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有
SSeyiyi21610676
它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述
的y的标准误差即由SSe给出。第三行为总平方和或称总变差SSt,即有
SStyiyi2764961
它表示的是因变量对其平均值的总偏差。容易验证74885421610676764961,即有
SSrSSeSSt
而测定系数就是回归平方和在总平方和中所占的比重,即有
R2SSr74885420978944SSt764961
显然这个数值越大,拟合的效果也就越好。
第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一r