我们知道营业税税收总额Y与社会商品总额X有关,为能从社会商品零售总额去预测税收总额,需要了解两者之间的关系。现收集如下9组数据(单位:亿元):序号123456789社会商品零售额142081773020468242683162434199332693892945340营业税税收总额39359678598212501555157916391845
散点图
有散点图发现营业税税收总额Y与社会商品总额X线性相关。
f简单相关性分析
从表中可得到两个变量之间的皮尔逊相关系数为0981,双尾检验概率P值尾0000005,故变量之间显著相关。根据营业税税收总额Y与社会商品总额X之间的散点图与相关分析显示,营业税税收总额Y与社会商品总额X之间存在显著的正相关关系。在此前提下进一步进行回归分析,建立一元线性回归方程。
描述统计量
一元回归分析
上表给出了对各个系数的检验结果(T检验),由于是一元回归,因此对系数的检验只包含对常数项的检验与自变量系数的检验。由此可以得到营业税税收总额Y与社会商品总额X的相关性回归模型:
fY22580049X
检验回归系数的显著性水平为0081,明显小于005,故拒绝T检验的原假设,这也说明
回归系数的显著性,说明建立模型是恰当的。
方差分析表
检验这是对回归模型进行检验的结果,是一个标准方差分析表。从上表可见所用回归模
型F值为179651,p值为0000,即检验假设“HO:回归系数B0”成立的概率为0000,从而应拒绝原假设,因此所用的这个回归模型具有统计学意义,可以继续分析各个系数的检验结果
R0981,说明营业税税收总额Y与社会商品总额X之间的相关性很强。R20962,说明自变量“社会商品总额”可以解释因变量营业税税收总额的962的差异性。
检验拟合度检验根据图残差分析
可知R20962即拟合度效果好,线性成立
ff观察图所示的标准化残差的PP图,可以发现,各观测的散点基本上都分布在对角线上,据此可以初步判断服从正态分布。
预测区间
在数据编辑结果,因为选择了需要保存的预测变量的信息,数据编辑窗口数据显示如下:
从上面的结果可以看出,在以前的数据的基础上,新生成了五列数据,第一列命名为pre_1的变量对应的数据表示预测变量对应的因变量非标准化的预测值,例如,社会商品总额X为14208被试,用回归方程预测的这次考试的点预测值为405709;均值预测的区间估计的上下限分别用变量lmci_1和umci_1表示,个体预测值的区间估计的上下限分别用变量lici_1和uici_1表示,例如,社会商品总额X为14208被试,均值95的预测区间为:(301,r