和。注意我们没有检验回归模型是否通过原点β10;我们的目的只是要看我们是否能解释Y与其均值之间的偏差平方和。
即使对回归方程中每个系数分别进行的t检验都不显著,F检验也可能拒绝原假设。例如,当因变量之间高度相关时就可能出现这种情况。其结果可能是系数的标准差大而t值小,但整个模型仍然能对数据拟合得很好。
当回归模型的因变量发生变化时,我们能否用R2来比较不同回归模型的有效性?在建立计量经济模型时,如果研究人员对因变量的函数形式所知甚少,就会出现这个问题。考虑以下两个模型
模型的两种形式提供了同样的信息,但拟合优度的度量在不同的情况下变化很大。因而R2不能直接用来比较因变量不同的模型。
34多重共线性341完全共线性多元回归模型的假设之一是模型中任何自变量之间不存在精确的线性关系。如果这种线性关系存在,我们就说自变量是完全共线的或存在完全共线性。举个例子,假设在第1章的学生平均成绩模型中包含以下三个自变量:X2家庭收入,以千美元为单位X3每天平均学习的小时数X4每周平均学习的小时数对于每个被调查的学生来说,X47X3,所以变量X4和变量X3是完全共线的。如果这两个共线的变量中只有一个出现在模型中,每个参数的意义都很明确。当两个都出现在模型中,我们就会面临一个无法解决的问题:X3的系数是偏回归系数,在所有其他变量保持不变的情况下,用来衡量当X3变化一个单位时Y的变化量。由于不可能保持所有其他变量不变,我们就不能解释甚至定义回归系数。完全共线性很容易发现,因为它会使参数的最小二乘估计求不出来存在共线性时,所求的方程组包含两个或更多的不独立的方程。342多重共线的后果在实际问题中,我们常常面临处理高度多重共线的自变量这个更加困难问题。当两个或多个变量或变量的组合之间高度但不是完全相关时,就出现了多重共线性。假设两个变量高度相关,还是可以获得回归系数的最小二乘估计,但是很难对系数做解释。两个高度相关的变量中第一个变量的系数被认为是在其他情况不变时,由这个变量的变化引起的Y的变化量。任何时候一个变量发生变化,与其高度相关的变量的观测值也会以相似的方式变化。所以多重共线性的存在意味着样本数据中的信息不足以对估计给出
3
f令人信服的解释。毫不奇怪,回归参数估计的分布对因变量之间的相关很敏感,对回归标准差的大小
也很敏感在一元模型中,
。这种敏感性的表现是回归系数的标
准误差很大,查看等式46和47r