任期。为了更好地解释影响薪酬的因素,我们就必须用到多元线性回归。二、多元线性回归还是使用lm函数。在公式的右侧指定多个预测变量,用加号()连接:lmyuvw显然,多元线性回归是简单的线性回归的扩展。可以有多个预测变量,还是用OLS计算多项式的系数。三变量的回归等同于这个线性模型:yiβ0β1uiβ2viβ3wiεi在R中,简单线性回归和多元线性回归都是用lm函数。只要在模型公式的右侧增加变量即可。输出中会有拟合的模型的系数:result1lmwageeducexperte
uredataAsummaryresult1Calllmformulawageeducexperte
uredataAResidualsMi
1QMedia
3QMax8662924923510718962219001Coefficie
tsEstimateStdErrortvaluePrtI
tercept27624010670225890009778educ744156287118362e16exper1489232534578533e06te
ure8257249833060000983Sig
ifcodes0‘’0001‘’001‘’005‘’01‘’1Residualsta
darderror3743o
931degreesoffreedom
fMultipleRsquared01459AdjustedRsquared01431Fstatistic53o
3a
d931DFpvalue22e16我们将数据稍作平稳化处理,将wage换成log(wage),再来看看。plotwageeducdataAAlogwagelogAwageresult1lmlogwageeducexperte
uredataAsummaryresult1Calllmformulalogwageeducexperte
uredataAResidualsMi
1QMedia
3QMax205802029645003265028788142809Coefficie
tsEstimateStdErrortvaluePrtI
tercept028436001041902729000656educ00920290007330125552e16exper000412100017232391001714te
ure002206700030947133329e12Sig
ifcodes0‘’0001‘’001‘’005‘’01‘’1Residualsta
darderror04409o
522degreesoffreedomMultipleRsquared0316AdjustedRsquared03121Fstatistic8039o
3a
d522DFpvalue22e16看得出,平稳化后的数据线性性是更加好的。下面我们来提取回归分析的各项统计数据:一些统计量和参数都被存储在lm或者summary中outputsummaryresult1SSRdevia
ce(result1)#残差平方和;(另一种方法:RSquaredoutputrsquaredLLlogLikresult1对数似然统计量
fDegreesOfFreedomresult1df自由度Yhatresult1fittedvalues拟合值向量Residresult1residualssoutputsigma误差标准差的估计值(假设同方差)CovMatrixs2outputcov系数的方差-协方差矩阵(与vcovresult1同)ANOVAa
ovaresult1co
fide
ti
tervalco
fi
tresult1回归系数的置信区间level095effectsresult1计算正交效应向量(Vectoroforthogo
aleffects)三、检查结果通过图形我们可以以一种十分直观的办法检测我们的拟合效果:plotresult1
f通r