85表明从总体上讲,种族应当对因变量无影响,此时所有的哑变量都不用再纳入分析了,总的检验比分项的检验更有权威性;如果总的检验
有差异,而有些哑变量无统计学意义,则由于哑变量应当同进同出,原则上仍然应当在模型
中纳入所有的哑变量,以保证哑变量代表含义的正确性。否则,剔除部分哑变量将会导致参
照水平的变化,从而哑变量的具体含义也会发生改变。
二、SPSS中预设的哑变量编码方式除以上默认的哑变量对比方式外,SPSS的Categorical子对话框中还提供了其余几种对比方式:
1I
dicator:指示对比。用于指定某一分类变量的参照水平。这时计算出来的参数i是以该
变量的最后一个或第一个水平作为参照水平(取决于下面的Refere
ceCategory中选择的是last还是first)。在本例中,Refere
ceCategory均为last。变量race以“其他种族”作为参照水平。
2Simple:简单对比。可计算该分类变量的各水平与参照水平相比的i值。对于本例来说,
Simple与I
dicator选项是一样的,前提是下面的Refere
ceCategory中所选择的同是last(或first)。3Differe
ce:差别对比。分类变量某个水平与其前面的所有水平平均值进行比较。此法与Helmert法相反,因此也叫反Helmert法。如2水平与1水平相比;3水平与1、2水平的平均值相比,以此类推。如果在某水平处系数变小且无统计学意义(P005),说明该分类变量对风险率产生的影响在该水平处达到停滞状态。此选择项一般用于有序的分类变量。对无序多分类变量则无实际意义。4Helmert:赫尔默特对比。分类变量某水平与其后面各水平平均值进行比较。如果在某水平系数增大且有统计学意义,说明该分类变量自该水平起开始对风险率产生影响。同样也适用于有序的分类变量。5Repeated:重复对比。分类变量的各水平与其前面相邻的水平相比较(第一水平除外),此时以“前一水平”为参照水平。6Poly
omial:多项式对比。仅用于数字型的分类变量。无效假设是假设各水平是等距离的(可以是线性的关系,也可以是立方、四次方的关系)。例如年龄每增加5岁,娩出低出生体重儿的危险增加幅度是一样的,但实际情况常常与之相反,例如在20岁与30岁年龄段,年龄
10
f都增加5岁,所增加的娩出低出生体重儿的危险肯定是不一样的,具体情况需要根据各人的研究课题而定。7Deviatio
:离差对比。除了所规定的参照水平外,其余每个水平均与总体水平相比。此时每个水平的回归系数都是相对于总体水平而言的改变量。对于那个参照水平而言,它的回归系数可以通过其他
1个回归系数算出来,等于0减去其r