【二分类与多分类Logistic回归模型】-全球旧事资料库

二分类与多分类Logistic回归模型

85表明从总体上讲，种族应当对因变量无影响，此时所有的哑变量都不用再纳入分析了，总的检验比分项的检验更有权威性；如果总的检验
有差异，而有些哑变量无统计学意义，则由于哑变量应当同进同出，原则上仍然应当在模型
中纳入所有的哑变量，以保证哑变量代表含义的正确性。否则，剔除部分哑变量将会导致参
照水平的变化，从而哑变量的具体含义也会发生改变。
二、SPSS中预设的哑变量编码方式除以上默认的哑变量对比方式外，SPSS的Categorical子对话框中还提供了其余几种对比方式：
1I
dicator：指示对比。用于指定某一分类变量的参照水平。这时计算出来的参数i是以该
变量的最后一个或第一个水平作为参照水平（取决于下面的Refere
ceCategory中选择的是last还是first）。在本例中，Refere
ceCategory均为last。变量race以“其他种族”作为参照水平。
2Simple：简单对比。可计算该分类变量的各水平与参照水平相比的i值。对于本例来说，
Simple与I
dicator选项是一样的，前提是下面的Refere
ceCategory中所选择的同是last（或first）。3Differe
ce：差别对比。分类变量某个水平与其前面的所有水平平均值进行比较。此法与Helmert法相反，因此也叫反Helmert法。如2水平与1水平相比；3水平与1、2水平的平均值相比，以此类推。如果在某水平处系数变小且无统计学意义（P005），说明该分类变量对风险率产生的影响在该水平处达到停滞状态。此选择项一般用于有序的分类变量。对无序多分类变量则无实际意义。4Helmert：赫尔默特对比。分类变量某水平与其后面各水平平均值进行比较。如果在某水平系数增大且有统计学意义，说明该分类变量自该水平起开始对风险率产生影响。同样也适用于有序的分类变量。5Repeated：重复对比。分类变量的各水平与其前面相邻的水平相比较（第一水平除外），此时以“前一水平”为参照水平。6Poly
omial：多项式对比。仅用于数字型的分类变量。无效假设是假设各水平是等距离的（可以是线性的关系，也可以是立方、四次方的关系）。例如年龄每增加5岁，娩出低出生体重儿的危险增加幅度是一样的，但实际情况常常与之相反，例如在20岁与30岁年龄段，年龄
10
f都增加5岁，所增加的娩出低出生体重儿的危险肯定是不一样的，具体情况需要根据各人的研究课题而定。7Deviatio
：离差对比。除了所规定的参照水平外，其余每个水平均与总体水平相比。此时每个水平的回归系数都是相对于总体水平而言的改变量。对于那个参照水平而言，它的回归系数可以通过其他
1个回归系数算出来，等于0减去其r