他几个水平回归系数的代数和。即些时
个水平的回归系数的代数和为“0”。
三、设置哑变量时要注意的问题1参照水平最好要有实际意义,否则将会推动比较的目标。如果将一些难以分类的个体放到一起,然后美其名曰“其他”,此时往往不知道已知的某个类别具体在与谁进行比较,进而导致哑变量的回归系数难以解释。因为不同研究样本中的“其他”往往是不同的,这样研究结果之间难以相互进行比较。2参照水平组应有一定的频数作保证。如果参照水平频数过少,将导致其他与之相对比的水平参数估计的标准误增大,进而置信区间扩大,精确度降低。有学者认为,参照水平组的频数应不少于30例或50例。3如果不通过Categorical模型对分类自变量产生哑变量,而是自己通过Compute过程产生,需要注意在逐步回归筛选自变量时,哑变量应该同时进入模型或者同时退出模型。4对有序自变量的分析。一是从专业出发,如果认为在不同等级对反应变量的影响程度是一致的,如文化程度每增加一个等级,成为某项时尚消费品潜在消费者的比数(P(1P))的自然对数增加幅度也相同,这时可以将该变量作为连续性变量进行处理,这样得到的模型也更简洁,结果的解释也更方便。当专业上不能给出以上假设时,则需要先将该有序变量分别以哑变量和连续性变量的方式引入模型,观察各哑变量的回归系数间是否存在等级关系,
以及对两个模型进行似然比检验,似然比2值等于两个模型的2logL之差,自由度为两个
模型中自变量个数之差,如果似然比检验无统计学意义,且各哑变量的回归系数间存在等级关系,可以将该自变量作为连续性变量引入模型,否则最好还是采用哑变量的方式引入模型。
第三节标准化回归系数和回归模型的拟合优度
一、标准化回归系数
与多重线性回归类似,自变量量纲(单位)不同,非标准化的logistic回归系数不能用于比较各自变量对事件发生概率的贡献大小。欲研究logistic回归中各变量的相对贡献,要么事先将各自变量标准化后再作回归分析,要么对logistic回归系数进行标准化。我们可以用极大似然估计的回归系数乘以该变量的样本标准差求得logistic回归的标准化回归系数。
bibiSbi
(16)
SPSS软件可以提供回归系数及其变量的样本标准差,但不能直接得到标准化回归系数。在标准化系数问题上要谨慎,应注意标准化的原意是消去不同量纲的影响,增加可比性。对于一些二分类的自变量,不存在量纲问题,则不宜作标准化。另外,一般不利用标准化回归系数估计优势比,因为按标准化回归系数r