全球旧事资料 分类
转载logistic回归模型总结
logistic回归模型是最成熟也是应用最广泛的分类模型,通过学习和实践拟通过从入门、进阶到高级的过程对其进行总结,以便加深自己的理解也为对此有兴趣者提供学习的便利。一、有关logistic的基本概念
logistic回归主要用来预测离散因变量与一组解释变量之间的关系最常用的是二值型logistic。即因变量的取值只包含两个类别例如:好、坏;发生、不发生;常用Y1或Y0表示X表示解释变量则P(Y1X)表示在X的条件下Y1的概率,logistic回归的数学表达式为:log(p1p)ABX=L其中p1p称为优势比(ODDS)即发生与不发生的概率之比可以根据上式反求出P(Y1X)=1(1+e^L)根据样本资料可以通过最大似然估计计算出模型的参数然后根据求出的模型进行预测下面介绍logistic回归在SAS中的实现以及输出结果的解释
f二、logistic回归模型初步SAS中logistic回归输出结果主要包括预测模型的评价以及模型的参数预测模型的评价与多元线性回归模型的评价类似主要从以下几个层次进行(1)模型的整体拟合优度主要评价预测值与观测值之间的总体一致性。可以通过以下两个指标来进行检验1、HosmerLemeshowz指标
HL统计量的原假设Ho是预测值和观测值之间无显著差异,因此HL指标的PValue的值越大,越不能拒绝原假设,即说明模型很好的拟合了数据。在SAS中这个指标可以用LACKFIT选项进行调用2、AIC和SC指标即池雷准则和施瓦茨准则
与线性回归类似AIC和SC越小说明模型拟合的越好(2)从整体上看解释变量对因变量有无解释作用
相当于多元回归中的F检验在logistic回归中可以通过似
f然比(likelihoodratiotest)进行检验(3)解释变量解释在多大程度上解释了因变量
与线性回归中的R2作用类似在logistic回归中可以通过Rsquare和C统计量进行度量在SAS中通过RSQ来调用Rsquare,C统计量自动输出4模型评价指标汇总
spa
style
好听全球资料 返回顶部