全球旧事资料 分类
Logistic回归分析简介
Logistic回归:实际上属于判别分析,因拥有很差的判别效率而不常用。1.应用范围:①②③④适用于流行病学资料的危险因素分析实验室中药物的剂量反应关系临床试验评价疾病的预后因素分析
2.Logistic回归的分类:①按因变量的资料类型分:二分类多分类其中二分较为常用②按研究方法分:条件Logistic回归非条件Logistic回归两者针对的资料类型不一样,后者针对成组研究,前者针对配对或配伍研究。3.Logistic回归的应用条件是:①②③独立性。各观测对象间是相互独立的;LogitP与自变量是线性关系;样本量。经验值是病例对照各50例以上或为自变量的510倍(以10倍为宜),不过随着统计技术和软件的发展,样本量较小或不能进行似然估计的情况下可采用精确logistic回归分析,此时要求分析变量不能太多,且变量分类不能太多;④4.当队列资料进行logistic回归分析时,观察时间应该相同,否则需考虑观察时间的影响(建议用Poisso
回归)。
拟和logistic回归方程的步骤:①②对每一个变量进行量化,并进行单因素分析;数据的离散化,对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散,或是按照四分、五分位数法来确定等级,也可采用聚类方法将计量资料聚为二类或多类,变为离散变量。③对性质相近的一些自变量进行部分多因素分析,并探讨各自变量(等级变量,数值变量)纳入模型时的适宜尺度,及对自变量进行必要的变量变换;④在单变量分析和相关自变量分析的基础上,对P≤α(常取02,015或03)的变量,以及专业上认为重要的变量进行多因素的逐步筛选;模型程序每拟合一个模型将给出多个指标值,供用户判断模型优劣和筛选变量。可以采用双向筛选技术:a进入变量的筛选用score统计量或G统计量或LRS似然比统计量,用户确定P值临界值如:005、01或02,选择统计量显著且最大的变量进入模型;b剔除变量的选择用Z统计量Wald统计量,用户确定其P值显著性水平,当变量不显者,从模型中予以剔除。这样,选入和剔除反复循环,直至无变量选入,也无变量删除为止,选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定,一般地,当纳入模型的变量偏多,可提高选入界值或降低剔除标准,反之,则降低选入界值、提高删除标准。但筛选标准的不同会影响分析结果,这在与他人结果比较时应当注意。⑤在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项;两变量间的r
好听全球资料 返回顶部