全球旧事资料 分类
定性资料的回归分析Logistic回归Logistic模型的主要用途:1用作影响因素分析2作为判别分析方法
第一节二分类变量的logistic回归逻辑回归区别于线性回归,最主要的特点就一个:它的因变量是01型数据。啥是01型数据?就是这个数据有且仅有两个可能的取值。数学上为了方便,把其中一个记作0,另外一个记作1例1:购买决定:我是买呢?还是买呢?还是买呢?如果您的决策永远是:买、买、买,这不是01数据。我们说的购买决策是:买还是不买?定义:1购买,0不购买。这个关于购买决定的01变量老牛了。为啥?因为它支撑了太多的重要应用。例如,我生产了一瓶矿泉水,叫做“农妇山泉有点咸”,到底卖给谁呢?为此,我们需要做市场定位。什么是市场定位?市场定位从回归分析的角度看,就是想知道:谁会买这个产品?谁不会买?或者说:谁购买这个产品的可能性大,谁购买的可能性小。这样我们就可以瞄准可能性最高的一批人,他们就构成了我的目标市场。这就是我们通常所说的市场定位。令Y表示购买决定,那么影响它的因素有很多。比如,消费者自己的人口特
征X1、消费者过去的购买记录是X2、来自社交网络朋友的行为信息X3、产品
自己的特征X4、产品正在承受的市场手段策略(例如:促销)X5、竞争对手
的市场动作X6等等。
一.模型建立
理论回归模型:l
p1p

0

1x1

2x2
pxp
其中
p

py
1
x1
xp。
注:p称为优势odds表示某个事件的相对危险度1p
获得容量为
的样本xi1xi2xipyii1
后可得样本回归模型:
l
pi1pi

0
1xi1
2xi2
pxip其中
pi

pyi
1
x1xp,i
1

补充说明(1)逻辑回归模型的整个生成过程是以构造性的思想为主,而不是因为:上帝他老人家生成数据的真实机制是这样的,没有那么巧的事。(2)逻辑回归构造的核心思想是通过逻辑变换把01之间的概率变换为正负无穷之间的一个数字。给定一组数据,如果赶巧了,他能够被逻辑回归模型很好的拟合,那么相应的估计精度和预测精度都会很优秀。但是,绝大多数情况下,拟合效果跟上帝比,差得远,跟拍脑袋比,好很多。所以,这就成就了逻辑回归,作为一种最常见的01回归分析方法的重要地位。(3)通过逻辑回归模型,我们可以对一个样本Y取值为1的概率予以测算,然
f后根据测算的概率预测它的最终取值应该是0还是14关于自变量类型自变量的常见类型:连续型变量、二水平的分类变量、多水平的分类变量、等级变量。多水平的分类变量:例如r
好听全球资料 返回顶部