全球旧事资料 分类
统计学专业教学实习报告
题目:
Project2
姓学
名龚进容号:20081004180
指导老师:许小平
2011年01月
f引言:某种疾病爆发,其患者总是或多或少都具有一些共同的特征,例如他们生活的自然引言:
环境,偏好的饮食习惯,所处的地理位置,社会环境,等等。研究这些特征,找出爆发这种疾病的影响因素,便于采取有效的措施预防和控制这种疾病的蔓延。这种研究无论是在医学上还是在人类发展史上都具有十分重要的意义。
一、数据的描述
本案例是对同一个城市的两个地区的可能爆发某种疾病的调查,它有196个样本观测值,每个观测值包括以下5个变量:被调查者的年龄(Age)、被调查者的社会地位(Socs)(其中1表示处于上流社会,2表示中产阶级,3表示下层社会)、被调查者所在的地区(Sector)(其中1表示地区1,2表示地区2)、被调查者是否患有该种疾病(Disease)(其中0表示没有患这种疾病,1表示患有这种疾病)以及被调查者是否有储蓄存款(Save)(其中,0表示没有储蓄存款,1表示有储蓄存款)。对此数据的描述性统计结果如下表所示:表1“疾病爆发”数据的描述性统计分析
根据此数据建立适当的模型,看这些变量对疾病的爆发是否有显著影响,影响程度如何。
二、目的
1建立一个合适Logistic模型,看这些变量中哪些变量对疾病的爆发有显著影响,影响程度如何,从而可以对疾病的预防与控制提出适当的建议,以便采取有效措施。2在建模的过程中帮助我们复习Logistic回归分析,加深对的理论知识的学习。同时也熟悉对SAS统计软件的操作能力。3加强我们的动手能力与实践能力,对应用统计有更深的认识。
三、建立模型的基本理论
对于被解释变量是定性数据的情况,通常是建立Logistic模型。以二分变量为例:Yi10ProbYiPYi1πiPYi01πi
fPYik
πik1πi1kk01
对于只有一个解释变量的情况,在Xi水平下得到的Yi1的概率为:
eβ0β1XiPYi1EYiπi1eβ0β1Xi
由此,得到的Logistic函数为:
πl
iβ0β1Xi1πi
其中,β1表示Xi每增加一个单位,对数机会比率(l
odds)就会相应增加β1个单位。对于Logistic模型,可以用极大似然法估计参数β0、β1。使似然函数:
l
Lβ0β1
∑Yiβ0β1Xi∑l
1expβ0β1Xi
i1i1



达到最大时的b0、b1就是对应的β0、β1的估计值。由此可以得到Logistic函数以及Xi与Yi之间的关系。
四、建模
对于本案例,我们用三分之二的数据建立一个Logisticr
好听全球资料 返回顶部