全球旧事资料 分类
如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?如何确定红楼梦前四十回和后四十回是否曹雪芹一人所写?如何通过大众调查来得到性别、年龄、职业、收入等各种因素与公众对某项事物如商品或政策的态度之间的关系呢?高中成绩和大学成绩是否密切相关?地震与油价上涨有关吗?相关分析水质污染和那些因素有关?如何确定重金属污染源?回归如何设计调查问卷,收集数据,调查大学生喜欢的手机品牌两种小麦品种产量是否有显著差异?肯德基选址问题调查分析(数据挖掘)
要求:
1调研,收集数据;2数据处理;3选合适的统计模型建模。423人一组,写一篇大论文上交。做PPT汇报,1020分钟,可以提问23个问题。论文和答辩各占60、40分。老师占70,学生30。论文做的好的,可继续作为学术科技立项申报,或作为毕业设计题目继续完善。能投稿的投稿。
f第一章数据的分布
数据的描述性分析即从数据出发概括数据的特征分为数字特征和分布特征数字特征:用简单的量概括数据包含的主要信息或特征包括数据的集中位置、分散程度、数据分布的形状特征等表达数据集中位置的指标,用以描述观察值的平均水平,如均值、中位数、分位数、三均值表达数据的分散成度或变异的指标,用以描述观察值间参差别不齐的程度,如方差、标准差、变异系数、极差、四分位数等表达数据分布的形状的数字特征等,如峰度和偏度分布特征:反应数据整体结构特征本章介绍一维和多维数据描述性分析的基本内容,包括数据的数字特征与分布特征的描述性分析简介多维正态分布的定义和性质
§11
设有
个一维数据:
一维数据的数字特征
x1x2x

它们是从所研究的对象(总体)X中观测得到的,称为样本观测值,
为样本容量数据分析的任务:对样本观测值进行分析,提取数据中所包含的有用的信息,进一步对总体的信息做出推断首先用一些简单的量概括数据中包含的信息或特征
111表示位置的数字特征
1.均值(mea

xxi
i1

11
为x1x2x
的(简单算术)平均数,简称均值描述数据取值的平均位置注意:10优点:是总体均值的无偏一致估计,含有数据的完整信息,是位置的主要测度值适用于数值型数据,不适用于分类和顺序数据20缺点:易受数据中异常值的影响,缺乏抗扰性、稳健性因此,在数据分析中还要考虑其他一些描述位置的数字特征30其他平均值(不要求)(1)加权算术平均值(arithmeticmea

xxir
好听全球资料 返回顶部