乙的极差较大数据点较分散;甲的极差小数据点较集中这说明甲比乙稳定运用极差对两组数据进行比较操作简单方便但如果两组数据的集中程度差异不大时就不容易得出结论选择的依据应该是产量高且稳产的品种所以选择乙更为合理不符合实际
样本太小没有代表性若样本里有个别高收入者与多数低收入者差别太大在统计学里对统计数据的分析需要结合实际侧重于考察总体的相关数据特征比如市民平均收入问题都是考察数据的分散程度把问题中的数据在坐标系中刻画出来我们可以很直观地知道乙组数据比甲组数据更集中在平均数的附近即乙的分散程度小如何用数字去刻画这种分散程度呢考察样本数据的分散程度的大小最常用的统计量是方差和标准差
标准差:考察样本数据的分散程度的大小最常用的统计量是标准差标准差是样本数据到平均数的一种平均距离一般用表示所谓“平均距离”其含义可作如下理解
假设样本数据是…x表示这组数据的平均数到x的距离是x…
于是样本数据…到x的“平均距离”是x1xx2xx
x
由于上式含有绝对值运算不太方便因此通常改用如下公式来计算标准差
1
x1
x2
x2
x2
x
x2
意义:标准差用来表示稳定性标准差越大数据的离散程度就越大也就越不稳定标准差越小数据的离散程度就越小也就越稳定从标准差的定义可以看出标准差≥当时意味着所有的样本数据都等于样本平均数标准差还可以用于对样本数据的另外一种解释例如
在关于居民月均用水量的例子中平均数x,标准差,所以xx;
fxx这个数据中,在区间[xx][]外的只有个,也就是说,[xx]几乎包含了所有
样本数据从数学的角度考虑,人们有时用标准差的平方方差来代替标准差,作为测量样本数
据分散程度的工具:
1[xx…x]
显然,在刻画样本数据的离散程度上,方差与标准差是一样的但在解决实际问题时,一般多采用标准差
需要指出的是现实中的总体所包含的个体数往往是很多的总体的平均数与标准差是不知道的如何求得总体的平均数和标准差呢通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差这与前面用样本的频率分布来近似地代替总体分布是类似的只要样本的代表性好这样做就是合理的也是可以接受的
两者都是描述一组数据围绕平均数波动的大小实际应用中比较广泛的是标准差如导入中的运动员成绩的标准差的计算器计算
用计算器计算运动员r