位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数估计是225t.如图所示:
思考2如何在样本数据的频率分布直方图中,估计出中位数的值?举例加以说明.答在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均用水量的中位数的估计值,此数据值为202t
思考3如何在样本数据的频率分布直方图中估计出平均数的值?答平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和为平均数.思考4从居民月均用水量样本数据可知,该样本的众数是23,中位数是20,平均数是1973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?答因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.
思考5根据众数、中位数、平均数各自的特点,你能分析它们对反映总体存在的不足之处吗?答1众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总
f体特征;2中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;3由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低.
例1样本x1,x2,…,x
的平均数为x,样本y1,y2,…,ym的平均数为yx≠y.若样本x1,
x2,…,x
,y1,y2,…,ym的平均数z=αx+1-αy,其中0α12,则
,m的大小关系
为
A.
m
B.
m
C.
=m
D.不能确定
答案A
解析利用两个样本平均数表示总体平均数,从而确定系数α
x=x1+x2+
…+x
,y=y1+y2+m…+ym,
z=x1+x2+…+xm
++y
1+y2+…+ym,
则
z
=
x+mm+
y
=m+
x
+m+m
y
由题意知0m+
12,∴
m
反思与感悟根据样本频率分布直方图,可以分别估计总体的众数、中位数和平均数.
1众数r