管理数量方法与分析第一章数据分析的基础计算题20分必考数据分组:就是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律。变量:离散变量和连续变量分组:单项分组和组距分组。
变量数列的概念:在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列,成为变量数列两因素组成:一个是由不同变量值所划分的组,称为组别。各组变量出现的次数,称为频数。各组次数与总次数之比,成为频率。
编制组距:1确定组数2确定组距3确定组限4计算各组的次数(频数)5编制变量数列
向上累计频数具体做法是:由变量值低的组向变量值高的组依次累计频数。向下:相反
分布中心的测度分布中心:是指距离一个变量的所有取值最近的位置。揭示变量的分布中心有着十分重要的意义。首先,变量的分布中心是变量取值的一个代表,可以用来反映其取值的一般水平。一个变量往往有许多个不同的取值,假若要用一个数值作为他们的代表,反映其一般水平,分布中心值无疑是一个最合适的数值。其次,变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置,即对称中心或尖峰位置。
分布中心指标:1算数平均数,2中位数,3众数
算数平均数需注意问题:1算数平均数容易受到极端变量值的影响2权数对平均数大小起着权衡轻重的作用3根据组距数列求加权算术平均时,需用组中值作为各组变量值的代表
f算数平均中位数众数概念:1算数平均又称均值,它是一组变量值的总和与其变量值的个数总和的比值。2是指将某一变量的变量值按照从小到大的顺序排成一列。位于这列数中心位置上的那个变量值。3是指某一变量的全部取值中出现次数最多的那个变量值。
离散程度的测定离散程度:还需要进一步考察其各个取值的离散程度即差异程度的大小。首先,通过对变量取值之间离散程度的测定可以反映各个变量值之间的差异大小。其次,通过对变量取值之间离散程度的测定可以反映变量次数分布密度曲线的形状。
离散程度测定指标:1极差,2四分位全距,3平均差,4标准差,5极差,6变异系数概念:1极差又称全距,是指一组变量值中最大变量值与最小变量值之差。2是指将一组由小到大排列的变量数列分成四等分,QIQ3所得差的绝对值。3是变量各个取值偏差绝对值的算数平均数。4是变量的各个取值偏差平方的平均数的平方根。5标准差的平方。6r