全球旧事资料 分类
11对数据做简单的描述统计
(一)使用procmea
s描述数据用procmea
s过程步,可以对数据做简单的描述统计,包括:非缺省值个数、均值、标准差、最大值、最小值等。基本语法:PROCMEANSdata数据集可选项VAR变量列表CLASS分组变量BY变量WEIGHT变量FREQ变量(加权平均的权数)(相应观测出现的频数)
说明:(1)可选项“MAXDEC
”用来指定输出结果的小数位数;(2)默认是对数据集的所有数值变量的非缺省值做描述统计,若想包含缺省值,加上可选项“MISSING”;(3)VAR语句指定要做描述统计的变量;CLASS语句指定按分组变量对数据进行分组分别做描述统计;BY语句同CLASS语句(需要事先按BY变量排好序);(4)默认输出非缺省值个数、均值、标准差、最大值、最小值;也可以自己指定需要输出的描述统计量:MAX最大值;
fMIN最小值;MEAN均值;MEDIAN中位数;MODE众数;N非缺省值个数;NMISS缺省值个数;RANGE极差;STDDEV标准差;SUM累和;
例1鲜花销售的数据(CMyRawDataFlowersdat),变量包括顾客ID,销售日期,petu
ias,s
apdrago
s,marigolds三种花的销量:
读取数据,计算新变量销售月份mo
th,并使用procsort按照月份排序,并使用procmea
s的by语句来按照月份描述数据。
代码:
datasalesi
filecMyRawDataFlowersdati
putCustID9SaleDateMMDDYY10Petu
iaS
apDrago
Marigold
fMo
thMONTHSaleDateprocsortdatasalesbyMo
thCalculatemea
sbyMo
thforflowersalesprocmea
sdatasalesMAXDEC0byMo
thvarPetu
iaS
apDrago
MarigoldtitleSummaryofFlowerSalesbyMo
thru

运行结果:
(二)使用统计量
有时候需要将统计量存入新数据集,以便进一步做数据分析,或者与原数据集合并。
一、将统计量存入新数据集可以用ODS(OutputDeliverySystem)系统或者OUTPUT语句,下面介绍用OUTPUT语句。
f语法:OUTPUTOUT数据集名统计量名变量列表新列名示例:
PROCMEANSDATAzooNOPRINTVARLio
sTigersBearsOUTPUTOUTzoosumMEANLio
sBearsLio
WeightBearWeightRUN
例2仍然是例1的鲜花数据,读取数据,按照CustomerID排序,使用procmea
s过程,将mea
和sum值存入新数据集totals中。
代码:
datasalesi
filecMyRawDataFlowersdati
putCustID9SaleDateMMDDYY10Petu
iaS
apDrago
MarigoldprocsortdatasalesbyCustIDCalculatemea
sbyCustomerIDoutputsuma
dmea
to
ewdatasetprocmea
sNOPRINTdatasalesbyCustIDvarPetu
iaS
apDrago
Marigoldoutputouttotalsmea
Petu
iaS
apDrago
MarigoldMea
PMea
SDMea
MsumPetu
iaS
apDrar
好听全球资料 返回顶部