计算公式为
σ2e2Z2σ2N
特殊情况下如果是很大总体计算公式变为
Z2σ2e2
例如希望平均收入的误差在正负人民币30元之间调查结果在95的置信范围以内其95的置信度要求Z的统计量为196。根据估计总体的标准差为150元总体单位数为1000。
样本量
1501503030196196150150100088
2于百分比类型的变量
对于已知数据为百分比一般根据下列步骤计算样本量。已知调查结果的精度值百分比E以及置信度L比例估计P的精度即样本变异程度,总体数为N。
则计算公式为
P1Pe2Z2P1PN
同样特殊情况下如果不考虑总体公式为
Z2P1Pe2
一般情况下我们不知道P的取值取其样本变异程度最大时的值为05。
例如希望平均收入的误差在正负005之间调查结果在95的置信范围以内其95的置信度要求Z的统计量为196,估计P为05总体单位数为1000。样本量为
050500500519619605051000278
2样本量分配方法
以上分析我们获得了采用简单随机抽样公式计算得到的样本量,总的样本量需要在此基础上乘以设计效应的值得到。由于样本总量已经确定我们采用总样本量固定方法分配样本这种方法包括按照比例分配和不按照比例分配两类。实际工作中首先计算取得区县总的样本量然后逐级将其分配到各阶分层中如果不清楚各阶分层的规模和方差等一般采取比例分配或者比例平方根分配法。如果有一定辅助变量可以使用,可以采用按照规模分配法分配样本量。
3样本量和总体大小的关系
f在其它条件一定的情况下,即误差、置信度、抽样比率一定,样本量随总体的大小而变化。但是,总体越大,其变化越不明显;总体较小时,变化明显。其变化趋势如下:
二者之间的变化并非是线性关系。所以,样本量并不是越大越好,应该综合考虑,实际工作中只要达到要求就可以了。
三、抽样调查方案样本量的确定
我们决定首先采取简单随机抽样的方法计算区县的样本量,之所以首先对区县计算样本量主要是考虑,虽然我们方案中没有要求对区县的估计量,但是区县一级是我们做计划和决策的基础,具有承上启下的作用,如果区县级获得的估计量精度比较高,就可以保证上一级的估计量具有更高的精度,而且各个区县的样本量可以认为是相同的,这主要是因为各个区县的总体数都比较多,而且我们也不清楚;同时也不可能事先进行区县方差估计。没有首先计算区县以下各阶分层的样本量主要是考虑
(1)如果计算区县以下某阶分层的样本量然后再将计算的样本量合并将显著增加样本量,增加基层的负担。
(2)事r