抽样调查中样本容量的计算

科技经济市场

技术平台

抽样调查中样本容量的计算

(苏州工业职业技术学院,江苏苏州215104)

通过对区间估计理论的分要:本文主要介绍了简单随机抽样和分层抽样时样本容量的计算方法。在简单随机抽样时,

析,得出此时样本容量与置信水平对应分位点、方差、抽样极限误差有关;而在分层抽样时,通过引入柯西不等式,得出此时

的样本容量与每一层的权数、方差及调查经费有关。本文同时还说明了影响样本的一些重要因素-总体方差、调查经费、估计精度等,并提出了在计算容量时应注意的一些问题。

估计精度;简单随机抽样;分层抽样关键词:样本容量;

中图分类号:O212.1文献标识码:A

一种合理、可行的抽样方案,不仅需要针对调查对象选择适

宜的抽样方法,还应根据调查研究的精度及预算情况来决定样本容量。我们知道,在系统误差确定的条件下,抽样的准确性取决于抽样误差,抽样误差又与样本容量有直接关系。若样本容量过大,会使得实施难度增大,增加经费的开支;而若样本容量过小,可能会影响样本的代表性,使抽样误差增大,影响了调查研究推论的精确性。因此在实际工作中,如何确定样本容量是很重要的。

下面就对两种抽样情况进行分析,讨论如何确定样本容量。1简单随机抽样时样本容量的计算1.1重复抽样

假设(x1,x2,…,xn)是来自于总体的一个简单随机抽样,而总

2

体的期望为μ,方差为σ。

根据中心极限定理,即从正态总体中,随机抽取样本容量为n的样本,则样本均数x服从正态分布。若当n足够大时,即使是从偏态总体中抽样,样本均数x也

方差为的正态分布,即,转化成近似服从期望为μ,

标准正态分布,则有。

根据统计学中区间估计知识可知:

。(1-α为置信水平)

(1)

(4)

1.3影响因素

通过上面两种情况得到的样本容量公式,我们可以发现影响样本容量的因素是:总体标准差σ和极限误差。

(1)总体标准差。总体标准差σ与样本标准差S的关系是

,当样本容量足够大,如大于50时,,S→σ。因

此,事先可以先进行一次大于50人的抽样调查,计算样本标准差,以此来估计总体标准差。

(2)极限误差。在抽样调查中,极限误差的确定可以根据经验和定性分析。可以先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步缩小,反之就逐步扩大,直到该值达到可以导致分析失误的临界状态,这个临界状态就是极限误差。

2分层抽样下样本容量的计算方法

分层抽样是实际工作中最常见的抽样方法之一。分层抽样是指在抽样之前,先将总体按一定的标志划分若干层,然后在各层内独立地进行抽样。在分层抽样中,不仅需要考虑总的样本量在各层中如何分配,而且还要考虑精度和费用如何做到最优化配置。

2.1比例分配在分层抽样中,若各层的抽样比都相同,则称总样本量按比例分配。

由,得:nk=nWh,(其中,nh表示第n层样本容量,Nh表示第n层总体容量,n表示样本容量,N表示总体容量,表示第n层权数,一般事先已知。)

2.2最优分配

在分层随机抽样中,在给定的费用条件下,使估计量的方差达到最小,或在精度要求一定条件下,使总费用最小的各层样本量的分配称为最优分配。在分层随机抽样中,费用函数可能是简单线性的,也可能是其它复杂形式,这里主要考虑简单线性的费用函数:

(5)

式(5)中:C0为固定费用;Ch为在第h层抽取一个单元的平均费用。

根据统计学的有关结论,在估计总体均值时,对给定的各层样本容量nh,估计量的方差为:

(6)

从另一个角度来看。在一定的置信概率条件下,抽样允许的

最大误差称为抽样极限误差,或称允许误差,一般用△表示,而平均数的抽样极限误差就可以用△x来表示。由于总量指标是一个确定的值,抽样指标是围绕总体指标波动的随机变量。那么,抽样指标与总体指标离差的绝对值就是抽样误差的可能范围。抽样均值的极限误差△x可表示为△x=|x-μ|。根据△x的定义可知:

(2)

比较(1)式和(2)式,可以得到:,即:

(3)

1.2不重复抽样

当采用不重复抽样时,x的方差为

根据上面的算法

,可得

,即

作者简介:李良(1980-),男,江苏苏州人,助教,主要数学高等数学教育教法研究。

2009年第9期

趥趶

技术平台

科技经济市场

论条纹叶枯病防治存在的问题及其措施

周育成

(阜宁县阜城镇农业技术推广服务中心,江苏阜宁224400)

水稻条纹叶枯病是由灰飞虱传毒危害引起的一种可防而不

可治的病毒病。要控制该病,单靠化学措施很难达到理想的效果,而且化学防治该病须耗用大量的人力、财力,还会造成程度不等的环境污染和农药残留。为了减轻该病的化学防治压力,也为了以后更科学地采取切实有效的农业措施来防控该病,我们有针对性地对影响水稻条纹叶枯病发生的几项农业措施进行了试验、调研、比较和分析。

1条纹叶枯病防治存在的问题在灰飞虱越冬代寄类型多、范围广、发生数量相对较少,害虫尚未对当地夏熟作物造成直接经济损失的情况下,实施用药防治或兼治,效果非常有限,并存在虫源控制不彻底、防治效果

诱发害虫抗药性等问题。从而导致近年来灰飞虱与水稻不理想、

条纹叶枯病连年大流行。

1.1虫源控制不彻底。灰飞虱是传播条纹叶枯病的唯一毒源,有众多的越冬场所和寄生。2008年3月中旬,据某县农业技术推广服务中心对不同类型的90块田调查,越冬灰飞虱虫量平

其中麦田、油菜田、冬闲农田、农田周边杂均1.37万头/667m2,

草上的灰飞虱虫量分别为0.69、3.55、0.96、0.62万头/667m2。近

油菜等夏熟作物种植面积约31.8万亩,分年来,该地区的麦子、

别占耕地面积、水稻面积的48.9%、79.5%。在越冬代与一代灰飞虱防治期间,如以麦田、油菜田灰飞虱为主攻对象,即使都用药

油菜田实际没有用药防治。在近防治,仍有20%~50%的麦田、

年灰飞虱发生基数大、带毒率高的情况下,2006~2008年据该县植保站调查,越冬代灰飞虱虫量分别为1.37、1.23、1.88万头/667m2,2006~2008年该县灰飞虱平均带毒率分别为16.8%、16.6%、19.6%,从以上数据分析,这些未经用药防治农田中存在的灰飞虱虫源,迁入水稻田后仍足够引起条纹叶枯病大流行,导

致水稻严重受害。

1.2防治效果不理想。目前很多地方主要通过结合防治麦子赤霉病、油菜菌核病来防治或兼治麦田、油菜田灰飞虱,只有当麦田灰飞虱虫量特别大的情况下,才对害虫组织专门防治。但近年来因麦田病虫害发生轻、油菜防治菌核病难度大等原因,广大

油菜病虫害的防治,因而对灰飞虱的防治农民普遍放弃对麦子、

达不到预期效果。此外,在实际防(兼)治麦田、油菜田灰飞虱过程中,由于当时农民注重防治作物的中上部病虫害(赤霉病、穗蚜、菌核病),以及农作物处于生长后期,植株较高,下部隐蔽性大,施药后药剂难以达标部位,药效受到明显影响。据上述某县植保站试验结果表明,用药1次,对灰飞虱的防治效果为40%~50%;用药2~3次(生产上实际使用不多),防效达70%~80%。据分析,在现阶段农作物耕作制度与栽培技术条件下,对麦子、油菜等夏熟作物灰飞虱防治1~2次后,预计仍有不少于50%的灰飞虱残留虫量,在夏熟作物收获后向水稻秧田、大田转移,对稻苗进行传毒,造成条纹叶枯病的流行。

1.3抗药性的产生。目前,根据各地有关报道及当地实际情况,防治灰飞虱从麦田开始,到水稻种子处理、苗期至分蘖期,一

多的地方超过8次以上,每次使用纯般需要至少用药5次以上,

药2~49g/667m2;药剂大多数选择以吡虫啉为主要成分的各种单剂或复配套配剂,不仅防治效果降低,而且易诱发灰飞虱抗药性的产生。

2农业措施对水稻条纹叶枯病发生的影响2.1品种抗性

今年我县主栽品种有武香粳14、5356、武育粳3号、南粳41、华粳2号和扬梗9538等。据秧苗期及最终调查,都以武育粳3号发病最重,瘸株率在10%以上,最高达70%;其次是武香粳

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

式(6)中:为第n层权数;Sh2为第n层总体方差;nh为

第n层样本容量;N表示总体容量。

由式(5)可知:,记为:由式(6)可知:,记为:

在给定费用的情况下,为了使得误差减到最小,就要使方差V最小,因为在(2)式的后半部分与样本量无关,所以只

即要使最小。根据要使得V'最小就可以了,

柯西不等式,,且只有在时,即时才成立,这时,V'C'达到了极小值,这就意味着,这时V'C'达到最小。所以最优分配下,。

可见,最优分配的结果既考虑了总体各层的差异,也同时考虑了总体各层内变异程度上的差异和各层内平均调查费用的差异。当层的容量愈大、层内变异程度愈大,层内每调查一个单元的费用愈小,则在该层中抽取的单元应愈多。

3计算时应注意的问题

3.1为了显著性检验,要进行分组研究的每组样本量应该不

少于30个。

3.2对于损耗性的产品质量抽样调查,可以采用较小的样本量。

3.3经过仔细挑选的样本,有时尽管容量不大,却也能十分准确的反映总体特征。

4结论

样本容量的确定过程本质上是费用与精度的权衡过程。在确定抽样方法和样本容量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可操作性,非

经费预算、问卷回收率等,进行综合权衡,达到抽样误差的控制、

一个最优的样本容量的选择。

参考文献:

[1]陈克明,宁震霖.市场调查中样本容量的确定[J].中国统计,2005(3):143-144.

[2]胡屏.决策统计中样本容量的确定[J].太原城市职业学院学报,2005(1):55-56.

[3]张国友.关于抽样调查中样本容量的确定[J].安徽理工大学学报,2003(1):79-

81.

趷趥

2009年第9期

科技经济市场

技术平台

抽样调查中样本容量的计算

(苏州工业职业技术学院,江苏苏州215104)

通过对区间估计理论的分要:本文主要介绍了简单随机抽样和分层抽样时样本容量的计算方法。在简单随机抽样时,

析,得出此时样本容量与置信水平对应分位点、方差、抽样极限误差有关;而在分层抽样时,通过引入柯西不等式,得出此时

的样本容量与每一层的权数、方差及调查经费有关。本文同时还说明了影响样本的一些重要因素-总体方差、调查经费、估计精度等,并提出了在计算容量时应注意的一些问题。

估计精度;简单随机抽样;分层抽样关键词:样本容量;

中图分类号:O212.1文献标识码:A

一种合理、可行的抽样方案,不仅需要针对调查对象选择适

宜的抽样方法,还应根据调查研究的精度及预算情况来决定样本容量。我们知道,在系统误差确定的条件下,抽样的准确性取决于抽样误差,抽样误差又与样本容量有直接关系。若样本容量过大,会使得实施难度增大,增加经费的开支;而若样本容量过小,可能会影响样本的代表性,使抽样误差增大,影响了调查研究推论的精确性。因此在实际工作中,如何确定样本容量是很重要的。

下面就对两种抽样情况进行分析,讨论如何确定样本容量。1简单随机抽样时样本容量的计算1.1重复抽样

假设(x1,x2,…,xn)是来自于总体的一个简单随机抽样,而总

2

体的期望为μ,方差为σ。

根据中心极限定理,即从正态总体中,随机抽取样本容量为n的样本,则样本均数x服从正态分布。若当n足够大时,即使是从偏态总体中抽样,样本均数x也

方差为的正态分布,即,转化成近似服从期望为μ,

标准正态分布,则有。

根据统计学中区间估计知识可知:

。(1-α为置信水平)

(1)

(4)

1.3影响因素

通过上面两种情况得到的样本容量公式,我们可以发现影响样本容量的因素是:总体标准差σ和极限误差。

(1)总体标准差。总体标准差σ与样本标准差S的关系是

,当样本容量足够大,如大于50时,,S→σ。因

此,事先可以先进行一次大于50人的抽样调查,计算样本标准差,以此来估计总体标准差。

(2)极限误差。在抽样调查中,极限误差的确定可以根据经验和定性分析。可以先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步缩小,反之就逐步扩大,直到该值达到可以导致分析失误的临界状态,这个临界状态就是极限误差。

2分层抽样下样本容量的计算方法

分层抽样是实际工作中最常见的抽样方法之一。分层抽样是指在抽样之前,先将总体按一定的标志划分若干层,然后在各层内独立地进行抽样。在分层抽样中,不仅需要考虑总的样本量在各层中如何分配,而且还要考虑精度和费用如何做到最优化配置。

2.1比例分配在分层抽样中,若各层的抽样比都相同,则称总样本量按比例分配。

由,得:nk=nWh,(其中,nh表示第n层样本容量,Nh表示第n层总体容量,n表示样本容量,N表示总体容量,表示第n层权数,一般事先已知。)

2.2最优分配

在分层随机抽样中,在给定的费用条件下,使估计量的方差达到最小,或在精度要求一定条件下,使总费用最小的各层样本量的分配称为最优分配。在分层随机抽样中,费用函数可能是简单线性的,也可能是其它复杂形式,这里主要考虑简单线性的费用函数:

(5)

式(5)中:C0为固定费用;Ch为在第h层抽取一个单元的平均费用。

根据统计学的有关结论,在估计总体均值时,对给定的各层样本容量nh,估计量的方差为:

(6)

从另一个角度来看。在一定的置信概率条件下,抽样允许的

最大误差称为抽样极限误差,或称允许误差,一般用△表示,而平均数的抽样极限误差就可以用△x来表示。由于总量指标是一个确定的值,抽样指标是围绕总体指标波动的随机变量。那么,抽样指标与总体指标离差的绝对值就是抽样误差的可能范围。抽样均值的极限误差△x可表示为△x=|x-μ|。根据△x的定义可知:

(2)

比较(1)式和(2)式,可以得到:,即:

(3)

1.2不重复抽样

当采用不重复抽样时,x的方差为

根据上面的算法

,可得

,即

作者简介:李良(1980-),男,江苏苏州人,助教,主要数学高等数学教育教法研究。

2009年第9期

趥趶

技术平台

科技经济市场

论条纹叶枯病防治存在的问题及其措施

周育成

(阜宁县阜城镇农业技术推广服务中心,江苏阜宁224400)

水稻条纹叶枯病是由灰飞虱传毒危害引起的一种可防而不

可治的病毒病。要控制该病,单靠化学措施很难达到理想的效果,而且化学防治该病须耗用大量的人力、财力,还会造成程度不等的环境污染和农药残留。为了减轻该病的化学防治压力,也为了以后更科学地采取切实有效的农业措施来防控该病,我们有针对性地对影响水稻条纹叶枯病发生的几项农业措施进行了试验、调研、比较和分析。

1条纹叶枯病防治存在的问题在灰飞虱越冬代寄类型多、范围广、发生数量相对较少,害虫尚未对当地夏熟作物造成直接经济损失的情况下,实施用药防治或兼治,效果非常有限,并存在虫源控制不彻底、防治效果

诱发害虫抗药性等问题。从而导致近年来灰飞虱与水稻不理想、

条纹叶枯病连年大流行。

1.1虫源控制不彻底。灰飞虱是传播条纹叶枯病的唯一毒源,有众多的越冬场所和寄生。2008年3月中旬,据某县农业技术推广服务中心对不同类型的90块田调查,越冬灰飞虱虫量平

其中麦田、油菜田、冬闲农田、农田周边杂均1.37万头/667m2,

草上的灰飞虱虫量分别为0.69、3.55、0.96、0.62万头/667m2。近

油菜等夏熟作物种植面积约31.8万亩,分年来,该地区的麦子、

别占耕地面积、水稻面积的48.9%、79.5%。在越冬代与一代灰飞虱防治期间,如以麦田、油菜田灰飞虱为主攻对象,即使都用药

油菜田实际没有用药防治。在近防治,仍有20%~50%的麦田、

年灰飞虱发生基数大、带毒率高的情况下,2006~2008年据该县植保站调查,越冬代灰飞虱虫量分别为1.37、1.23、1.88万头/667m2,2006~2008年该县灰飞虱平均带毒率分别为16.8%、16.6%、19.6%,从以上数据分析,这些未经用药防治农田中存在的灰飞虱虫源,迁入水稻田后仍足够引起条纹叶枯病大流行,导

致水稻严重受害。

1.2防治效果不理想。目前很多地方主要通过结合防治麦子赤霉病、油菜菌核病来防治或兼治麦田、油菜田灰飞虱,只有当麦田灰飞虱虫量特别大的情况下,才对害虫组织专门防治。但近年来因麦田病虫害发生轻、油菜防治菌核病难度大等原因,广大

油菜病虫害的防治,因而对灰飞虱的防治农民普遍放弃对麦子、

达不到预期效果。此外,在实际防(兼)治麦田、油菜田灰飞虱过程中,由于当时农民注重防治作物的中上部病虫害(赤霉病、穗蚜、菌核病),以及农作物处于生长后期,植株较高,下部隐蔽性大,施药后药剂难以达标部位,药效受到明显影响。据上述某县植保站试验结果表明,用药1次,对灰飞虱的防治效果为40%~50%;用药2~3次(生产上实际使用不多),防效达70%~80%。据分析,在现阶段农作物耕作制度与栽培技术条件下,对麦子、油菜等夏熟作物灰飞虱防治1~2次后,预计仍有不少于50%的灰飞虱残留虫量,在夏熟作物收获后向水稻秧田、大田转移,对稻苗进行传毒,造成条纹叶枯病的流行。

1.3抗药性的产生。目前,根据各地有关报道及当地实际情况,防治灰飞虱从麦田开始,到水稻种子处理、苗期至分蘖期,一

多的地方超过8次以上,每次使用纯般需要至少用药5次以上,

药2~49g/667m2;药剂大多数选择以吡虫啉为主要成分的各种单剂或复配套配剂,不仅防治效果降低,而且易诱发灰飞虱抗药性的产生。

2农业措施对水稻条纹叶枯病发生的影响2.1品种抗性

今年我县主栽品种有武香粳14、5356、武育粳3号、南粳41、华粳2号和扬梗9538等。据秧苗期及最终调查,都以武育粳3号发病最重,瘸株率在10%以上,最高达70%;其次是武香粳

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

式(6)中:为第n层权数;Sh2为第n层总体方差;nh为

第n层样本容量;N表示总体容量。

由式(5)可知:,记为:由式(6)可知:,记为:

在给定费用的情况下,为了使得误差减到最小,就要使方差V最小,因为在(2)式的后半部分与样本量无关,所以只

即要使最小。根据要使得V'最小就可以了,

柯西不等式,,且只有在时,即时才成立,这时,V'C'达到了极小值,这就意味着,这时V'C'达到最小。所以最优分配下,。

可见,最优分配的结果既考虑了总体各层的差异,也同时考虑了总体各层内变异程度上的差异和各层内平均调查费用的差异。当层的容量愈大、层内变异程度愈大,层内每调查一个单元的费用愈小,则在该层中抽取的单元应愈多。

3计算时应注意的问题

3.1为了显著性检验,要进行分组研究的每组样本量应该不

少于30个。

3.2对于损耗性的产品质量抽样调查,可以采用较小的样本量。

3.3经过仔细挑选的样本,有时尽管容量不大,却也能十分准确的反映总体特征。

4结论

样本容量的确定过程本质上是费用与精度的权衡过程。在确定抽样方法和样本容量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可操作性,非

经费预算、问卷回收率等,进行综合权衡,达到抽样误差的控制、

一个最优的样本容量的选择。

参考文献:

[1]陈克明,宁震霖.市场调查中样本容量的确定[J].中国统计,2005(3):143-144.

[2]胡屏.决策统计中样本容量的确定[J].太原城市职业学院学报,2005(1):55-56.

[3]张国友.关于抽样调查中样本容量的确定[J].安徽理工大学学报,2003(1):79-

81.

趷趥

2009年第9期


相关内容

  • 第5章 抽样与参数统计.
  • 第五章 抽样与参数估计 学习内容 一.抽样推断概述 二.抽样分布及其应用 三.常见的抽样分布 四.参数估计 五.区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念. 2. 理解抽样分布与总体分布的关系. 3. 了解点估计的概念和估计量的优良标准. 4. 掌握总体均值.总体比例和总体方差的区 ...

  • 基本统计方法
  • 基本统计方法 3.1总体和样本 知识梳理 1. 总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个成员 叫做个体. 总体的情况可用数据表表示,也可用各种图表表示,有条形图.线形图.频数图.圆形(饼)图和散点图等等. (1)总体平均数:设总体有N 个个体,它们的值分别为 ,则总体平 ...

  • 统计学笔记
  • 统计学笔记 第一章 绪论 第一节 统计与统计学 (统计学是一门收集.整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识.) 第二节 统计学的分科 第三节 统计学与其他学科的关系 第四节 统计学的产生与发展 第二章 统计数据的搜集 第一节 数据的计量与类型 一. 数 ...

  • 样本与总体全章教案
  • 30.1抽样调查的意义 第1课时 人口普查与抽样调查 教学目标:了解普查和抽样调查的区别及应用 了解总体.个体.样本.样本容量的含义 了解选取有代表性的样本对总体估计的作用 掌握抽样调查选取样本的方法 教学重点:总体.个体.样本.样本容 教学难点:抽样调查选取样本的方法 教学过程: 一.创设情境,导 ...

  • 第六章.抽样估计
  • 第六章.抽样估计 一.单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1,抽样误差是指( ) A. 由于观察.计算等差错所引起的登记误差 B. 抽样中违反随机原则出现的系统误差 C. 随机抽样而产生的代表性误差 D. 认为原因所造成的误差 2. 抽样误差( ) A .既可以避免,也可以控制 ...

  • 应用统计学概念整理
  • 应用统计学概念整理 第一章:导论 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 只能归类于某一类别的非数字型数据称为分类数据 只能归于某一有序类别的非数字型数据称为顺序数据 按数字尺度测量的观测值称为数值型数据 包含所研究的全部个体的集合称为总体 从总体中抽取的一部分 ...

  • 人教版高中数学必修3知识点和练习题
  • 高中数学人教B 版必修3知识点和练习题 第一章 算法初步 1.1.1 算法的概念 1.算法概念: 在数学上,现代意义上的"算法"通常是指可以用计算机来解决的某一类问题是程序或步骤,这些程序或步骤必须是明确和有效的,而且能够在有限步之内完成. 2. 算法的特点: (1)有限性:一个 ...

  • 几种抽样调查方法比较
  • 几种抽样调查方法比较 数理统计是用概率论的思想,方法去解决实际问题.在实际问题中出现的总的研究对象,我们称为总 体,其分布一般是未知的,所以,首先要对总体进行抽样,以获取总体的有关信息--样本,再利用这 些信息对总体进行分析.对于如何选取样本这个问题,经过人们不断的尝试.试验,渐渐地就有了" ...

  • 怎样确定统计量的样本容量
  • 样本量的确定方法(2008-10-14 09:12:34) 一.样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的.性质和精度要求.以及实际操作的可行性.经费承受能力等.根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求 ...