科技经济市场
技术平台
抽样调查中样本容量的计算
李
良
(苏州工业职业技术学院,江苏苏州215104)
摘
通过对区间估计理论的分要:本文主要介绍了简单随机抽样和分层抽样时样本容量的计算方法。在简单随机抽样时,
析,得出此时样本容量与置信水平对应分位点、方差、抽样极限误差有关;而在分层抽样时,通过引入柯西不等式,得出此时
的样本容量与每一层的权数、方差及调查经费有关。本文同时还说明了影响样本的一些重要因素-总体方差、调查经费、估计精度等,并提出了在计算容量时应注意的一些问题。
估计精度;简单随机抽样;分层抽样关键词:样本容量;
中图分类号:O212.1文献标识码:A
一种合理、可行的抽样方案,不仅需要针对调查对象选择适
宜的抽样方法,还应根据调查研究的精度及预算情况来决定样本容量。我们知道,在系统误差确定的条件下,抽样的准确性取决于抽样误差,抽样误差又与样本容量有直接关系。若样本容量过大,会使得实施难度增大,增加经费的开支;而若样本容量过小,可能会影响样本的代表性,使抽样误差增大,影响了调查研究推论的精确性。因此在实际工作中,如何确定样本容量是很重要的。
下面就对两种抽样情况进行分析,讨论如何确定样本容量。1简单随机抽样时样本容量的计算1.1重复抽样
假设(x1,x2,…,xn)是来自于总体的一个简单随机抽样,而总
2
体的期望为μ,方差为σ。
根据中心极限定理,即从正态总体中,随机抽取样本容量为n的样本,则样本均数x服从正态分布。若当n足够大时,即使是从偏态总体中抽样,样本均数x也
方差为的正态分布,即,转化成近似服从期望为μ,
标准正态分布,则有。
根据统计学中区间估计知识可知:
。(1-α为置信水平)
(1)
(4)
1.3影响因素
通过上面两种情况得到的样本容量公式,我们可以发现影响样本容量的因素是:总体标准差σ和极限误差。
(1)总体标准差。总体标准差σ与样本标准差S的关系是
,当样本容量足够大,如大于50时,,S→σ。因
此,事先可以先进行一次大于50人的抽样调查,计算样本标准差,以此来估计总体标准差。
(2)极限误差。在抽样调查中,极限误差的确定可以根据经验和定性分析。可以先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步缩小,反之就逐步扩大,直到该值达到可以导致分析失误的临界状态,这个临界状态就是极限误差。
2分层抽样下样本容量的计算方法
分层抽样是实际工作中最常见的抽样方法之一。分层抽样是指在抽样之前,先将总体按一定的标志划分若干层,然后在各层内独立地进行抽样。在分层抽样中,不仅需要考虑总的样本量在各层中如何分配,而且还要考虑精度和费用如何做到最优化配置。
2.1比例分配在分层抽样中,若各层的抽样比都相同,则称总样本量按比例分配。
由,得:nk=nWh,(其中,nh表示第n层样本容量,Nh表示第n层总体容量,n表示样本容量,N表示总体容量,表示第n层权数,一般事先已知。)
2.2最优分配
在分层随机抽样中,在给定的费用条件下,使估计量的方差达到最小,或在精度要求一定条件下,使总费用最小的各层样本量的分配称为最优分配。在分层随机抽样中,费用函数可能是简单线性的,也可能是其它复杂形式,这里主要考虑简单线性的费用函数:
(5)
式(5)中:C0为固定费用;Ch为在第h层抽取一个单元的平均费用。
根据统计学的有关结论,在估计总体均值时,对给定的各层样本容量nh,估计量的方差为:
(6)
从另一个角度来看。在一定的置信概率条件下,抽样允许的
最大误差称为抽样极限误差,或称允许误差,一般用△表示,而平均数的抽样极限误差就可以用△x来表示。由于总量指标是一个确定的值,抽样指标是围绕总体指标波动的随机变量。那么,抽样指标与总体指标离差的绝对值就是抽样误差的可能范围。抽样均值的极限误差△x可表示为△x=|x-μ|。根据△x的定义可知:
(2)
比较(1)式和(2)式,可以得到:,即:
(3)
1.2不重复抽样
当采用不重复抽样时,x的方差为
。
根据上面的算法
,可得
,即
作者简介:李良(1980-),男,江苏苏州人,助教,主要数学高等数学教育教法研究。
2009年第9期
趥趶
技术平台
科技经济市场
论条纹叶枯病防治存在的问题及其措施
周育成
(阜宁县阜城镇农业技术推广服务中心,江苏阜宁224400)
水稻条纹叶枯病是由灰飞虱传毒危害引起的一种可防而不
可治的病毒病。要控制该病,单靠化学措施很难达到理想的效果,而且化学防治该病须耗用大量的人力、财力,还会造成程度不等的环境污染和农药残留。为了减轻该病的化学防治压力,也为了以后更科学地采取切实有效的农业措施来防控该病,我们有针对性地对影响水稻条纹叶枯病发生的几项农业措施进行了试验、调研、比较和分析。
1条纹叶枯病防治存在的问题在灰飞虱越冬代寄类型多、范围广、发生数量相对较少,害虫尚未对当地夏熟作物造成直接经济损失的情况下,实施用药防治或兼治,效果非常有限,并存在虫源控制不彻底、防治效果
诱发害虫抗药性等问题。从而导致近年来灰飞虱与水稻不理想、
条纹叶枯病连年大流行。
1.1虫源控制不彻底。灰飞虱是传播条纹叶枯病的唯一毒源,有众多的越冬场所和寄生。2008年3月中旬,据某县农业技术推广服务中心对不同类型的90块田调查,越冬灰飞虱虫量平
其中麦田、油菜田、冬闲农田、农田周边杂均1.37万头/667m2,
草上的灰飞虱虫量分别为0.69、3.55、0.96、0.62万头/667m2。近
油菜等夏熟作物种植面积约31.8万亩,分年来,该地区的麦子、
别占耕地面积、水稻面积的48.9%、79.5%。在越冬代与一代灰飞虱防治期间,如以麦田、油菜田灰飞虱为主攻对象,即使都用药
油菜田实际没有用药防治。在近防治,仍有20%~50%的麦田、
年灰飞虱发生基数大、带毒率高的情况下,2006~2008年据该县植保站调查,越冬代灰飞虱虫量分别为1.37、1.23、1.88万头/667m2,2006~2008年该县灰飞虱平均带毒率分别为16.8%、16.6%、19.6%,从以上数据分析,这些未经用药防治农田中存在的灰飞虱虫源,迁入水稻田后仍足够引起条纹叶枯病大流行,导
致水稻严重受害。
1.2防治效果不理想。目前很多地方主要通过结合防治麦子赤霉病、油菜菌核病来防治或兼治麦田、油菜田灰飞虱,只有当麦田灰飞虱虫量特别大的情况下,才对害虫组织专门防治。但近年来因麦田病虫害发生轻、油菜防治菌核病难度大等原因,广大
油菜病虫害的防治,因而对灰飞虱的防治农民普遍放弃对麦子、
达不到预期效果。此外,在实际防(兼)治麦田、油菜田灰飞虱过程中,由于当时农民注重防治作物的中上部病虫害(赤霉病、穗蚜、菌核病),以及农作物处于生长后期,植株较高,下部隐蔽性大,施药后药剂难以达标部位,药效受到明显影响。据上述某县植保站试验结果表明,用药1次,对灰飞虱的防治效果为40%~50%;用药2~3次(生产上实际使用不多),防效达70%~80%。据分析,在现阶段农作物耕作制度与栽培技术条件下,对麦子、油菜等夏熟作物灰飞虱防治1~2次后,预计仍有不少于50%的灰飞虱残留虫量,在夏熟作物收获后向水稻秧田、大田转移,对稻苗进行传毒,造成条纹叶枯病的流行。
1.3抗药性的产生。目前,根据各地有关报道及当地实际情况,防治灰飞虱从麦田开始,到水稻种子处理、苗期至分蘖期,一
多的地方超过8次以上,每次使用纯般需要至少用药5次以上,
药2~49g/667m2;药剂大多数选择以吡虫啉为主要成分的各种单剂或复配套配剂,不仅防治效果降低,而且易诱发灰飞虱抗药性的产生。
2农业措施对水稻条纹叶枯病发生的影响2.1品种抗性
今年我县主栽品种有武香粳14、5356、武育粳3号、南粳41、华粳2号和扬梗9538等。据秧苗期及最终调查,都以武育粳3号发病最重,瘸株率在10%以上,最高达70%;其次是武香粳
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
式(6)中:为第n层权数;Sh2为第n层总体方差;nh为
第n层样本容量;N表示总体容量。
由式(5)可知:,记为:由式(6)可知:,记为:
在给定费用的情况下,为了使得误差减到最小,就要使方差V最小,因为在(2)式的后半部分与样本量无关,所以只
即要使最小。根据要使得V'最小就可以了,
柯西不等式,,且只有在时,即时才成立,这时,V'C'达到了极小值,这就意味着,这时V'C'达到最小。所以最优分配下,。
可见,最优分配的结果既考虑了总体各层的差异,也同时考虑了总体各层内变异程度上的差异和各层内平均调查费用的差异。当层的容量愈大、层内变异程度愈大,层内每调查一个单元的费用愈小,则在该层中抽取的单元应愈多。
3计算时应注意的问题
3.1为了显著性检验,要进行分组研究的每组样本量应该不
少于30个。
3.2对于损耗性的产品质量抽样调查,可以采用较小的样本量。
3.3经过仔细挑选的样本,有时尽管容量不大,却也能十分准确的反映总体特征。
4结论
样本容量的确定过程本质上是费用与精度的权衡过程。在确定抽样方法和样本容量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可操作性,非
经费预算、问卷回收率等,进行综合权衡,达到抽样误差的控制、
一个最优的样本容量的选择。
参考文献:
[1]陈克明,宁震霖.市场调查中样本容量的确定[J].中国统计,2005(3):143-144.
[2]胡屏.决策统计中样本容量的确定[J].太原城市职业学院学报,2005(1):55-56.
[3]张国友.关于抽样调查中样本容量的确定[J].安徽理工大学学报,2003(1):79-
81.
趷趥
2009年第9期
科技经济市场
技术平台
抽样调查中样本容量的计算
李
良
(苏州工业职业技术学院,江苏苏州215104)
摘
通过对区间估计理论的分要:本文主要介绍了简单随机抽样和分层抽样时样本容量的计算方法。在简单随机抽样时,
析,得出此时样本容量与置信水平对应分位点、方差、抽样极限误差有关;而在分层抽样时,通过引入柯西不等式,得出此时
的样本容量与每一层的权数、方差及调查经费有关。本文同时还说明了影响样本的一些重要因素-总体方差、调查经费、估计精度等,并提出了在计算容量时应注意的一些问题。
估计精度;简单随机抽样;分层抽样关键词:样本容量;
中图分类号:O212.1文献标识码:A
一种合理、可行的抽样方案,不仅需要针对调查对象选择适
宜的抽样方法,还应根据调查研究的精度及预算情况来决定样本容量。我们知道,在系统误差确定的条件下,抽样的准确性取决于抽样误差,抽样误差又与样本容量有直接关系。若样本容量过大,会使得实施难度增大,增加经费的开支;而若样本容量过小,可能会影响样本的代表性,使抽样误差增大,影响了调查研究推论的精确性。因此在实际工作中,如何确定样本容量是很重要的。
下面就对两种抽样情况进行分析,讨论如何确定样本容量。1简单随机抽样时样本容量的计算1.1重复抽样
假设(x1,x2,…,xn)是来自于总体的一个简单随机抽样,而总
2
体的期望为μ,方差为σ。
根据中心极限定理,即从正态总体中,随机抽取样本容量为n的样本,则样本均数x服从正态分布。若当n足够大时,即使是从偏态总体中抽样,样本均数x也
方差为的正态分布,即,转化成近似服从期望为μ,
标准正态分布,则有。
根据统计学中区间估计知识可知:
。(1-α为置信水平)
(1)
(4)
1.3影响因素
通过上面两种情况得到的样本容量公式,我们可以发现影响样本容量的因素是:总体标准差σ和极限误差。
(1)总体标准差。总体标准差σ与样本标准差S的关系是
,当样本容量足够大,如大于50时,,S→σ。因
此,事先可以先进行一次大于50人的抽样调查,计算样本标准差,以此来估计总体标准差。
(2)极限误差。在抽样调查中,极限误差的确定可以根据经验和定性分析。可以先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步缩小,反之就逐步扩大,直到该值达到可以导致分析失误的临界状态,这个临界状态就是极限误差。
2分层抽样下样本容量的计算方法
分层抽样是实际工作中最常见的抽样方法之一。分层抽样是指在抽样之前,先将总体按一定的标志划分若干层,然后在各层内独立地进行抽样。在分层抽样中,不仅需要考虑总的样本量在各层中如何分配,而且还要考虑精度和费用如何做到最优化配置。
2.1比例分配在分层抽样中,若各层的抽样比都相同,则称总样本量按比例分配。
由,得:nk=nWh,(其中,nh表示第n层样本容量,Nh表示第n层总体容量,n表示样本容量,N表示总体容量,表示第n层权数,一般事先已知。)
2.2最优分配
在分层随机抽样中,在给定的费用条件下,使估计量的方差达到最小,或在精度要求一定条件下,使总费用最小的各层样本量的分配称为最优分配。在分层随机抽样中,费用函数可能是简单线性的,也可能是其它复杂形式,这里主要考虑简单线性的费用函数:
(5)
式(5)中:C0为固定费用;Ch为在第h层抽取一个单元的平均费用。
根据统计学的有关结论,在估计总体均值时,对给定的各层样本容量nh,估计量的方差为:
(6)
从另一个角度来看。在一定的置信概率条件下,抽样允许的
最大误差称为抽样极限误差,或称允许误差,一般用△表示,而平均数的抽样极限误差就可以用△x来表示。由于总量指标是一个确定的值,抽样指标是围绕总体指标波动的随机变量。那么,抽样指标与总体指标离差的绝对值就是抽样误差的可能范围。抽样均值的极限误差△x可表示为△x=|x-μ|。根据△x的定义可知:
(2)
比较(1)式和(2)式,可以得到:,即:
(3)
1.2不重复抽样
当采用不重复抽样时,x的方差为
。
根据上面的算法
,可得
,即
作者简介:李良(1980-),男,江苏苏州人,助教,主要数学高等数学教育教法研究。
2009年第9期
趥趶
技术平台
科技经济市场
论条纹叶枯病防治存在的问题及其措施
周育成
(阜宁县阜城镇农业技术推广服务中心,江苏阜宁224400)
水稻条纹叶枯病是由灰飞虱传毒危害引起的一种可防而不
可治的病毒病。要控制该病,单靠化学措施很难达到理想的效果,而且化学防治该病须耗用大量的人力、财力,还会造成程度不等的环境污染和农药残留。为了减轻该病的化学防治压力,也为了以后更科学地采取切实有效的农业措施来防控该病,我们有针对性地对影响水稻条纹叶枯病发生的几项农业措施进行了试验、调研、比较和分析。
1条纹叶枯病防治存在的问题在灰飞虱越冬代寄类型多、范围广、发生数量相对较少,害虫尚未对当地夏熟作物造成直接经济损失的情况下,实施用药防治或兼治,效果非常有限,并存在虫源控制不彻底、防治效果
诱发害虫抗药性等问题。从而导致近年来灰飞虱与水稻不理想、
条纹叶枯病连年大流行。
1.1虫源控制不彻底。灰飞虱是传播条纹叶枯病的唯一毒源,有众多的越冬场所和寄生。2008年3月中旬,据某县农业技术推广服务中心对不同类型的90块田调查,越冬灰飞虱虫量平
其中麦田、油菜田、冬闲农田、农田周边杂均1.37万头/667m2,
草上的灰飞虱虫量分别为0.69、3.55、0.96、0.62万头/667m2。近
油菜等夏熟作物种植面积约31.8万亩,分年来,该地区的麦子、
别占耕地面积、水稻面积的48.9%、79.5%。在越冬代与一代灰飞虱防治期间,如以麦田、油菜田灰飞虱为主攻对象,即使都用药
油菜田实际没有用药防治。在近防治,仍有20%~50%的麦田、
年灰飞虱发生基数大、带毒率高的情况下,2006~2008年据该县植保站调查,越冬代灰飞虱虫量分别为1.37、1.23、1.88万头/667m2,2006~2008年该县灰飞虱平均带毒率分别为16.8%、16.6%、19.6%,从以上数据分析,这些未经用药防治农田中存在的灰飞虱虫源,迁入水稻田后仍足够引起条纹叶枯病大流行,导
致水稻严重受害。
1.2防治效果不理想。目前很多地方主要通过结合防治麦子赤霉病、油菜菌核病来防治或兼治麦田、油菜田灰飞虱,只有当麦田灰飞虱虫量特别大的情况下,才对害虫组织专门防治。但近年来因麦田病虫害发生轻、油菜防治菌核病难度大等原因,广大
油菜病虫害的防治,因而对灰飞虱的防治农民普遍放弃对麦子、
达不到预期效果。此外,在实际防(兼)治麦田、油菜田灰飞虱过程中,由于当时农民注重防治作物的中上部病虫害(赤霉病、穗蚜、菌核病),以及农作物处于生长后期,植株较高,下部隐蔽性大,施药后药剂难以达标部位,药效受到明显影响。据上述某县植保站试验结果表明,用药1次,对灰飞虱的防治效果为40%~50%;用药2~3次(生产上实际使用不多),防效达70%~80%。据分析,在现阶段农作物耕作制度与栽培技术条件下,对麦子、油菜等夏熟作物灰飞虱防治1~2次后,预计仍有不少于50%的灰飞虱残留虫量,在夏熟作物收获后向水稻秧田、大田转移,对稻苗进行传毒,造成条纹叶枯病的流行。
1.3抗药性的产生。目前,根据各地有关报道及当地实际情况,防治灰飞虱从麦田开始,到水稻种子处理、苗期至分蘖期,一
多的地方超过8次以上,每次使用纯般需要至少用药5次以上,
药2~49g/667m2;药剂大多数选择以吡虫啉为主要成分的各种单剂或复配套配剂,不仅防治效果降低,而且易诱发灰飞虱抗药性的产生。
2农业措施对水稻条纹叶枯病发生的影响2.1品种抗性
今年我县主栽品种有武香粳14、5356、武育粳3号、南粳41、华粳2号和扬梗9538等。据秧苗期及最终调查,都以武育粳3号发病最重,瘸株率在10%以上,最高达70%;其次是武香粳
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
式(6)中:为第n层权数;Sh2为第n层总体方差;nh为
第n层样本容量;N表示总体容量。
由式(5)可知:,记为:由式(6)可知:,记为:
在给定费用的情况下,为了使得误差减到最小,就要使方差V最小,因为在(2)式的后半部分与样本量无关,所以只
即要使最小。根据要使得V'最小就可以了,
柯西不等式,,且只有在时,即时才成立,这时,V'C'达到了极小值,这就意味着,这时V'C'达到最小。所以最优分配下,。
可见,最优分配的结果既考虑了总体各层的差异,也同时考虑了总体各层内变异程度上的差异和各层内平均调查费用的差异。当层的容量愈大、层内变异程度愈大,层内每调查一个单元的费用愈小,则在该层中抽取的单元应愈多。
3计算时应注意的问题
3.1为了显著性检验,要进行分组研究的每组样本量应该不
少于30个。
3.2对于损耗性的产品质量抽样调查,可以采用较小的样本量。
3.3经过仔细挑选的样本,有时尽管容量不大,却也能十分准确的反映总体特征。
4结论
样本容量的确定过程本质上是费用与精度的权衡过程。在确定抽样方法和样本容量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可操作性,非
经费预算、问卷回收率等,进行综合权衡,达到抽样误差的控制、
一个最优的样本容量的选择。
参考文献:
[1]陈克明,宁震霖.市场调查中样本容量的确定[J].中国统计,2005(3):143-144.
[2]胡屏.决策统计中样本容量的确定[J].太原城市职业学院学报,2005(1):55-56.
[3]张国友.关于抽样调查中样本容量的确定[J].安徽理工大学学报,2003(1):79-
81.
趷趥
2009年第9期