基本统计方法
3.1总体和样本
知识梳理
1. 总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个成员
叫做个体. 总体的情况可用数据表表示,也可用各种图表表示,有条形图、线形图、频数图、圆形(饼)图和散点图等等. (1)总体平均数:设总体有N 个个体,它们的值分别为
,则总体平均数
.
(2)总体中位数:将N 个个体从小到大排列,如果N 为奇数,则位于正中位置的数叫做总体中位数;如果N 为偶数,位于该数列正中位置的两个数的平均数叫做总体中位数. (3)总体方差:
(4)总体标准差:
2. 样本:从总体中抽出的一部分个体所组成的集合叫做样本(也叫做子样),样本中所含个体的个数叫做样本容量,抽取样本的过程叫做抽样. (1)样本平均数:设样本中有个元素,分别为
,则样本平均数
.
(2) 样本中位数:将个样本从小到大排列,如果为奇数,则位于该数列正中位置的数叫做样本中位数;如果为偶数,位于该数列正中位置的两个数的平均数叫做样本中位数.
(3)样本方差:
(4)样本标准差:例题点拨
【例1】已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5。若要使该总体的方差最小,则
的取值分别是 .
〖思路分析〗本题考查中位数、方差的意义, 会用相关公式分析问题、解决问题.
〖解〗由中位数意义,可知,依题意,总体中个体的数量为,
∴总体平均数,
于是总体方差当且仅当
时等号成立。所以
。
,
事实上方差是描述全体数据偏离平均值的程度的量,要使方差最小,只须各数据大小应尽可能地接近,故
.
的关系,因为总体的平均值是常数,要使方
〖点评〗本题关键是建立总体的方差关于差最小,只要
最小,其实本题如果理解了方差的本质,根本无需求最小值,而只需
要找到方差最小时的条件即可。
【例2】某居民小区所有263户家庭族人口数分组列表如下:
求总体平均数,总体中位数,总体方差和标准差.
〖思路分析〗该题通过表格给出总体中各个体的数值,即家庭人口数数,从中可知,如果将263户家庭的人口数从小到大排列,可得数列:
共263个个体数值,由此根据各统计量的定义求解.
〖解〗(1)总体平均数,即平均每户家庭人口数为 人.
(2)N=263是奇数,,
那么132为数列的正中位置.
因为,
所以第132个数属于每户4人的那个组. 故总体中位数
(3)总体方差:
(4)总体标准差:
〖点评〗求中位数时注意先将
.
按从小到大的顺序排成一数列,总体的个体是偶
数或奇数,再根据中位数的定义求解. 本题中的中位数,并不是表格中间位置上的数“5”和“6
”的平均数,这是最容易错的地方;至于方差和标准差的计算,可直接在计算器上输入
,利用计算器的功能求出.
3.2抽样技术
知识梳理
1. 简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为的样本时,每次抽取一个
个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等, 是不放回抽样. ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 2. 抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.
适用范围:总体的个体数不多时.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
3. 随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.
4. 系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样.
5. 分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
6. 常用的抽样方法及它们之间的联系和区别:
7. 不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样. 例题点拨
【例1】在下列问题中,各采用什么抽样方法抽取样本较为妥当? (1) 从30件产品中抽取5件进行质量检验;
(2) 某文化宫共有35排座位,每排有42个座位(座位号为1~42),一次报告会坐满
了听众,会后为听取意见留下了所有座位号为13的35名听众进行座谈; (3) 某公司有200名员工,其中有业务人员135人,管理人员25人,后勤服务人员40
人,从中抽取一个容量为5的样本. 〖思路分析〗本题考察随机抽样的有关概念,每一选项须仔细斟酌、辨别. 〖解〗 (1)总体中个体数较小,采用简单随机抽样较为妥当.
(2)因为总体中个数较多,又是“等距离”抽取,所以采用系统抽样较为妥当. (3)因为总体中个体差异较大,所以采用分层抽样较为妥当.
〖点评〗 本例虽小,但其中概念性很强,尤其第3小题,使用分层抽样,最敏感的字就是“层”,它源于“样本”差异,差异大了,就要考虑分层了.
【例2】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点. 公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②. 则完成①、②这两项调查宜采用的抽样方法依次是( )
A. 分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C. 系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
〖思路分析〗此题为抽样方法的选取问题. 当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
〖解〗依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法. 故选B.
答案:B
〖点评〗采用什么样的抽样方法要依据研究的总体中的个体情况来定.
【例3】一个总体中有100个个体,随机编号为0,1,2,„,99,依编号顺序平均分成10个小组,组号依次为1,2,3,„,10. 现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同. 若m =6,则在第7组中抽取的号码是___________.
〖思路分析〗此问题总体中个体的个数较多,因此采用系统抽样. 按题目中要求的规则抽取即可.
〖解〗∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63.
答案:63
〖点评〗当总体中个体个数较多而差异又不大时可采用系统抽样. 采用系统抽样在每小组内抽取时应按规则进行.
【例4】某高级中学共有学生2000名,各年级男、女生人数如右表:已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.19. (1)求x 的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在高三年级抽取多少名? (3)已知的概率.
,
,求高三年级中女生比男生多
〖思路分析〗本题考查简单统计知识的应用,考查概率的意义、分层抽样方法及其运算。属于中等难度题。
〖解〗(1)由,解得.
(2)只要求出高三年级人数即可,由(1)知二年级的女生有380人,那么三年级的学生的人数应该是
,设应在高三年级抽取m 人,则
,解得. 答: 应在高三年级抽取12名.
,高三年级女生和男生数记为数对
,则基本事件总数有:
,
(3)设高三年级女生比男生多的事件为由(2)知
共11个,而事件包含的基本事
件有:共5个,∴
〖点评〗本题要注意到分层抽样的实质就是按比例抽样. 关键是基本概念和运算要熟练. 要善于通过文字、表格等判断题中的各种有效信息.
3.3. 统计估计
知识梳理
1. 用样本的频率分布估计总体分布
(1)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率. 所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布. 可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.
(2)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
(3)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线, 这条曲线叫做总体密度曲线. 2. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数,叫做这组数据的众数. 有时,有两个或几个数据出现的最多,且出现的次数一样,这些数据都是这组数据的众数. 一组数据中,每个数据出现的次数一样多,认为这组数据没有众数.
中位数:将一组数据从小到大的顺序排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数是这组数据的中位数. 平均数:一组数据的总和除以数据的个数所得的商叫做平均数,
记作
(2)方差与标准差
.
用样本的标准差计值. 例题点拨
作为总体标准差的点估
【例1】为了估计水库中鱼的尾数,可以使用以下方法:先从水库中捕出一定数量的鱼,如2000尾,给每尾鱼做上记号,然后放回水库,经过适当的时间,让其充分混合,再从水库中捕出一定数量的鱼,如500尾,查看其中有记号的鱼有40尾,试根据上述数据,估计水库中鱼的尾数。
〖思路分析〗利用“捕到一尾鱼有记号”,这一随机事件出现的概率在同一水域的同一时刻、同一地点是恒值来估计水库内鱼的尾数。
〖解〗设水库内鱼的尾数为N ,由于每尾鱼被捕到的可能性是一样的,记事件A 为“捕到一
尾鱼有记号”,于是,,则
。
〖点评〗抽签法就是把总体中的N 个个体编号,把号码写在标签上,将标签放在一个容器里,连续抽取次,就得到一个容量为的样本.
【例2】有一容量为50的样本,数据的分组及各组的频率数如下
[10,15]4 [30,359 [15,205 [35,408
[20,2510 [40,453 [25,3011 (1)列出样本的频率分布表(含累积频率) ; (2)画出频率分布直方图和累积频率的分布图
〖思路分析〗本题主要考查频率分布表,频率分布直方图和累积频率的分布图的画法 解答本题时,计算容易出现失误,且要注意频率分布与累积频率分布的区别 〖解〗 (1)由所给数据,计算得如下频率分布表
(2)频率分布直方图与累积频率分布图如下
〖点评〗本题关键在于掌握三种表格的区别与联系.
3.4应用与拓展
例题点拨
【例1】某工厂A 、B 两个车间包装同一种产品,在自动传送带上每隔30分钟抽一包产品,称其重量是否合格,分别记录抽查结果如下: A 车间:102,101,99,103,98,99,98. B 车间:110,115,90,85,75,115,110. (1) 这种抽样是何种抽样方法?
(2) 估计A 、B 两车间的均值与方差,并说明哪个车间产品较稳定? 〖思路分析〗应用精义判断抽样方法,计算均值、方差,进行比较,得出结论. 〖解〗 (1)由定义知,这是系统抽样方法.
(2)
由于〖点评〗在
,,故A 车间产品较B 车间稳定. 时,还需进一步求
,从而得到结论,不能被假象所迷惑.
【例2】在120个零件中,一级品24个 , 二级品36个,三级品60个,从中抽取一个容量为20个的样本,分别用三种方法抽样,计算总体中每个个体被抽取的概率,比较这些概率之间的关系.
〖思路分析〗分别用简单随机抽样法、系统抽样法、分层抽样法来抽取,计算出每个个体抽到的概率.
〖解〗(1)采用简单随机抽样法(抽签法). 每个个体被抽取的概率为.
(2)系统抽样法. 将120个零件分成20组,每组6个零件,每组取1个,每个个体被抽取
的概率为.
(3)分层抽样法. 一、二、三级品之比为,.
分别从一、二、三级品中抽取4个,6个,10个,每个个体被抽到的概率分别为,,
,即都是. 所以无论采用哪一种抽样方法,总体的每一个个体被抽到的概率都是.
〖点评〗三种抽样方法是相互联系又有所差异,不可混淆. 对于有关问题,应准确领会各种抽样方法的含义,根据具体问题特点,灵活选择相应的抽样方法.
【例3】对某电子元件进行寿命追踪调查,情况如下:
(1)列出频率分布表;
(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h以内的概率; (4)估计电子元件寿命在400 h以上的概率.
〖思路分析〗通过本题可掌握总体分布估计的各种方法和步骤. 〖解〗(1)频率分布表如下:
(2)频率分布直方图如下:
(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.
(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.
〖点评〗画频率分布条形图、直方图时要注意纵、横坐标轴的意义.
分享:
喜欢 0
赠金笔
阅读(57)┊ 评论 (0)┊ 收藏(0) ┊转载(4) ┊ 喜欢▼ ┊打印┊举报 已投稿到: 排行榜
前一篇:热点问题3(2):概率论初步
后一篇:热点问题3(4):矩阵、行列式和算法初步
评论 重要提示:警惕虚假中奖信息
[发评论]
发评论
qjy43 : 做第一个评论者吧! 抢沙发>>
基本统计方法
3.1总体和样本
知识梳理
1. 总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个成员
叫做个体. 总体的情况可用数据表表示,也可用各种图表表示,有条形图、线形图、频数图、圆形(饼)图和散点图等等. (1)总体平均数:设总体有N 个个体,它们的值分别为
,则总体平均数
.
(2)总体中位数:将N 个个体从小到大排列,如果N 为奇数,则位于正中位置的数叫做总体中位数;如果N 为偶数,位于该数列正中位置的两个数的平均数叫做总体中位数. (3)总体方差:
(4)总体标准差:
2. 样本:从总体中抽出的一部分个体所组成的集合叫做样本(也叫做子样),样本中所含个体的个数叫做样本容量,抽取样本的过程叫做抽样. (1)样本平均数:设样本中有个元素,分别为
,则样本平均数
.
(2) 样本中位数:将个样本从小到大排列,如果为奇数,则位于该数列正中位置的数叫做样本中位数;如果为偶数,位于该数列正中位置的两个数的平均数叫做样本中位数.
(3)样本方差:
(4)样本标准差:例题点拨
【例1】已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5。若要使该总体的方差最小,则
的取值分别是 .
〖思路分析〗本题考查中位数、方差的意义, 会用相关公式分析问题、解决问题.
〖解〗由中位数意义,可知,依题意,总体中个体的数量为,
∴总体平均数,
于是总体方差当且仅当
时等号成立。所以
。
,
事实上方差是描述全体数据偏离平均值的程度的量,要使方差最小,只须各数据大小应尽可能地接近,故
.
的关系,因为总体的平均值是常数,要使方
〖点评〗本题关键是建立总体的方差关于差最小,只要
最小,其实本题如果理解了方差的本质,根本无需求最小值,而只需
要找到方差最小时的条件即可。
【例2】某居民小区所有263户家庭族人口数分组列表如下:
求总体平均数,总体中位数,总体方差和标准差.
〖思路分析〗该题通过表格给出总体中各个体的数值,即家庭人口数数,从中可知,如果将263户家庭的人口数从小到大排列,可得数列:
共263个个体数值,由此根据各统计量的定义求解.
〖解〗(1)总体平均数,即平均每户家庭人口数为 人.
(2)N=263是奇数,,
那么132为数列的正中位置.
因为,
所以第132个数属于每户4人的那个组. 故总体中位数
(3)总体方差:
(4)总体标准差:
〖点评〗求中位数时注意先将
.
按从小到大的顺序排成一数列,总体的个体是偶
数或奇数,再根据中位数的定义求解. 本题中的中位数,并不是表格中间位置上的数“5”和“6
”的平均数,这是最容易错的地方;至于方差和标准差的计算,可直接在计算器上输入
,利用计算器的功能求出.
3.2抽样技术
知识梳理
1. 简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为的样本时,每次抽取一个
个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等, 是不放回抽样. ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 2. 抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.
适用范围:总体的个体数不多时.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
3. 随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.
4. 系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样.
5. 分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
6. 常用的抽样方法及它们之间的联系和区别:
7. 不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样. 例题点拨
【例1】在下列问题中,各采用什么抽样方法抽取样本较为妥当? (1) 从30件产品中抽取5件进行质量检验;
(2) 某文化宫共有35排座位,每排有42个座位(座位号为1~42),一次报告会坐满
了听众,会后为听取意见留下了所有座位号为13的35名听众进行座谈; (3) 某公司有200名员工,其中有业务人员135人,管理人员25人,后勤服务人员40
人,从中抽取一个容量为5的样本. 〖思路分析〗本题考察随机抽样的有关概念,每一选项须仔细斟酌、辨别. 〖解〗 (1)总体中个体数较小,采用简单随机抽样较为妥当.
(2)因为总体中个数较多,又是“等距离”抽取,所以采用系统抽样较为妥当. (3)因为总体中个体差异较大,所以采用分层抽样较为妥当.
〖点评〗 本例虽小,但其中概念性很强,尤其第3小题,使用分层抽样,最敏感的字就是“层”,它源于“样本”差异,差异大了,就要考虑分层了.
【例2】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点. 公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②. 则完成①、②这两项调查宜采用的抽样方法依次是( )
A. 分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C. 系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
〖思路分析〗此题为抽样方法的选取问题. 当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
〖解〗依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法. 故选B.
答案:B
〖点评〗采用什么样的抽样方法要依据研究的总体中的个体情况来定.
【例3】一个总体中有100个个体,随机编号为0,1,2,„,99,依编号顺序平均分成10个小组,组号依次为1,2,3,„,10. 现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同. 若m =6,则在第7组中抽取的号码是___________.
〖思路分析〗此问题总体中个体的个数较多,因此采用系统抽样. 按题目中要求的规则抽取即可.
〖解〗∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63.
答案:63
〖点评〗当总体中个体个数较多而差异又不大时可采用系统抽样. 采用系统抽样在每小组内抽取时应按规则进行.
【例4】某高级中学共有学生2000名,各年级男、女生人数如右表:已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.19. (1)求x 的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在高三年级抽取多少名? (3)已知的概率.
,
,求高三年级中女生比男生多
〖思路分析〗本题考查简单统计知识的应用,考查概率的意义、分层抽样方法及其运算。属于中等难度题。
〖解〗(1)由,解得.
(2)只要求出高三年级人数即可,由(1)知二年级的女生有380人,那么三年级的学生的人数应该是
,设应在高三年级抽取m 人,则
,解得. 答: 应在高三年级抽取12名.
,高三年级女生和男生数记为数对
,则基本事件总数有:
,
(3)设高三年级女生比男生多的事件为由(2)知
共11个,而事件包含的基本事
件有:共5个,∴
〖点评〗本题要注意到分层抽样的实质就是按比例抽样. 关键是基本概念和运算要熟练. 要善于通过文字、表格等判断题中的各种有效信息.
3.3. 统计估计
知识梳理
1. 用样本的频率分布估计总体分布
(1)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率. 所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布. 可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.
(2)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
(3)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线, 这条曲线叫做总体密度曲线. 2. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数,叫做这组数据的众数. 有时,有两个或几个数据出现的最多,且出现的次数一样,这些数据都是这组数据的众数. 一组数据中,每个数据出现的次数一样多,认为这组数据没有众数.
中位数:将一组数据从小到大的顺序排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数是这组数据的中位数. 平均数:一组数据的总和除以数据的个数所得的商叫做平均数,
记作
(2)方差与标准差
.
用样本的标准差计值. 例题点拨
作为总体标准差的点估
【例1】为了估计水库中鱼的尾数,可以使用以下方法:先从水库中捕出一定数量的鱼,如2000尾,给每尾鱼做上记号,然后放回水库,经过适当的时间,让其充分混合,再从水库中捕出一定数量的鱼,如500尾,查看其中有记号的鱼有40尾,试根据上述数据,估计水库中鱼的尾数。
〖思路分析〗利用“捕到一尾鱼有记号”,这一随机事件出现的概率在同一水域的同一时刻、同一地点是恒值来估计水库内鱼的尾数。
〖解〗设水库内鱼的尾数为N ,由于每尾鱼被捕到的可能性是一样的,记事件A 为“捕到一
尾鱼有记号”,于是,,则
。
〖点评〗抽签法就是把总体中的N 个个体编号,把号码写在标签上,将标签放在一个容器里,连续抽取次,就得到一个容量为的样本.
【例2】有一容量为50的样本,数据的分组及各组的频率数如下
[10,15]4 [30,359 [15,205 [35,408
[20,2510 [40,453 [25,3011 (1)列出样本的频率分布表(含累积频率) ; (2)画出频率分布直方图和累积频率的分布图
〖思路分析〗本题主要考查频率分布表,频率分布直方图和累积频率的分布图的画法 解答本题时,计算容易出现失误,且要注意频率分布与累积频率分布的区别 〖解〗 (1)由所给数据,计算得如下频率分布表
(2)频率分布直方图与累积频率分布图如下
〖点评〗本题关键在于掌握三种表格的区别与联系.
3.4应用与拓展
例题点拨
【例1】某工厂A 、B 两个车间包装同一种产品,在自动传送带上每隔30分钟抽一包产品,称其重量是否合格,分别记录抽查结果如下: A 车间:102,101,99,103,98,99,98. B 车间:110,115,90,85,75,115,110. (1) 这种抽样是何种抽样方法?
(2) 估计A 、B 两车间的均值与方差,并说明哪个车间产品较稳定? 〖思路分析〗应用精义判断抽样方法,计算均值、方差,进行比较,得出结论. 〖解〗 (1)由定义知,这是系统抽样方法.
(2)
由于〖点评〗在
,,故A 车间产品较B 车间稳定. 时,还需进一步求
,从而得到结论,不能被假象所迷惑.
【例2】在120个零件中,一级品24个 , 二级品36个,三级品60个,从中抽取一个容量为20个的样本,分别用三种方法抽样,计算总体中每个个体被抽取的概率,比较这些概率之间的关系.
〖思路分析〗分别用简单随机抽样法、系统抽样法、分层抽样法来抽取,计算出每个个体抽到的概率.
〖解〗(1)采用简单随机抽样法(抽签法). 每个个体被抽取的概率为.
(2)系统抽样法. 将120个零件分成20组,每组6个零件,每组取1个,每个个体被抽取
的概率为.
(3)分层抽样法. 一、二、三级品之比为,.
分别从一、二、三级品中抽取4个,6个,10个,每个个体被抽到的概率分别为,,
,即都是. 所以无论采用哪一种抽样方法,总体的每一个个体被抽到的概率都是.
〖点评〗三种抽样方法是相互联系又有所差异,不可混淆. 对于有关问题,应准确领会各种抽样方法的含义,根据具体问题特点,灵活选择相应的抽样方法.
【例3】对某电子元件进行寿命追踪调查,情况如下:
(1)列出频率分布表;
(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h以内的概率; (4)估计电子元件寿命在400 h以上的概率.
〖思路分析〗通过本题可掌握总体分布估计的各种方法和步骤. 〖解〗(1)频率分布表如下:
(2)频率分布直方图如下:
(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.
(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.
〖点评〗画频率分布条形图、直方图时要注意纵、横坐标轴的意义.
分享:
喜欢 0
赠金笔
阅读(57)┊ 评论 (0)┊ 收藏(0) ┊转载(4) ┊ 喜欢▼ ┊打印┊举报 已投稿到: 排行榜
前一篇:热点问题3(2):概率论初步
后一篇:热点问题3(4):矩阵、行列式和算法初步
评论 重要提示:警惕虚假中奖信息
[发评论]
发评论
qjy43 : 做第一个评论者吧! 抢沙发>>