用样本的频率分布总体的分布

2.2.1 用样本的频率分布估计总体的分布

荣成二中 宋海燕

目的要求

通过实例体会分布的意义和作用,在表示数据的过程中,学会列出频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。 教学过程 1.实例引课

为了解某地区女中学生的身体发育情况,不仅要了解其平均身高,还要了解身高在哪个范围内的学生多,哪个范围内的学生少.

为了解某次考试成绩,不仅应知道平均成绩,还应知道90分以上占多少,80分~90分占多少,……,不及格占多少等.

要解决上面的两个问题,需要从总体中得到一个包含大量数据的样本,并且把这些数据形成频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。 2.引出课题:用样本的频率分布估计总体的分布 看下面的例子

某钢铁加工厂生产内径为25.40mm 的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。

下面的数据是一次抽样中的100件钢管的内径尺寸:(幻灯示) .

25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39

上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方图,步骤如下:

(1)计算级差(一组数据中最大值与最小值的差) 25.26-25.24=0.32

(2)决定组距与组数(样本容量不超过100时,组数常分为5~12组) 如果组距定为0.03,那么

级差/组距=0.32/0.03=10 2/3

于是应将样本数据分成11组(组距还可以定为其他的数值) (3)决定分点

将第1组的起点定为25.235,组距为0.03,这样所分的11个组是:[25.235,25.265[]25.265,25.295]……

(4)列频率分布表

分组 25.235~25.265 25.265~25.295 25.295~25.325 25.325~25.355 25.355~25.385 25.385~25.415 25.415~25.445 25.445~25.475 25.475~25.505 25.505~25.535 25.535~25.565

合计

个数累计

1 2 5 12 18 25 16 13 4 2 2 100

频数 1 2 5 12 18 25 16 13 4 2 2 100

频率 0.01 0.02 0.05 0.12 0.18 0.25 0.16 0.13 0.04 0.02 0.02 1.00

(5)绘制频率分布直方图

注:(1)小长方形的面积=组距×频率/组距=频率

各长方形的面积总和等于1

(2)从频率分布表或频率分布直方图容易看出,优等品所占的比例等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。 (3)用样本的频率分布估计总体的分布时,要使样本能够很好的反映总体的特性,必须随机抽样。由于抽样的随机性,可以想到,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。

(4)从频率分布直方图可以清楚的看出数据分布的总体态势,但是直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

3.频率分布折线图

把频率分布直方图各个长方形上边的中点用线段连接起来,就得到分布折线图。

4.总体密度曲线

频率分布直方图表明了所抽取的100件产品中,尺寸落在各个小组内的频率大小.样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,则频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.它反映了总体在各个范围内取值的概率.总体密度曲线能够更好的反映总体在各个范围内的百分比,能够提供更准确的信息。根据这条曲线,可求出总体在区间(a,b) 内取值的概率等于总体密度曲线,直线x=a,x=b及x 轴所围图形的面积.

5.茎叶图

常用的统计图表还有茎叶图,下面的例子就是用茎叶图表示数据。 例:某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:

甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。 乙的得分:8,13,14,16,23,26,28,33,38,39,51。

甲 52 54 97661

1 94

0 1 2 3 4 5

乙 8 346 368 38

注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数字

从上面这个茎叶图上可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26。因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好。

用茎叶图表示数据有两个突出的优点,一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛是随时记录,方便记录与表示。但茎叶图只便于表示两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个以上的记录),但没有表示两个记录那么直观、清晰。

6.课堂练习

1) 、对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( ) (A )频率分布直方图与总体密度曲线无关 (B )频率分布直方图就是总体密度曲线

(C )样本容量很大的频率分布直方图就是总体密度曲线

(D )如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线

2) 、在用样本频率估计总体分布的过程中,下列说法中正确的是( ) (A )总体容量越大,估计越精确 (B )总体容量越小,估计越精确 (C )样本容量越大,估计越精确 (D )样本容量越小,估计越精确

3) 、10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的( )

(A )频数 (B )概率 (C )频率 (D )累计频率

4) 、已知样本:

12 7 11 12 11 12 10 10 9 8 13 12 10 9 6 11 8 9 8 10那么频率为0.25的样本的范围是( ) (A )

(B )

(C )

(D )

5) 、频率分布直方图中,小长方体的面积等于( )

(A )相应各组的频数 (B )相应各组的频率 (C )组数 (D )组距

6) 、在总体密度曲线中,总体在区间(a ,b )内取值的概率就是直线______、_______、_______和总体密度曲线围成的图形的面积.

7) 、对100位大学毕业生在该年七月份求职录取情况调查结果如下:20人录取在行政机关,31人录取在公司,3人录取在银行,18人录取在学校,其余的还在求职中. 那么七月份这100位大学生还未被录取的概率为_______________.

8) 、一个容量为n 的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______________. 9)

(1)完成上面的频率分布表.

(2)根据上表,画出频率分布直方图.

(3)根据上表,估计数据落在[10.95,11.35) 范围内的概率约为多少? 解:(1)(2)略.

(3)数据落在[10.95,11.35]范围的频率为0.13+0.16十0.26+0.20 落在[10.95,11.35]内的概率约为0.75. 10)教科书第67页练习B 第2、3题. 7.归纳小结

①获得样本的频率分布的步骤:

(1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.

8.布置做业

教科书第69页练习A 第3、4题

2.2.1 用样本的频率分布估计总体的分布

荣成二中 宋海燕

目的要求

通过实例体会分布的意义和作用,在表示数据的过程中,学会列出频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。 教学过程 1.实例引课

为了解某地区女中学生的身体发育情况,不仅要了解其平均身高,还要了解身高在哪个范围内的学生多,哪个范围内的学生少.

为了解某次考试成绩,不仅应知道平均成绩,还应知道90分以上占多少,80分~90分占多少,……,不及格占多少等.

要解决上面的两个问题,需要从总体中得到一个包含大量数据的样本,并且把这些数据形成频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。 2.引出课题:用样本的频率分布估计总体的分布 看下面的例子

某钢铁加工厂生产内径为25.40mm 的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。

下面的数据是一次抽样中的100件钢管的内径尺寸:(幻灯示) .

25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39

上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方图,步骤如下:

(1)计算级差(一组数据中最大值与最小值的差) 25.26-25.24=0.32

(2)决定组距与组数(样本容量不超过100时,组数常分为5~12组) 如果组距定为0.03,那么

级差/组距=0.32/0.03=10 2/3

于是应将样本数据分成11组(组距还可以定为其他的数值) (3)决定分点

将第1组的起点定为25.235,组距为0.03,这样所分的11个组是:[25.235,25.265[]25.265,25.295]……

(4)列频率分布表

分组 25.235~25.265 25.265~25.295 25.295~25.325 25.325~25.355 25.355~25.385 25.385~25.415 25.415~25.445 25.445~25.475 25.475~25.505 25.505~25.535 25.535~25.565

合计

个数累计

1 2 5 12 18 25 16 13 4 2 2 100

频数 1 2 5 12 18 25 16 13 4 2 2 100

频率 0.01 0.02 0.05 0.12 0.18 0.25 0.16 0.13 0.04 0.02 0.02 1.00

(5)绘制频率分布直方图

注:(1)小长方形的面积=组距×频率/组距=频率

各长方形的面积总和等于1

(2)从频率分布表或频率分布直方图容易看出,优等品所占的比例等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。 (3)用样本的频率分布估计总体的分布时,要使样本能够很好的反映总体的特性,必须随机抽样。由于抽样的随机性,可以想到,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。

(4)从频率分布直方图可以清楚的看出数据分布的总体态势,但是直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

3.频率分布折线图

把频率分布直方图各个长方形上边的中点用线段连接起来,就得到分布折线图。

4.总体密度曲线

频率分布直方图表明了所抽取的100件产品中,尺寸落在各个小组内的频率大小.样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,则频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.它反映了总体在各个范围内取值的概率.总体密度曲线能够更好的反映总体在各个范围内的百分比,能够提供更准确的信息。根据这条曲线,可求出总体在区间(a,b) 内取值的概率等于总体密度曲线,直线x=a,x=b及x 轴所围图形的面积.

5.茎叶图

常用的统计图表还有茎叶图,下面的例子就是用茎叶图表示数据。 例:某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:

甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。 乙的得分:8,13,14,16,23,26,28,33,38,39,51。

甲 52 54 97661

1 94

0 1 2 3 4 5

乙 8 346 368 38

注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数字

从上面这个茎叶图上可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26。因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好。

用茎叶图表示数据有两个突出的优点,一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛是随时记录,方便记录与表示。但茎叶图只便于表示两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个以上的记录),但没有表示两个记录那么直观、清晰。

6.课堂练习

1) 、对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( ) (A )频率分布直方图与总体密度曲线无关 (B )频率分布直方图就是总体密度曲线

(C )样本容量很大的频率分布直方图就是总体密度曲线

(D )如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线

2) 、在用样本频率估计总体分布的过程中,下列说法中正确的是( ) (A )总体容量越大,估计越精确 (B )总体容量越小,估计越精确 (C )样本容量越大,估计越精确 (D )样本容量越小,估计越精确

3) 、10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的( )

(A )频数 (B )概率 (C )频率 (D )累计频率

4) 、已知样本:

12 7 11 12 11 12 10 10 9 8 13 12 10 9 6 11 8 9 8 10那么频率为0.25的样本的范围是( ) (A )

(B )

(C )

(D )

5) 、频率分布直方图中,小长方体的面积等于( )

(A )相应各组的频数 (B )相应各组的频率 (C )组数 (D )组距

6) 、在总体密度曲线中,总体在区间(a ,b )内取值的概率就是直线______、_______、_______和总体密度曲线围成的图形的面积.

7) 、对100位大学毕业生在该年七月份求职录取情况调查结果如下:20人录取在行政机关,31人录取在公司,3人录取在银行,18人录取在学校,其余的还在求职中. 那么七月份这100位大学生还未被录取的概率为_______________.

8) 、一个容量为n 的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______________. 9)

(1)完成上面的频率分布表.

(2)根据上表,画出频率分布直方图.

(3)根据上表,估计数据落在[10.95,11.35) 范围内的概率约为多少? 解:(1)(2)略.

(3)数据落在[10.95,11.35]范围的频率为0.13+0.16十0.26+0.20 落在[10.95,11.35]内的概率约为0.75. 10)教科书第67页练习B 第2、3题. 7.归纳小结

①获得样本的频率分布的步骤:

(1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.

8.布置做业

教科书第69页练习A 第3、4题


相关内容

  • 用样本估计总体教案
  • 2.2.1用样本的频率分布估计总体分布 一.教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用. (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图. (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计. 2.过程与方法目标: 通过对现实生活的探究,感知应用 ...

  • 用样本估计总体及线性相关关系
  • 用样本估计总体及线性相关关系 一.[课标要求] 1.用样本估计总体 ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表.画频率分布直方图.频率折线图.茎叶图,体会他们各自的特点: ②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差:③能根据实际问题的需求合理地选取样本 ...

  • 第19讲用样本估计总体及线性相关关系
  • <新课标>高三数学第一轮复习单元讲座 -用样本估计总体及线性相关关系 一.课标要求: 1.用样本估计总体 ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表.画频率分布直方图.频率折线图.茎叶图,体会他们各自的特点: ②通过实例理解样本数据标准差的意义和作用,学会计 ...

  • 基本统计方法
  • 基本统计方法 3.1总体和样本 知识梳理 1. 总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个成员 叫做个体. 总体的情况可用数据表表示,也可用各种图表表示,有条形图.线形图.频数图.圆形(饼)图和散点图等等. (1)总体平均数:设总体有N 个个体,它们的值分别为 ,则总体平 ...

  • 随机抽样.用样本估计总体及线性相关关系
  • 二.课标要求: 1.能从现实生活或其他学科中提出具有一定价值的统计问题: 2.结合具体的实际问题情境,理解随机抽样的必要性和重要性: 3.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本:通过对实例的分析,了解分层抽样和系统抽样方法: 4.能通过试验.查阅资料.设计调查问卷等方法收 ...

  • 用样本估计总体
  • 用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)(3) (4)列频率分布表. (5)2.频率分布折线图和总体密度曲线 (1)频率分布折线图:就得到频率分布折线图. (2)线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶 ...

  • 人教版高中数学A版必修三 第二章统计导学案
  • 数学必修3 第二章 统计 第二章 统计 §2.1随机抽样 §2.1.1简单随机抽样 [学习目标] 1.理解简单随机抽样的概念. 2.掌握常见的两种简单随机抽样的方法. 3.能合理地从实际问题的个体中抽取样本. [学习重点]真确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤 [学习难点]能灵活应用 ...

  • 样本估计总体(频率分布直方图)
  • 1.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s 甲,s 乙, s 丙分别表示他们测试成绩的标准差,则( ) A .s 甲<s 乙<s 丙 B .s 甲<s 丙<s 乙 C .s 乙<s 甲<s 丙 D . ...

  • 54用样本估计总体
  • 用样本估计总体 一.考点梳理 1.频率分布直方图 (1)作频率分布直方图的步骤 ①求极差(即一组数据中最大值与最小值的差) :②决定组距与组数:③将数据分组: ④列频率分布表:⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频 ...