9512.net
甜梦文库
当前位置:首页 >> 数学 >>

20100913高二数学(2.2.1用样本的频率分布估计整体分布(1))



高中数学必修3第二章 统 计
2.2 用样本估计总体

温故知新

随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样.

抽样收集 数据

分析样本 数据

对总体 作出估计

对 总 体 作 出 估 计

样本的频率分布估计 总体的分布

用样本的数字特征(如平 均数,标准差等)估计总体 的数字特征

2.2.1 用样本的频率分布估 计总体分布

新知探究

【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 那么a定为多少比较合理呢?你认为,为 了较为合理地确定出这个标准,需要做 那些工作?

100位居民的月均用水量(单位4:t)
3.1 1.6 0.3 1.5 3.6 1.4 1.9 2.3 2.4 2.6 2.8 2.2 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6

用图将他们 画出来

分 析 数 据

频率分布表 频率分布直方图
用紧凑的表格 改变数据排列 的方式

茎叶图

频率分布表
(1)求极差(一组数据中的最大值与 最小值的差) (2)决定组距与组数. (设k=极差÷组距,若k为整数,则组 数=k,否则,组数=k+1) (3)确定分点,将数据分组.

(4)统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)

频率分布表
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计 频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100 频数累计 频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00

频率分布表
从100位居民均用水量的频率分布表, 如果市政府希望85%左右的居民每月的用 你能得出什么信息? 水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议? 在实际中,取a=3t一定能保证85%以上的 居民用水不超标吗?
(在实践中,对统计结论是需要进行评价的)

分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.

探究规律

频率分布直方图

第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点, 在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与 组距的商为高,分别画出各组对应的 小长方形.

频率分布直方图
频率 组距

宽度:组距
高度:
频率 组距

0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

各组的频率在图中那里显示出来? 各小长方形的面积=频率 各小长方体的小面积之和是否为定值 各小长方形的面积之和=1

频率 组距 0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

你能根据上述频率分布直方图指出居 民月均用水量的一些数据特点吗?

(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的; (2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.

频率分布直方图非常直观地表明了 样本数据的分布情况,使我们能够看 到频率分布表中看不太清楚的数据模式, 但原始数据不能在图中表示出来.

对一组给定的样本数据,频率分布 直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,以1为 组距的频率分布直方图
0.4 0.3 0.2 0.1
O 频率 组距

1

2

3

4

5 月均用水量/t

理论迁移

例 某地区为了了解知识分子的 年龄结构,随机抽样50名,其年龄 分别如下:

42,38,29,36,41,43,54,43, 34,44,40,59,39,42,44,50, 37,44,45,29,48,45,53,48, 37,28,46,50,37,44,42,39, 51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43, 46,58.
(1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的 比例约是多少.

(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00

(2)样本频率分布直方图:
频率 组距

0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄

(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.

小结作业

1.频率分布是指一个样本数据在各个小范围 内所占比例的大小,总体分布是指总体取值 的频率分布规律.我们通常用样本的频率分 布表或频率分布直方图去估计总体的分布.

2.频率分布表和频率分布直方图,是对相同 数据的两种不同表达方式.用紧凑的表格改变 数据的排列方式和构成形式,可展示数据的 分布情况.通过作图既可以从数据中提取信息, 又可以利用图形传递信息.

3.样本数据的频率分布表和频率分布直方 图,是通过各小组数据在样本容量中所占 比例大小来表示数据的分布规律,它可以 让我们更清楚的看到整个样本数据的频率 分布情况,并由此估计总体的分布情况.

作业: 《学海》第4课时



更多相关文章:
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图