9512.net
甜梦文库
当前位置:首页 >> 数学 >>

2017年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 理_图文

第8讲

统计与统计案例

【命题趋势】 本节在高考中主要考查:1.利用三种抽样方法解决抽 样问题;抽样方法中分层抽样是高考常考点,题型既有选 择题也有填空题, 属容易题. 命题时多以现实生活为背景, 主要考查基本概念及简单计算.2.利用频率分布直方图、 茎 叶图求样本的数据特征,估计总体的数字特征;估计总体 的数字特征是命题的热点 , 多与概率统计相结合出题 .3. 对相关变量进行回归分析和独立性检验; 其考查力度比往 年加大,主要考查独立性检验的意义,多以解答题出现, 难度不大.

【备考建议】 本节考点与实际问题联系紧密, 复习中不能依赖记忆 公式和简单的套用公式解题, 应在充分认识统计方法特点 的基础上,深刻理解回归分析和独立性检验的基本思想、 方法及初步应用,提高阅读能力,找准数学模型,经历较 为系统的数据处理的全过程,培养对数据的直观感觉,另 外还要有意识的提高运算能力.

探究一

抽样方法

例 1 (1)高三某班有学生 56 人,现将所有同学随机编 号,用系统抽样的方法,抽取一个容量为 4 的样本,已知 5 号、33 号、47 号学生在样本中,则样本中还有一个学 生的编号为( ) A.13 B.17 C.19 D.21 【解析】选 C. 用系统抽样方法从 56 名学生中抽取 4 人,则分段间 隔为 14,若第一段抽出的号码为 5,则其它段抽取的号码 应为:19,33,47.

(2)为了研究雾霾天气的治理, 某课题组对部分城市进 行空气质量调查,按地域特点把这些城市分成甲、乙、丙 三组,已知三组城市的个数分别为 4,y,z,依次构成等 差数列,且 4,y,z+4 成等比数列,若用分层抽样抽取 6 个城市,则乙组中应抽取的城市个数为__________.
【解析】2
? ?2y=4+z, 由题意可得? 2 ? ?y =4×(z+4),

z ? ?y=2+ , 2 即? 解得 z=12,或 z=-4(舍去), 2 ? y ? =4z+16, 故 y=8.所以甲、乙、丙三组城市的个数分别为 4,8,12. 6 1 因为一共要抽取 6 个城市,所以抽样比为 = . 4+8+12 4 1 故乙组城市应抽取的个数为 8× =2. 4

【点评】(1)在系统抽样的过程中,要注意分段间隔, 需要抽取几个个体,总体就需要分成几个组,则分段间隔 N 即为 (n 为样本容量),首先确定在第一组中抽取的个体 n 的号码数,再从后面的每组中按规则抽取每个个体. (2)分层抽样中要注意按比例抽取各层次的样本数据, 样本容量与总体的个体数之比是分层抽样的比例常数, 按 这个比例可以确定各层应抽取的个体数与各层原有的人 数,若各层应抽取的个体数不都是整数,则应当先剔除部 分个体,调整总体个数.

探究二

用样本估计总体

例 2 (1)某公司为了解用户对其产品的满意度, 从 A,B 两地区分别随机调查了 40 个用户,根据用户对产品的满 意度评分, 得到 A 地区用户满意度评分的频率分布直方图 和 B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图

B 地区用户满意度评分的频数分布表 满意度评 [50,60) [60,70) [70,80) [80,90) [90, 100] 分分组 频数 2 8 14 10 6 (Ⅰ)在图②中作出 B 地区用户满意度评分的频率分布 直方图,并通过直方图比较两地区满意度评分的平均值及分散 程度(不要求计算出具体值,给出结论即可).

图②

(Ⅱ)根据用户满意度评分,将用户的满意度分为三个 等级: 70 分到 不低于 满意度评分 低于 70 分 89 分 90 分 非常满 满意度等级 不满意 满意 意 估计哪个地区用户的满意度等级为不满意的概率 大?说明理由.
【解析】(Ⅰ)B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意度评分比 较集中,而 A 地区用户满意度评分比较分散. (Ⅱ)A 地区用户的满意度等级为不满意的概率大.

解:(Ⅰ)如下图所示.通过两地区用户满意度评分的 频率分布直方图可以看出, B 地区用户满意度评分的平均 值高于 A 地区用户满意度评分的平均值; B 地区用户满意 度评分比较集中,而 A 地区用户满意度评分比较分散.

(Ⅱ)判断:A 地区用户的满意度等级为不满意的概率大. 记 CA 表示事件:“A 地区用户的满意度等级为不满意”;CB 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得 P(CA)的估计值为 (0.01+ 0.02+ 0.03)×10= 0.6, P(CB)的估计值为 (0.005+0.02)×10=0.25.所以 A 地区用户的满意度等级为不满意 的概率大.

(2)某工厂 36 名工人的年龄数据如下表. 工人编号 工人编号 工人编号 工人编号 年龄 年龄 年龄 年龄 1 40 10 36 19 27 28 34 2 44 11 31 20 43 29 39 3 40 12 38 21 41 30 43 4 41 13 39 22 37 31 38 5 33 14 43 23 34 32 42 6 40 15 45 24 42 33 53 7 45 16 39 25 37 34 37 8 42 17 38 26 44 35 49 9 43 18 36 27 42 36 39 (Ⅰ)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在 第一分段里用随机抽样法抽到的年龄数据为 44,列出样本的年龄 数据;(Ⅱ)计算(Ⅰ)中样本的均值 x 和方差 s2; (Ⅲ)36 名工人中年龄在 x -s 与 x +s 之间有多少人?所占的百 分比是多少(精确到 0.01%)?

【解析】(Ⅰ)其年龄数据为:44,40,36,43,36, 100 37,44,43,37.(Ⅱ) .(Ⅲ) 63.89%. 9 解:(Ⅰ)36 人分成 9 组,每组 4 人,其中第一组抽取 的工人年龄为 44, 所以它在组中的编号为 2,所以所有样本数据的编号 为 4n-2(n=1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43, 37. 44+40+…+37 (Ⅱ)由均值公式知: x = =40, 9 1 2 由方差公式知:s = [(44-40)2+(40-40)2+…+(37 9 100 -40)2]= . 9

100 10 (Ⅲ)因为 s = , s= , 9 3 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数等于 年龄在区间[37,43]上的人数, 即 40,40,41,…,39,共 23 人. 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数所占 23 的百分比为 ×100%≈63.89%. 36
2

【点评】 (1)解决与频率分布直方图有关的问题时, 应 正确理解已知数据的含义,掌握图表中各个量的意义,通 过图表对已知数据进行分类. (2)在作茎叶图或读茎叶图时, 首先要弄清楚“茎”和 “叶”分别代表什么,根据茎叶图,我们可方便地求出数 据的众数与中位数, 大体上估计出两组数据平均数的大小 与稳定性的高低.

探究三

回归分析

例 3 一般来说,一个人脚掌越长,他的身高就越高.现 对 10 名成年人的脚掌长 x 与身高 y 进行测量, 得到数据(单位 均为 cm)作为一个样本如表: 脚掌长 20 21 22 23 24 25 26 27 28 29 (x) 身高 141 146 154 160 169 176 181 188 197 203 (y) (1)在上表数据中,以“脚掌长”为横坐标, “身高”为纵 坐标, 作出散点图后, 发现散点在一条直线附近, 试求“身高” 与“脚掌长”之间的线性回归方程^ y =bx+a; (2)若某人的脚掌长为 26.5 cm,试估计此人的身高.

【解析】(1)y=7x;(2)185.5 cm. 解:(1)记样本中 10 人的“脚掌长”为 xi(i=1,2,… 10), “身高”为 yi(i=1,2,…10), x1+x2+…+x10 y1+y2+…+y10 - - ∵x= = 24.5 , y = 10 10
? ? x ? x ?? y
n

=171.5,∴b=

i ?1

i

i

?y
2

?


?? x ? x?
n i ?1 i

577.5 =7,a=- y -b- x =0, 82.5

∴^ y =7x. (2) 由 (2) 知 ^ y = 7x , 当 x = 26.5 时 , ^ y = 7×26.5 = 185.5(cm), 故估计此人的身高为 185.5 cm.

【点评】 已知变量的某个值去预测与其有线性相关关 系的变量的值时,一般先求出回归直线方程 ^ y =^ b x+^ a, 若^ a ,^ b中有一个是已知的,常利用公式^ a =y-^ bx 求另一 个量,再把 x 取值代入回归直线方程^ y =^ bx+^ a 中,求出^ y 的估计值.

探究四

独立性检验

例 4 某新闻媒体为了了解观众对央视《开门大吉》节目 的喜爱与性别是否有关系 , 随机调查了观看该节目的观众 110 名,得到如下的列联表: 女 男 总计 喜爱 40 20 60 20 30 50 不喜爱 总计 60 50 110 试根据样本估计总体的思想,估计约有________的把握 认为“喜爱该节目与否和性别有关”.参考附表: P(K2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 2 n ( ad - bc ) (参考公式:K2= , (a+b)(c+d)(a+c)(b+d) 其中 n=a+b+c+d)

【解析】99% 假设喜爱该节目和性别无关,分析列联表中数据,可 得
2 110 × ( 40 × 30 - 20 × 20 ) K2= ≈7.822>6.635, 60×50×60×50 所以有 99%的把握认为“喜爱《开门大吉》节目与否和 性别有关”.

【点评】独立性检验的具体步骤:第一步,根据题意 确定临界值并作无关假设; 第二步, 找相关数据, 列出 2×2 列联表;第三步,由公式 K2 (其中 n=a+b+c+d)计算出 K2 的观测值; 第四步, 将 K2 的观测值与临界值进行比较, 进而作出推断.

1.进行系统抽样的关键是根据总体和样本的容量确 定分段间隔,根据第一段确定编号.如果总体不能被样本 整除,即每段不能等分,应采用等可能剔除的方法剔除部 分个体,以获得整数间隔. 2.进行分层抽样时应注意以下几点:①分层抽样中 分多少层、如何分层要视具体情况而定,总的原则是:层 内样本的差异要小,两层之间的样本差异要大,且互不重 叠;②为了保证每个个体等可能入样,所有层中每个个体 被抽到的可能性要相同;③在每层抽样时,应采用简单随 机抽样或系统抽样的方法进行抽样.

3.进行线性回归分析时应注意的问题: (1)正确理解计算^ b ,^ a 的公式和准确的计算是求线性 回归方程的关键. (2)在分析两个变量的相关关系时, 可根据样本数据作 出散点图来确定两个变量之间是否具有相关关系, 若具有 线性相关关系, 则可通过线性回归方程估计和预测变量的 值. 4.独立性检验在实际应用中应注意的问题: (1)独立性检验的关键是根据 2×2 列联表准确计算 K2,若 2×2 列联表没有列出来,要先列出此表. (2)复习独立性检验时, 要根据实际问题, 深刻体会独立性 检验的思想.

一、选择题 1.重庆市 2015 年各月的平均气温(℃)数据的茎叶图 如下: 0? 8 9 1? 2 5 8 ? 2? 0 0 3 3 8 3? 1 2 则这组数据的中位数是( ) A.19 B.20 C.21.5 D.23 【解析】选 B. 从茎叶图知所有数据为 8,9,12,15,18,20,20, 23,23,28,31,32,中间两个数为 20,20,故中位数为 20,选 B.

2.我校三个年级共有 24 个班,学校为了了解同学们 的心理状况,将每个班编号,依次为 1 到 24,现用系统 抽样方法,抽取 4 个班进行调查,若抽到编号之和为 48, 则抽到的最小编号为( ) A.2 B.3 C.4 D.5

【解析】选 B. 24 系统抽样的抽取间隔为 = 6. 设抽到的最小编号为 4 x, 则 x+(6+x)+(12+x)+(18+x)=48,所以 x=3.故 选 B.

3.若样本数据 x1,x2,…,x10 的标准差为 8,则数 据 2x1-1,2x2-1,…,2x10-1 的标准差为( ) A.8 B.15 C.16 D.32

【解析】选 C. 设样本数据 x1,x2,…,x10 的标准差为 DX,则 DX =8,即方差 DX=64,而数据 2x1-1,2x2-1,…,2x10 -1 的方差 D(2X-1)=22DX=22×64,所以其标准差为 22×64=16.选 C.

4.为了解某社区居民的家庭年收入与年支出的关系, 随机调查了该社区 5 户家庭,得到如下统计数据表: 收入 x 8.2 8.6 10.0 11.3 11.9 (万元) 支出 y 6.2 7.5 8.0 8.5 9.8 (万元) ^ 根据上表可得回归直线方程^ y =^ b x+^ a, 其中^ b =0.76, a =- y -^ b- x, 据此估计, 该社区一户收入为 15 万元家庭年支 出为( ) A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元

【解析】选 B. 8.2+8.6+10.0+11.3+11.9 - 由已知得 x = = 10( 万 5 6.2+7.5+8.0+8.5+9.8 - 元 ), y = =8(万元), 5 故^ a =8-0.76×10=0.4, 所以回归直线方程为^ y =0.76x+0.4, 当社区一户收入为 15 万元家庭年支出为^ y =0.76×15 +0.4=11.8(万元),故选 B.

二、填空题 5. 为了解某校高三学生身体状况, 用分层抽样的方法 抽取部分男生和女生的体重,将男生体重数据整理后,画 出了频率分布直方图,已知图中从左到右前三个小组频率 之比为 1∶2∶3,第二小组频数为 12,若全校男、女生比 例为 3∶2,则全校抽取学生数为________.

【解析】80 第四小组和第五小组的频率之和是 5×(0.012 5 + 0.037 5)=0.25,故前三个小组的频率之和是 0.75,则第二 小组的频率是 0.25, 则抽取的男生人数是 12÷ 0.25=48 人, 2 抽取的女生人数是 48× =32 人,全校共抽取 80 人. 3

6.为了考察某校各班参加课外书法小组的人数 ,在 全校随机抽取 5 个班级, 把每个班级参加该小组的人数作 为样本数据.已知样本平均数为 7,样本方差为 4,且样 本数据互不相同,则样本数据中的最大值为 ____________.

【解析】选 10 设五个班级的数据分别为 a<b<c<d<e. a+b+c+d+e 由平均数和方差的公式得 =7, 5
(a ? 7)2 ? (b ? 7)2 ? (c ? 7) 2 ? ( d ? 7) 2 ? ( e ? 7) 2 = 4, 5

显然各个括号为整数. 设 a-7,b-7,c-7,d-7,e-7 分别为 p,q,r, ? ?p+q+r+s+t=0…(1) s, t, (p, q, r, s, t∈Z), 则? 2 . 2 2 2 2 ? ?p +q +r +s +t =20…(2) 设 f(x) = (x - p)2 + (x - q)2 + (x - r)2 + (x - s)2 = 4x2 - 2(p+q+r+s)x+(p2+q2+r2+s2)=4x2+2tx+20-t2, 由已知 f(x)>0, 由判别式 Δ<0 得 t<4, 所以 t≤3,所以 e≤10.

7 . 关于统计数据的分析 , 以下几个结论中正确的是 __________. ①利用残差进行回归分析时, 若残差点比较均匀地落在 宽度较窄的水平带状区域内, 则说明线性回归模型的拟合精 度较高; ②将一组数据中的每个数据都减去同一个数后, 期望与 方差均没有变化; ③调查剧院中观众观后感时,从 50 排(每排人数相同) 中任意抽取一排的人进行调查是分层抽样法; ④已知随机变量 X 服从正态分布 N(3, 1), 且 P(2≤X≤4) =0.682 6,则 P(X>4)等于 0.158 7. ⑤某单位有职工 750 人,其中青年职工 350 人,中年职工 250 人, 老年职工 150 人. 为了了解该单位职工的健康情况, 用分层抽样的方法从中抽取样本.若样本中的青年职工为 7 人,则样本容量为 15 人.

【解析】①④ 350 ①④正确,②③⑤错误,⑤设样本容量为 n,则 1 500 7 = , n ∴n=30,故⑤错.

三、解答题 8.某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 20 个用户,得到用户对产品的满 意度评分如下: A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79

(1) 根据两组数据完成两地区用户满意度评分的茎叶 图,并通过茎叶图比较两地区满意度评分的平均值及分散 程度(不要求计算出具体值,得出结论即可);

(2)根据用户满意度评分,将用户的满意度从低到高分 为三个等级: 满意度评分 低于 70 分 70 分到 89 分 不低于 90 分 满意度等级 不满意 满意 非常满意

记事件 C: “A 地区用户的满意度等级高于 B 地区 用户的满意度等级”. 假设两地区用户的评价结果相互独 立.根据所给数据,以事件发生的频率作为相应事件发生 的概率,求 C 的概率.
【解析】(1)两地区用户满意度评分的茎叶图如下

通过茎叶图可以看出, A 地区用户满意度评分的平均 值高于 B 地区用户满意度评分的平均值; A 地区用户满意 度评分比较集中,B 地区用户满意度评分比较分散.

(2)记 CA1 表示事件: “A 地区用户满意度等级为满意 或非常满意”; CA2 表示事件: “A 地区用户满意度等级为非常满 意”; CB1 表示事件: “B 地区用户满意度等级为不满意”; CB2 表示事件:“B 地区用户满意度等级为满意”; 则 CA1 与 CB1 独立,CA2 与 CB2 独立,CB1 与 CB2 互斥, C=CB1CA1∪CB2CA2, P(C) = P(CB1CA1 ∪ CB2CA2) = P(CB1CA1) + P(CB2CA2) = P(BB1)P(CA1)+P(CB2)P(CA2). 由所给数据得 CA1,CA2,CB1,CB2 发生的概率分别为 16 4 10 8 16 , , , .故 P(CA1)= , 20 20 20 20 20 4 10 8 P(CA2)= ,P(CB1)= ,P(CB2)= , 20 20 20 10 16 8 4 故 P(C)= × + × =0.48. 20 20 20 20

9.某公司为确定下一年度投入某种产品的宣传费 , 需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年 利润 z(单位:千元)的影响,对近 8 年的年宣传费 xi 和年 销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的 散点图及一些统计量的值.

- x

- y

- w 6.8

? ( x ? x)
i ?1 i

8

2

? ( w ? w)
i ?1 i

8

2

? ( x ? x)( y ? y) ? ( wi ? w)( yi ? y )
i ?1 i i

8

8

i ?1

46.6 56.3

289.8

1.6

1469

108.8

8 1 表中 wi= xi ,- w = ?wi 8i=1

(1)根据散点图判断, y=a+bx 与 y=c+d x哪一个适 宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给 出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的 回归方程; (3)已知这种产品的年利率 z 与 x、y 的关系为 z=0.2y -x. 根据(2)的结果回答下列问题: (ⅰ)年宣传费 x=49 时, 年销售量及年利润的预报值是多少?(ⅱ)年宣传费 x 为何 值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),……,(un,vn), 其回归线 v= α+ βu 的斜率和截距的最小二乘估计分别

? (u ? u)(v
i ?1 i

n

i

? v) ,? ? u ? ? u

为:β =

? (u ? u )
i ?1 i

n

【解析】(1)由散点图可以判断,y=c+d x适合作为 年销售 y 关于年宣传费用 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程,由 于^ d=

? ( w ? w)( y
i ?1 i n i ?1 i

n

i

? y)
2

? ( w ? w)

108.8 = =68, 16

∴^ c =^ y -^ d- w =563-68×6.8=100.6. ∴y 关于 w 的线性回归方程为^ y =100.6+68w, ∴y 关于 x 的回归方程为^ y =100.6+68 x.

(3)(i)由(2)知,当 x=49 时,年销售量 y 的预报值 ^ y =100.6+68 49=576.6, ^ z =576.6×0.2-49=66.32. (ii)根据(2)的结果知,年利润 z 的预报值 ^ z =0.2(100.6+68 x)-x=-x+13.6 x+20.12, 13.6 ∴当 x= =6.8,即 x=46.24 时,^ z 取得最大值. 2 故宣传费用为 46.24 千元时,年利润的预报值最大.

10. 某校为了探索一种新的教学模式, 进行了一项课题实验, 乙班为实验班,甲班为对比班,甲乙两班的人数均为 50 人,一 年后对两班进行测试,成绩如下表(总分:150 分): 甲班 110) [110,120) [120,130) 成绩 [80,90) [90,100) [100, 频数 4 20 15 10 1 乙班 120) [120,130) 成绩 [80,90) [90,100) [100,110) [110, 1 11 23 13 2 频数

(1)现从甲班成绩位于[90, 120)内的试卷中抽取 9 份进 行试卷分析,请问用什么抽样方法更合理,并写出最后的 抽样结果; (2)根据所给数据可估计在这次测试中,甲班的平均分 是 101.8, 请你估计乙班的平均分, 并计算两班平均分相差 几分; (3)完成下面 2×2 列联表,你能有 97.5%的把握认为 “这两个班在这次测试中成绩的差异与实施课题实验有 关”吗?并说明理由. 成绩不小于 成绩小于 100 分 合计 100 分 甲班 a= b= 50 50 乙班 c= d= 合计 36 64 100

附: P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 n ( ad - bc ) K2= . (a+b)(c+d)(a+c)(b+d)

【解析】 (1)用分层抽样抽取样本更合理. 在[90, 100), [100,110),[110,120)各分数段分别抽取 4 份、3 份、2 份试卷. 1 11 - (2) 估 计 乙 班 的 平 均 分 为 x 乙 = 85× + 95× + 50 50 23 13 2 105× +115× +125× =105.8. 50 50 50 105.8-101.8=4,即两班平均成绩相差 4 分. (3)a=24,b=26,c=12,d=38. 2 100 × ( 24 × 38 - 26 × 12 ) K2= =6.25. 50×50×36×64 而 6.25>5.024,所以有 97.5%的把握认为“这两个 班在这次测试中成绩的差异与实施课题实验有关”.

一、选择题 1.某全日制大学共有学生 5 400 人,其中专科生有 1 500 人,本科生有 3 000 人,研究生有 900 人.现采用分 层抽样的方法调查学生利用因特网查找学习资料的情况, 抽取的样本容量为 180,则应在专科生、本科生与研究生 这三类学生中分别抽取( ) A.55 人,80 人,45 人 B.40 人,100 人,40 人 C.60 人,60 人,60 人 D.50 人,100 人,30 人

【解析】选 D. 180 1 抽取比例为 = ,故应在专科生、本科生、研究 5 400 30 1 1 生中分别抽取 1 500× =50(人),3 000× =100(人), 30 30 1 900× =30(人). 30

2.在某中学生歌手比赛现场上,7 位评委为某选手 打出的分数的茎叶统计图如图所示, 去掉一个最高分和一 个最低分后,所剩数据的平均数和方差分别为( )

A.5 和 1.6 C.85 和 0.4

B.85 和 1.6 D.5 和 0.4

【解析】选 B. 4+4+4+6+7 1 2 - 由图可知 x =80+ =85,s = ×(1+1+1 5 5 +1+4)=1.6.

3.为了普及环保知识,增强环保意识,某大学随机 抽取 30 名学生参加环保知识测试,得分(10 分制)的直方 图如图所示,假设得分的中位数为 me,众数为 m0,平均 数为 x,则( )

A.me=m0=x C.me<m0<x

B.me=m0<x D.m0<me<x

【解析】选 D. 由图知 m0=5.将 30 名学生的得分从大到小排列,第 15 个数是 5,第 16 个数是 6,所以 me=5.5.
3 ? 2 ? 4 ? 3 ? 5 ? 10 ? 6 ? 6 ? 7 ? 3 ? 8 ? 2 ? 9 ? 2 ? 10 ? 2 又x = 30

>5.9, 所以 m0<me<x.

4.给出下列四个命题: ①质检员每隔 10 分钟从匀速传递的产品生产流水线 上抽取一件产品进行某项指标检测, 这样的抽样是分层抽 样; ②将一组数据中的每个数据都加上同一个常数后, 方 差不变; ③设随机变量 ξ 服从正态分布 N(0,1),若 P(ξ≥1) 1 =p,则 P(-1<ξ<0)= -p; 2 ④在回归直线方程^ y =0.1x+10 中,当 x 每增加 1 个 单位时,^ y 平均增加 0.1 个单位. 其中真命题的个数是( ) A.1 B.2 C.3 D.4

【解析】选 C. ①中的抽样方法是系统抽样,所以①不正确;根据方 差的含义,②正确;③中 P(ξ≥1)=p,则 P(ξ≤-1)=p, 1 1 所以 P(-1<ξ<0)= (1-2p)= -p,故③正确;由于 x 的 2 2 系数为 0.1,因此 x 每增加一个单位,^ y 平均增加 0.1 个单 位,故④正确.所以真命题的个数是 3.

5.某种产品的广告支出 x(单位:万元)与销售额 y(单 位:万元)之间有如下对应数据: x 2 4 5 6 8 y 30 40 60 50 70 根据上表可得回归直线方程^ y =^ b x+^ a 中的^ b 为 6.5.若 要使销售额不低于 100 万元,则至少需要投入广告费为(x 为整数)( ) A.10 万元 B.11 万元 C.12 万元 D.13 万元

【解析】选 D. 因为 x=5,y=50,所以 50=6.5×5+^ a, 解得^ a =17.5, 所以回归直线方程为^ y =6.5x+17.5. 165 由 6.5x+17.5≥100,解得 x≥ ,因为 x 为整数, 13 所以至少需要投入广告费为 13 万元.

6.从气象意义上来说春季进入夏季的标志为:连续 5 天的日平均温度均不低于 22℃.现有甲、乙、丙三地连 续 5 天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5 个数据的中位数为 24,众数为 22; ②乙地:5 个数据的中位数为 27,总体均值为 24; ③丙地:5 个数据中有一个数据是 32,总体均值为 26,总体方差为 10.4. 则肯定进入夏季的地区为( ) A.甲、乙、丙 B.甲、丙 C.乙、丙 D.甲

【解析】选 B. 甲地气温数据的中位数为 24,即 5 个数据从小到大 排序,第 3 个数是 24,出现最多的数是 22,因此至少有 2 个 22,故甲地连续 5 天的日平均气温都不低于 22℃, 故甲地肯定进入夏季;乙地气温数据的中位数为 27,数 据尽可能集中的情况是 a1,a2,27,27,27,由均值为 24, 可得 a1+a2=39,此时 a1,a2 中至少有一个小于 22,故乙 地肯定没有进入夏季;设丙地的其他 4 个气温数据为 a1, a2,a3,a4,
(a1 ? 26)2 ? (a2 ? 26)2 ? (a3 ? 26)2 ? (a4 ? 26)2 ? (32 ? 26)2 则 5

= 10.4 , 即 (a1 - 26)2 + (a2 - 26)2 + (a3 - 26)2 + (a4 - 26)2 = 16,显然(a1-26)2≤16,(a2-26)2≤16,(a3-26)2≤16,(a4 -26)2≤16,即 a1,a2,a3,a4∈[22,30],故丙地肯定进 入夏季.

二、填空题 7. 某市居民 2005~2009 年家庭年平均收入 x(单位: 万 元)与年平均支出 Y(单位:万元)的统计资料如下表所示: 年份 2005 2006 2007 2008 2009 收入 x 11.5 12.1 13 13.3 15 支出 Y 6.8 8.8 9.8 10 12 根据统计资料,居民年家庭平均收入的中位数是 ________, 家庭年平均收入与年平均支出有________线性相 关关系.
【解析】13 正 找中位数时,将样本数据按大小顺序排列后,奇数个时 中间一个是中位数,而偶数个时须取中间两数的平均数,由 统计资料可以看出, 年平均收入增多时, 年平均支出也增多, 因此两者正相关.

8.某高校“统计初步”课程的教师随机调查了选该 课的一些学生情况,具体数据如下表: 专业 非统计专业 统计专业 性别 男 13 10 7 20 女 为了判断主修统计专业是否与性别有关系, 根据表中 的数据, 50×(13×20-10×7)2 得到 k= ≈4.844. 23×27×20×30 因为 k≥3.841, 所以判定主修统计专业与性别有关系, 那么这种判断 出错的可能性为________.

【解析】5% ∵P(k2≥3.841)=0.05, 根据独立性检验临界值表可知“x 与 y 有关系”的可 信度, ∴有 95%的可能认为 x 与 y 有关系, 即判断出错的可 能性为 5%.

9.设某大学的女生体重 y(kg)与身高 x(cm)具有线性 相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n), 用最小二乘法建立的线性回归方程为^ y =0.85x-85.71, 给 出下列结论: ①y 与 x 具有正的线性相关关系; ②回归直线过样本点的中心(- x ,- y ); ③若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg; ④若该大学某女生身高为 170 cm,则可断定其体重 必为 58.79 kg. 其中,正确结论的序号是______________.
【解析】①②③ 利用有关概念可知,①②③正确.

10.已知 x、y 之间的一组数据如下表: x 1 3 6 7 8 y 1 2 3 4 5 对于表中数据,甲、乙两同学给出的拟合直线分别为 1 1 1 l1:y= x+1 与 l2:y= x+ ,利用最小二乘法判断拟合 3 2 2 程度更好的直线是________(填 l1 或 l2). 【解析】l2 1 用 y= x+1 作为拟合直线时,所得 y 值与 y 的实际值 3 7 的差的平方和为 s1= ; 3 1 1 用 y= x+ 作为拟合直线时,所得 y 值与 y 的实际值 2 2 1 的差的平方和为 s2= . 2 1 1 ∵s2<s1,故用直线 y= x+ 拟合程度更好. 2 2

三、解答题 11.从某企业生产的某种产品中抽取 500 件,测量这 些产品的一项质量指标值, 由测量结果得如下频率分布直 方图:

(1)求这 500 件产品质量指标值的样本平均数- x 和样本方 差 s2(同一组中的数据用该组区间的中点值作代表);

(2)由直方图可以认为,这种产品的质量指标值 Z 服 从正态分布 N(μ,σ 2),其中 μ 近似为样本平均数 x,σ 2 近似为样本方差 s2. (ⅰ)利用该正态分布,求 P(187.8<Z<212.2); (ⅱ)某用户从该企业购买了 100 件这种产品,记 X 表 示这 100 件产品中质量指标值位于区间(187.8, 212.2)的产 品件数.利用(ⅰ)的结果,求 E(X). 附: 150≈12.2. 若 Z~N(μ,σ 2), 则 P(μ-σ<Z<μ+σ)=0.682 6, P(μ-2σ<Z<μ+2σ)=0.954 4.

【解析】 (1)抽取产品的质量指标值的样本平均数 x 和样本方差 s2 分别为 - x = 170×0.02 + 180×0.09 + 190×0.22 + 200×0.33 +210×0.24+220×0.08+230×0.02=200, s2 = ( - 30)2 × 0.02 + ( - 20)2 × 0.09 + ( - 10)2 × 0.22 + 0×0.33+102×0.24+202×0.08+302×0.02=150. (2)(ⅰ) 由 (1) 知 , Z ~ N(200 , 150) , 从 而 P(187.8<Z<212.2)=P(200-12.2<Z<200+12.2) =0.682 6. (ⅱ) 由 (ⅰ) 知 , 一 件 产 品 的 质 量 指 标 值 位 于 区 间 (187.8, 212.2)的概率为 0.682 6, 依题意知 X~B(100, 0.682 6),所以 E(X)=100×0.682 6=68.26.

12.考察黄烟经过药物处理跟发生青花病的关系,得 到如下数据,在试验的 470 株黄烟中,经过药物处理的黄 烟有 25 株发生青花病,60 株没有发生青花病.未经过药 物处理的有 185 株发生青花病,200 株没有发生青花病, 试推断药物处理跟发生青花病是否有关系.
【解析】由已知得到下表 经药物处理 未经药物处理 合计 患青花病 25 185 210 60 200 260 无青花病 合计 85 385 470 2 470 × ( 25 × 200 - 185 × 60 ) 根据公式 k2= ≈9.788. 210×260×85×385 由于 9.788>7.879,所以我们有 99.5%的把握认为经过药物 处理跟发生青花病是有关系的.

13.为了对 2015 年佛山市中考成绩进行分析,在 60 分以上的全体同学中随机抽出 8 位,他们的数学分数(已折 算为百分制)从小到大排列是 60、65、70、75、80、85、90、 95,物理分数从小到大排列是 72、77、80、84、88、90、 93、95. (1)若规定 85 分(包括 85 分)以上为优秀, 求这 8 位同学 中恰有 3 位同学的数学和物理分数均为优秀的概率; (2)若这 8 位同学的数学、物理、化学分数事实上对应 如下表: 学生编号 1 2 3 4 5 6 7 8 数学分数 x 60 65 70 75 80 85 90 95 物理分数 y 72 77 80 84 88 90 93 95 化学分数 z 67 72 76 80 84 87 90 92

用变量 y 与 x、z 与 x 的相关系数说明物理与数学、 化学与数学的相关程度; (3)求 y 与 x、 z 与 x 的线性回归方程(系数精确到 0.01), 并用相关指数比较所求回归模型的效果. 参考数据:- x =77.5,- y =85,- z =81,

?? x ? x?
8 i ?1 8 i
i ?1 i

2

? 1050
i

? ,? i ?1
8

yi ? y

?

2

? 456 , ? zi ? z
i ?1

8

?
i

?

2

? 550 ,
i

? ? x ? x ?? y

? y ? 688

?

,

? ? x ? x ?? z ? z ? ? 755
8 i ?1

,

?? y ? y ?
8 i ?1 i i

2

?7

zi ? zi ,? i ?1

8

?

?

2

? 94

,

1050≈32.4, 456≈21.4, 550≈23.5.

【解析】(1)这 8 位同学中恰有 3 位同学的数学和物 理分数均为优秀, 则需要先从物理的 4 个优秀分数中选出 3 3 3 个与数学优秀分数对应,种数是 C3 A ( 或 A 4 3 4),然后将剩 下的 5 个数学分数和物理分数任意对应,种数是 A5 5.根据 3 5 乘法原理,满足条件的种数是 C3 4A3A5. 这 8 位同学的物理分数和数学分数分别对应的种数 3 5 C3 1 4A3A5 8 共有 A8.故所求的概率 P= = . A8 14 8

688 (2)变量 y 与 x、 z 与 x 的相关系数分别是 r= 32.4×21.4 755 ≈0.99,r′= ≈0.99 可以看出,物理与数学、 32.4×23.5 化学与数学的成绩都是高度正相关. (3)设 y 与 x、 z 与 x 的线性回归方程分别是^ y =bx+a, 688 ^ z =b′x+a′根据所给的数据可以计算出,b= =0.65, 1050 755 a= 85- 0.65×77.5= 34.63, b′= = 0.72,a′= 81 1 050 -0.72×77.5=25.20 所以 y 与 x 和 z 与 x 的回归方程分别 是 =0.65x+34.63, =0.72x+25.20,又 y 与 x、z 与 x 的 7 94 2 2 相关指数是 R =1- ≈0.98, R′ =1- ≈0.83 故回 456 550 归模型^ y =0.65x+34.63 比回归模型^ z =0.72x+25.20 的拟 合的效果好.



更多相关文章:
...年高三数学二轮专题复习 专题4 概率与统计 第8讲 统....ppt
2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 理-PPT文档资料 - 第 8 讲 统计与统计案例 【命题趋势】 本节在高考中主要考查:1....
2017届高三数学(文)二轮复习课件(全国通用)专题突破 专....ppt
2017届高三数学(文)二轮复习课件(全国通用)专题突破 专题7 概率与统计 第2讲 统计统计案例解析_职高对口_职业教育_教育专区。2017 ...
【导与练】(全国通用)2017届高三数学二轮复习 专题突破....ppt
【导与练】(全国通用)2017届高三数学二轮复习 专题突破 专题概率与统计 第2讲 统计统计案例课件 文_数学_高中教育_教育专区。第2讲 统计统计案例 高考...
2017届高三数学二轮复习第一篇专题通关攻略专题概率....ppt
2017届高三数学二轮复习第一篇专题通关攻略专题概率统计1.7.2统计统计案例课件理_数学_高中教育_教育专区。第二讲统计统计案例 【知识回顾】 1.两种抽样方法...
高三理科数学二轮专题复习专题4第8讲统计与统计案例_图文.ppt
高三理科数学二轮专题复习专题4第8讲统计与统计案例_高三数学_数学_高中教育_...估计总体的数字特征;估计总体 的数字特征是命题的热点 , 多与概率统计相结合...
...专题7 概率与统计 第2讲 统计与统计案例 适考素能特....ppt
2017年高考数学二轮复习课件:专题整合突破 专题7 概率与统计 第2讲 统计与统计案例 适考素能特训 2-7-2a_数学_高中教育_教育专区。一、选择题 1.[2016...
全国通用2017年高考数学二轮专题复习专题概率与统....ppt
全国通用2017年高考数学二轮专题复习专题概率与统计第二讲统计与统计案例适考素能特训课件理_数学_高中教育_教育专区。适考素能特训 一、选择题 1.[2016...
...二轮专题复习课件:专题四 第1讲 统计与统计案例_图....ppt
2019届高三数学(理)二轮专题复习课件:专题四 第1讲 统计与统计案例_数学_高中...统计与概率,回 归分析与概率是近年命题的热点,2016年,2017年和2018年在解答题...
...专题概率与统计第1讲统计与统计案例课件理_图文.ppt
精品-高三数学二轮复习第一篇专题突破专题概率与统计第1讲统计与统计案例课件理_高考_高中教育_教育专区。第1讲 统计与统计案例 考情分析 年份 卷别 题号 考...
...突破专题概率与统计刺第1讲统计与统计案例课件文_....ppt
高三数学二轮复习第一篇专题突破专题概率与统计刺第1讲统计与统计案例课件文_数学
...复习专题概率与统计第1讲统计与统计案例课件文_图....ppt
2018年高考数学二轮复习专题概率与统计第1讲统计与统计案例课件文_高考_高中
...专题概率与统计第1讲统计与统计案例课件理_图文.ppt
高三数学二轮复习第一篇专题突破专题概率与统计第1讲统计与统计案例课件理_初三语文_语文_初中教育_教育专区。高三数学二轮复习第一篇专题突破专题概率与统计第1...
...复习第二编专题概率与统计第二讲统计与统计案例适....ppt
全国新课标2017年高考数学二轮复习第二编专题概率与统计第二讲统计与统计案例适考素能特训课件文_数学_高中教育_教育专区。适考素能特训 一、选择题 1.[...
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题....ppt
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题考法__统计统计案例概率课件_高考_高中教育_教育专区。2019版高考数学二轮复习课件 ...
...复习专题概率与统计第2讲统计与统计案例课件文_图....ppt
创新设计全国通用2017届高考数学二轮复习专题概率与统计第2讲统计与统计案例课件文_数学_高中教育_教育专区。第2讲 统计与统计案例 高考定位 1. 以选择题、填空...
...复习第二编专题整合突破专题概率与统计第二讲统计与统计案例....ppt
高考数学二轮专题复习第二编专题整合突破专题概率与统计第二讲统计与统计案例适考素能特训课件理_高考_高中教育_教育专区。适考素能特训 一、选择题 1.[...
...专题概率与统计第3讲统计与统计案例课件理_图文.ppt
(全国通用版)2019高考数学二轮复习专题概率与统计第3讲统计与统计案例课件理_高考_高中教育_教育专区。板块三 专题突破 核心考点 专题概率与统计 第3讲 统计...
...复习专题概率与统计第1讲统计与统计案例课件理 - ....ppt
2018届高三数学二轮复习专题概率与统计第1讲统计与统计案例课件理_数学_高中教育_教育专区。2018 考情分析年份 卷别 题号 2017 Ⅰ 考查内容 命题规律 统计的...
...部分专题概率与统计第1讲统计与统计案例课件理201....ppt
高考数学二轮复习第二部分专题概率与统计第1讲统计与统计案例课件理2018120526_高考_高中教育_教育专区。专题概率与统计 第 1 讲 统计与统计案例 1.(2018...
...专题概率与统计第1讲统计与统计案例课件理_图文.ppt
2018年高考数学二轮复习第二部分专题概率与统计第1讲统计与统计案例课件理_高考_高中教育_教育专区。专题概率与统计 第 1 讲 统计与统计案例 1.(2016 ...
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图