9512.net
甜梦文库
当前位置:首页 >> 数学 >>

2016年高考数学 中等生百日捷进提升系列 专题12 概率与统计(含解析)



第十二章

概率与统计

古典概型、几何概型

【背一背重点知识】 1.古典概型:具有以下两个特点的概率模型称为古典概率模型, ①有限性试:验中所有 可能出现的基本事件只有有限个;②等可能性:每个基本事件出现的可能性相等,简称古 典概型.如果一次试验中可能出现的结果有 n 个,而且所有结果出现的可能性都相等,那 么每一个

基本事件的概率都是 率 P(A)=

1 ;如果某个事件 A 包括的结果有 m 个,那么事件 A 的概 n

m .从集合的角度去看待古典概型,在一次试验中,等可能出现的全部结果组 n

成一个集合 I,基本事件的个数 n 就是集合 I 的元素个数,事件 A 是集合 I 的一个包含 m 个元素的子集.故 P(A)=

card ( A) m ? . card ( I ) n

2.几何概型: 事件 A 理解为区域 Ω 的某一子区域 A, A 的概率只与子区域 A 的几何度量(长 度、 面积或体积)成正比, 而与 A 的位置和形状无关, 满足以上条件的试验称为几何概型. 在 几何概型中,事件 A 的概率定义为: P(A)=

?A ,其中 μ Ω 表示区域 Ω 的几何度量,μ ??

A

表示子区域 A 的几何度量.要切实理解并掌握几何概型试验的两个基本特点:①无限性: 在一次试验中, 可能出现的结果有无限多个; ②等可能性: 每个结果的发生具有等可能性。 【讲一讲提高技能】 1.必备技能:(1)解答有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件 包含的基本事件数,这常用到计数原理与排列、组合的相关知识. (2)在求基本事件的个数时,要准确理解基本事件的构成,这样才能保证所求事件所包含的 基本事件数的求法与基本事件总数的求法的一致性. (3)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型 求解. 2. 典型例题: 例 1 从 0 、1 、 2 、 3 、 4 、 5 、 6 、 7 、 8 、 9 中任取七个不同的数,则这七个数的中位数 是 6 的概率为 .

1

分析:本题属于古典概型,上述十个数中比 6 小的数有 6 个,比 6 大的数有 3 个,要使得所 选的七个数的中位数为 6 ,则应该在比 6 大的数中选择 3 个,在比 6 大的数中也选择 3 个, 应用公式计算即得. 【解析】上述十个数中比 6 小的数有 6 个,比 6 大的数有 3 个,要使得所选的七个数的中位 数为 6 ,则应该在比 6 大的数中选择 3 个,在比 6 大的数中也选择 3 个,因此所求事件的概 率为 P ?
3 3 C6 C3 1 ? . 7 C10 6

例 2 两人相约 7 点到 8 点在某地会面,先到者等候另一人 20 分钟,过时离去,则两人会面 的概率为( A. ) B.

1 3

4 9

C.

5 9

D.

7 10

【答案】C 【解析】

【练一练提升能力】 1.从 n 个正整数 1,2,?,n 中任意取出两个不同的数,若取出的两数之和等于 5 的概率为

1 错误!未找到引用源。 ,则 n=________. 14
【答案】8
2 【解析】从 n 个正整数 1,2,?,n 中任意取出两个不同的数,所有的取法有 Cn 种取法,

而取出的两数之和等于 5 的取法只有两种,即 (1, 4) 、 (2,3) ,所以其概率为

2 1 ? ,解 2 Cn 14

得 n ? n ? 56 ? 0 ,解得 n ? 8 .
2

2. 已知 P 是 ?ABC 所在平面内一点, 4PB ? 5PC ? 3PA ? 0 ,现将一粒红豆随机撒在

?ABC 内,则红豆落在 ?PBC 内的概率是

2

A.

1 4

B.

1 3

C.

5 12

D.

1 2

【答案】A 【解析】 试题分析:令 PD ? 4 PB , PE ? 5PC , PF ? 3PA , 则? 4PB ? 5PC ? 3PA ? 0 ,? PD ? PE ? PF ? 0 , 即 P 是 ?DEF 的重心,

条件概率与二项分布(理) 【背一背重点知识】 1.条件概率:对于任何两个事件 A 和 B,在已知事件 A 发生的条件下,事件 B 发生的概率 P(A∩B) 叫做条件概率,用符号“________”来表示,其计算公式为 P(B|A)= .古典概型 P(A) 中,A 发生的条件下 B 发生的条件概率公式为 P(B|A)= 应用中 P(B|A)=

P(A∩B) n(A∩B) = ,其中,在实际 P(A) n(A)

n(A∩B) 是一种重要的求条件概率的方法. n(A)

2.相互独立事件:对于事件 A、B,若 A 的发生与 B 的发生互不影响,则称 A 与 B 是相互 独立事件.若 A 与 B 相互独立,则 P(B|A)=P(B),P(A∩B)=P(B|A)·P(A)=P(A)P(B). 若 A 与 B 相互独立, 则 A 与 B 、A 与 B、A 与 B 也都相互独立, 反之, 若 P(A∩B)=P(A)P(B),

3

则 A 与 B 是相互独立事件. 注意: “互斥事件”与“相互独立事件”的区别与联系: 相同点为二者都是描述两个事件间 的关系.不同点是针对问题的角度不同. 互斥事件是针对一次试验下的两个事件 A,B 能不能 同时发生, 相互独立事件是针对两次或更多次不同试验下出现的两个事件 A,B, 一个事件对 另一个事件发生的概率有没有影响.具体来说,相互独立事件,不是一个事件对另一个事件发 生没有影响,而是一个事件对另一个事件发生的概率没有影响.互斥事件不一定是相互独立 事件,相互独立事件不一定是互斥事件。若存在不可能事件即概率为 0 的情况,如在数轴上 取一个数,设事件 A=“取到的数是 1”,事件 B=“取到的数是 2”,则 A、B 既互斥又相互 独立;但若 A、B 互斥,且 P(A)>0 ,P(B)>0,则它们不可能互相独立:因为 A 发生的条件 下,B 不可能发生,即 P B A ? 0 ? P ? B ? ,所以 A、B 不是相互独立事件. 3.概率的计算公式: ①等可能事件的概率计算公式: p ( A) ? m ? card ( A) ;
n card ( I )

?

?

②互斥事件的概率加法公式:P(A+B)=P(A)+P(B); ③对立事件的概率计算公式是:P( A )=1-P(A); ④相互独立事件同时发生的概率计算公式是:P(A?B)=P(A)?P(B); ⑤独立事件重复试验的概率计算公式是: P n (k ) ? Cn P (1 ? P)
k k n?k



4.离散型随机变量及其分布列: 离散型随机变量的分布列的概念:如果随机试验的结果可以用一个变量 X 来表示,并且 X 是随着试验的结果的不同而变化的, 那么这样的变量 X 叫做随机变量; 如果随机变量 X 的所 有可能的取值都能一一列举出来, 这样的随机变量叫做离散型随机变量. 设离散型随机变量

X 可能取的不同值为 x1,x2,?,xi,?,xn,X 取每一个值 xi(i=1,2,?,n)的概率 P(X
=xi)=pi,则称表

X P

x1 p1

x2 p2

? ?

xi pi

? ?

xn pn

为离散型随机变量 X 的概率分布,或称为离散型随机变量 X 的分布列,具有性质: (ⅰ)pi_ ? 0,i=1,2,?,n; (ⅱ)p1+p2+?+pi+?+pn=1. 5.二项分布:如果在一次试验中某事件发生的概率是 P,那么在 n 次独立重复试验中这个
k n ?k 事件恰好发生 k 次的概率是: P(ξ ? k) ?C k (其中 k ? 0,1, ? , n, q ? 1 ? p ) ,于是得到随 np q

4

机变量 ξ 的概率分布如下:我们称这样的随机变量 ξ 服从二项分布,记作 ? ~B(n·p) ,
k n ?k 其中 n,p 为参数,并记 Ck ? b(k;n ? p) .二项分布实际上是对 n 次独立重复试验而言的, np q

关键是看某一事件是否是进行 n 次独立重复, 且每次试验只有两种结果, 如果不满足此两条 件, 随机变量就不服从二项分布。 当随机变量的总体很大且抽取的样本容量相对于总体来说 又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项 分布求其分布列。 (8)数学期望与方差. ①期望:一般地,若离散型随机变量 ξ 的概率分布为
?
x1 p1 x2 p2

? ?

xi pi

? ?

P

则称 E? ? x 1 p 1 ? x 2 p 2 ? ? ? x n p n ? ? 为 ξ 的数学期望或平均数、均值.数学期望又简称期望. 数学期望反映了离散型随机变量取值的平均水平. ②方差、标准差的定义:当已知随机变量 ξ 的分布列为 P(? ? x k ) ? p k (k ? 1,2, ?) 时,则称
D? ? ( x1 ?E? ) 2 p1 ?( x 2 ?E? ) 2 p 2 ? ? ? ( x n ?E? ) 2 p n ? ? 为

ξ 的方差. 显然 D? ? 0 , 故? ? ?

D ?? ,? 为 ξ

的根方差或标准差.随机变量 ξ 的方差与标准差都反映了随机变量 ξ 取值的稳定与波动, 集中与离散的程度. D? 越小,稳定性越高,波动越小. ③均值与方差的常用性质:

E(aξ +b)=aE(ξ )+b;E(ξ +η )=E(ξ )+E(η );D(aξ +b)=a2D(ξ );若已知随机变
量 ξ 的均值、方差,求 ξ 的线性函数?=a?+b 的均值、方差和标准差,可直接用 ξ 的 均值、方差的性质求解. ④期望与方差的关系:(ⅰ)如果 E? 和 E? 都存在,则 E (? ? ? ) ? E? ? E? ; (ⅱ)设 ? 和? 是互相独立的两个随机变量, 则 E (? ?? ) ? E? ? E? , D(? ? ? ) ? D? ? D?(不 作要求) ; (ⅲ)期望与方差的转化: (因为 E? D(? ) ? E? 2 ? ( E? )2 ; (ⅳ) E(? ? E? ) ? E? ? E? ? 0 为一常数) 。 【讲一讲提高技能】

5

1.必备技能: (1)求相互独立事件和独立重复试验的概率的注意点 ①求复杂事件的概率, 要正确分析复杂事件的构成, 看复杂事件能转化为几个彼此互斥的事 件的和事件还是能转化为几个相互独立事件同时发生的积事件,然后用概率公式求解. ②一个复杂事件若正面情况比较多, 反面情况较少, 则一般利用对立事件进行求解. 对于“至 少”“至多”等问题往往也用这种方法求解. ③注意辨别独立重复试验的基本特征: ①在每次试验中, 试验结果只有发生与不发生两种情 况;②在每次试验中,事件发生的概率相同. (2)解答离散型随机变量的分布列及相关问题的一般思路: ①明确随机变量可能取哪些值. ②结合事件特点选取恰当的计算方法计算这些可能取值的概率值. ③根据概率分布和期望、方差公式求解. 2.典型例题: 例 1 某地区空气质量监测资料表明,一天的空气质量为优良的概率是 0.75,连续两天为优 良的概率是 0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( A. ) 0.8 B. 0.75 C. 0.6 D. 0.45

分析:设 A=“某一天的空气质量为优良” ,B=“随后一天的空气质量为优良” ,则

P( A ? B) ? 0.6 , P( A) ? 0.75 ,按公式 P( B | A) ?

P( A ? B) 计算即得. P( A)

【解析】设 A=“某一天的空气质量为优良” ,B=“随后一天的空气质量为优良” ,则

P( B | A) ?

P( A ? B) 0.6 ? ? 0.8 ,故选 A. P( A) 0.75

例 2 从 1 , 2 , 3 , 4 , 5 中任取 2 个不同的数, 事件 A =“取到的 2 个数之和为偶数”, 事件 B =“取到的 2 个数均为偶数”,则 P B A =( A.

? ?



1 8

B.

1 4

C.

2 5

D.

1 2

【答案】B 【解析】

6

【练一练提升能力】 1. 2015 年 4 月 21 日上午 10 时,省会首次启动重污染天气 II 级应急响应,正式实施机动 车车尾号限行,当天某报社为了解公众对“车辆限行”的态度,随机抽查了 50 人,将调查 情况进行整理后制成下表: 年龄(岁) 频数 赞成人数

?15,25?
5 4

?25,35?
10 6

?35,45?
15 9

?45,55?
10 6

?55,65?
5 3

?65,75?
5 4

(1)完成被调查人员的频率分布直方图; (2)若从年龄 ?15,25? , ?25,35? 的被调查者中各随机选取两人进行追踪调查,记选中的 4 人中不赞成“车辆限行”的人数为 ? ,求随机变量 ? 的分布列和数学期望. 【答案】 (1)详见解析; (2) 【解析】

6 5

7

(2) ? 的所有可能取值为:0,1,2,3
2 2 C6 C4 6 15 15 P ?? ? 0 ? ? 2 ? 2 ? ? ? C5 C10 10 45 75 2 1 1 1 2 C6 C4 ? C6 C4 C4 4 15 6 24 34 ? ? ? ? ? ? ? ? 2 2 2 2 C5 C10 C5 C10 10 45 10 45 75 2 1 2 2 C6 C4 C4 C4 4 15 6 6 22 ? ? ? ? ? ? ? ? 2 2 2 2 C5 C10 C5 C10 10 45 10 45 75

P ?? ? 1? ? P ?? ? 2 ? ?

1 2 C4 C4 6 6 4 P ? ? ? 3? ? 2 ? 2 ? ? ? C5 C10 10 45 75

所以 ? 的分布列是:

?

0

1

2

3

8

P

15 75

34 75

22 75

4 75

所以 ? 的数学期望是 E? ? 0 ?

15 34 22 4 6 ? 1? ? 2 ? ? 3 ? ? . 75 75 75 75 5

2 甲、乙、丙三人进行羽毛球练习赛,其中两人比赛,另一人当裁判,每局比赛结束时,负 的一方在下一局当裁判.设各局中双方获胜的概率均为 局甲当裁判. (Ⅰ)求第 4 局甲当裁判的概率; (Ⅱ) X 表示前 4 局中乙当裁判的次数,求 X 的数学期望. 【答案】 (Ⅰ) 【解析】

1 ,各局比赛的结束相互独立,第 1 2

1 9 ;(Ⅱ) . 4 8

抽样方法 【背一背重点知识】 1. 简单随机抽样:一般地,从元素个数为 N 的总体中逐个不放回地抽取容量为 n 的样本, 如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机 抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总 体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。

9

2.系统抽样:假设要从容量为 N 的总体中抽取容量为 n 的样本,第一步,先将总体的 N 个个体编号;第二步,确定分隔间距 k ,对编号进行分段,当 (n 是样本容量)是整数时, 取 k= ; 当 (n 是样本容量)不是整数时, 先用简单随机抽样剔除 -[ ]个个体, 取 k=[ ]; 第三步,在第 1 段用简单随机抽样确定第一个个体编号 l (l≤k);第四步,按照一定的 规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号 l ? k ,再加 k 得到第 3 个个 体编号 l ? 2k ,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很 多且均衡的总体;各个个体被抽到的机会均等。 3.分层抽样: 当总体由有明显差别的几部分组成时, 为了使抽取的样本更好地反映总体的 情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每 一部分叫做层, 在各层中按层在总体中所占比例进行简单随机抽样或系统抽样, 这种抽样 方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层 后,在每一层抽样时可采用简单随机抽样或系统抽样. 【讲一讲提高技能】 1 必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成 几个组,则分段间隔即为

N n

N n

N n

N N n n

N n

N ( N 为样本容量),首先确定在第一组中抽取的个体的号码数, n

再从后面的每组中按规则抽取每个个体. 解决此类题目的关键是深刻理解各种抽样方法的特 点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容 量和总体容量的比值. 2 典型例题: 例 1 某初级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方 法取 10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简 单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为 1,2, ??,270; 使用系统抽样时, 将学生统一随机编号 1, 2, ??, 270, 并将整个编号依次分为 10 段 如 果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270; 关于上述样本的下列结论中,正确的是( )
10

A.②、③都不能为系统抽样 B.②、④都不能为分层抽样 C.①、③都可能为分层抽样 D.①、④都可能为系统抽样 【答案】C 【解析】

例 2 某单位有 840 名职工, 现采用系统抽样方法, 抽取 42 人做问卷调查, 将 840 人按 1, 2, ?, 840 随机编号, 则抽取的 42 人中, 编号落入区间[481, 720]的人数为 ( (A) 11 (B) 12 (C) 13 (D) 14 )

分析:840 人中按系统抽样抽取 42 人,即要把 840 人分成 42 组,那么每组人数为 人,区间[481, 720]长度为 720 ? 480 ? 240 ,占

840 ? 20 42

240 ? 12 组. 20

【解析】840 人中按系统抽样抽取 42 人,即每 20 人中抽取 1 人由题设可知区间[481, 720] 长度为 240,落在区间内的人数为 12 人.此类问题主要掌握系统抽样方法就可解决. 【练一练提升能力】 1. 某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从 该校四个年级的本科生中抽取一个容量为 300 的样本进行调查.已知该校一年级、二年级、 三年级、四年级的本科生人数之比为 4:5:5:6,则应从一年级本科生中抽取_______名学 生. 【答案】60. 【解析】应从一年级抽取 300 ?

4 4+ 5+ 5+ 6

60 名.

2.某校现有高一学生 210 人,高二学生 270 人,高三学生 300 人,用分层抽样的方法从这三 个年级的学生中随机抽取 n 名学生进行问卷调查,如果已知从高一学生中抽取的人数为 7, 那么从高三学生中抽取的人数应为( A.10 【答案】A
11

) D.7

B.9

C.8

【解析】

频率分布直方图与茎叶图 【背一背重点知识】 频率 1. ①频率分布直方图:在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率 组距 用各长长方形的面积表示,各小长方形的面积总和等于 1.连接频率分布直方图中各小长 方形上端的中点, 就得到频率分布折线图. 随着样本容量的增加, 作图时所分的组数增加, 组距减小, 相应的频率分布折线图就会越来越接近于一条光滑的曲线, 统计中称之为总体 密度曲线,它能够更加精细的反映出总体的分布规律. 2.频率分布直方图的步骤如下:(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ) 列频率分布表;(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直 观地表明分布的形状. 3.茎叶图:茎是指中间的一列数,叶是从茎的旁边生长出来的数. 茎叶图表示数据有两个突出的优点: 其一是统计图上没有原始数据的损失, 所有信息都可以从这个茎叶图中得到, 其二是在比赛 时随时记录,方便记录与表示. 4.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可 以随时记录,给记录和表示都带来方便. 【讲一讲提高技能】 1 必备技能: (1)在频率分布直方图中估计中位数和平均数的方法 ①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. ②平均数: 在频率分布直方图中, 平均数等于图中每个小矩形面积乘以小矩形底边中点的横 坐标之和.

12

(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、 方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越 稳定. 2 典型例题: 例 1 某种树木的底部周长的取值范围是 ?80,130? ,它的频率分布直方图如图所示,则在抽 测的 60 株树木中,有 株树木的底部周长小于 100 cm.

分析:根据频率分布直方图计算底部周长小于 100cm 的株数为

(0.015 ? 0.025) ?10 ? 60 ? 24 .
【解析】由题意在抽测的 60 株树木中,底部周长小于 100cm 的株数为

(0.015 ? 0.025) ?10 ? 60 ? 24 .
例 2 下面茎叶图表示的是甲,乙两人在 5 次综合测评中的成绩,其中一个数字被污损,则甲 的平均成绩超过乙的平均成绩的概率为( )

A.

7 10

B.

3 10

C.

1 5

D.

4 5

【答案】D 【解析】

13

【练一练提升能力】 1. 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成 6 组: [40,50) ,[50,60) ,[60,70) ,[70,80) ,[80,90) ,[90,100]加以统计,得到如图所 示的频率分布直方图.已知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为( )

(A)588 【答案】B 【解析】

(B)480

(C)450

(D)120

试题分析:该模块测试成绩不少于 60 分的学生人数为

?0.030 ? 0.025 ? 0.015 ? 0.010? ?10? 600 ? 480 .故 B 正确.
2.某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所 示.以组距为 5 将数据分组成 [0,5) , [5,10) ,?, [30,35) , [35, 40] 时,所作的频率分布 直方图是( )

【答案】A 【解析】由茎叶图,有 组别

[0,5)

[5,10)

[10,15)

[15, 20)

[20, 25)

[25,30)

[30,35)

[35, 40]

14

频数

1

1

4

2

4

3

3

2

上表对应的频率分布直方图为 A,故选 A.

样本的数字特征、变量间的相关关系与独立性检验 【背一背重点知识】 1.用样本的数字特征估计总体的数字特征: ①平均数:样本数据的算术平均数,即 x ? ②样本方差、标准差: 方差 s ?
2

x1 ? x2 ? ? ? xn . n

1 [( x1 ? x) 2 ? ( x2 ? x) 2 ? ? ? ( xn ? x) 2 ] ,标准差 n

s?

1 [( x1 ? x)2 ? ( x2 ? x)2 ? ? ? ( xn ? x)2 ] n

2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散 程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且 平方后可能夸大了偏差的程度, 所以虽然方差与标准差在刻画样本数据的分散程度上是一样 的,但在解决实际问题时,一般多采用标准差.通常用样本方差估计总体方差,当样本容量 接近总体容量时,样本方差很接近总体方差. 3.两个变量间的相关关系: ①有关概念:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.相关 关系是一种非确定性关系, 即相关关系是非随机变量与随机变量之间的关系. 如果一个变量 的值由小变大时另一个变量的值由小变大, 这种相关称为正相关; 如果一个变量的值由小变 大时另一个变量的值由大变小, 这种相关称为负相关; 如果散点图中点的分布从整体上看大 致在一条直线附近,就称这两个变量之间具有线性相关关系. ②回归方程:求回归直线,使“离差平方和为最小”的方法叫做最小二乘法,用最小二乘法

? ?a ? 是两个具有线性相关关系的变量的一组数据 求得回归方程 ? y ? bx
?、 ? 是待定参数.从 a ?、 ? 与 r 的计算公式 ( x1,y1 ), ( x2,y2 ), ?, ( xn,yn ) 的回归方程,其中 a b b

15

n n ? ( x ? x )( y ? y ) xi yi ? nx y ? ? i i ? i ?1 i ?1 ? ? ? n ?b ? n 2 ? ( xi ? x) xi2 ? n( x) 2 与 ? ? ? i ?1 i ?1 ?? ? ? ?a ? y ? bx

r?

? ( xi ? x )( yi ? y )
i ?1

n

? (x ? x ) ? ( y ? y)
2 i ?1 i i ?1 i

n

n

?
2

? x y ? nxy
i ?1 i i

n

(? xi2 ? nx 2 )(? yi2 ? ny 2 )
i ?1 i ?1

n

n

? 与 r 符号相同。 可以看出:(ⅰ)回归直线必过点 x, y ;(ⅱ) b
③回归分析: 是对具有相关关系的两个变量进行统计分析的一种常用方法, 主要判断特定量 之间是否有相关关系, 如果有就找出它们之间贴近的数学表达式。 比如线性回归分析就是分 析求出的回归直线是否有意义,而判断的依据就是|r|的大小:|r|≤1,并且|r|越接近 1, 线性相关程度越强;|r|越接近 0,线性相关程度越弱。从散点图来看,只有在散点图大致 呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。 线性相关检验的步骤如下: (ⅰ)作统计假设:x 与 Y 不具有线性相关关系; (ⅱ)根据小概率 0.05 与 n-2 在附表中查出 r 的一个临界值 r0.05 ; (ⅲ)根据样本相关系数计算公式求出 r 的值; (ⅳ)作统计推断,如果|r|> r0.05 ,表明有 95%的把握认为 x 与 Y 之间具有线性相关关系; 如果|r|≤ r0.05 ,我们没有理由拒绝原来的假设。这时寻找回归直线方程是毫无意义的。 4.独立性检验:2×2 列联表 B A A 总计 构造一个随机变量 ? ?
2

? ?

B n12 n22 n+2
2

合计 n1+ n2+ n
2

n11 n21 n+1

n ? n11n22 ? n12 n21 ? n1? n2? n?1n?2

,利用随机变量 χ 来判断“两个分类变量有关

系”的方法称为独立性检验:

16

若 ? 2 ? 3.841 ,则有 95%把握认为 A 与 B 有关;若 ? 2 ? 6.635 ,则有 99%把握认为 A 与 B 有关; 其中 ? 2 ? 3.841 是判断是否有关系的临界值, ? 2 ? 3.841 应判断为没有充分证据显示 A 与 B 有关,而不能作为小于 95%的量化值来判断. 注意:线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的 好坏可由直观性直接判断,没有散点图时,只须套用公式求 r,再作判断即可.独立性检验 没有直观性,必须依靠 ? 2 作判断. 【讲一讲提高技能】 1 必备技能: (1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为 1. (2)众数、中位数及平均数的异同 众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体 容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值 x ? ②总体方差(标准差)的估计: s ?
2

1 n ? xi . n i ?1

1 n ( xi ? x)2 ,标准差 s ? s2 , ? n i ?1

方差(标准差)较小者较稳定. 2 典型例题: 例 1 一名小学生的年龄和身高(单位:cm)的数据如下表:

由散点图可知,身高 y 与年龄 x 之间的线性回归方程为 y ? 8.8 x ? a ,则 a 的值为( ) A.65 【答案】A 【解析】 B.74 C.56 D.47

17

例 2 某高校共有 15000 人,其中男生 10500 人,女生 4500 人,为调查该校学生每周平均体 育运动时间的情况, 采用分层抽样的方法, 收集 300 位学生每周平均体育运动时间的样本数 据(单位:小时) (Ⅰ)应收集多少位女生样本数据? (Ⅱ)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所 示) ,其中样本数据分组区间为: 估计该校学生每周平均体育运动时间超过 4 个小时的概率. .

(Ⅲ) 在样本数据中, 有 60 位女生的每周平均体育运动时间超过 4 个小时.请完成每周平均 体育运动时间与性别的列联表,并判断是否有 95% 的把握认为“该校学生的每周平均体育 运动时间与性别有关”. 附:

n(ad ? bc)2 K ? (a ? b)(c ? d )(a ? c)(b ? d )
2

P( K 2 ? k0 )

0.10 2.706

0.05 3.841

0.010 6.635

0.005 7.879

k0

分析: (1)利用分层抽样的应用可以算出 300 ?

4500 ? 90 ,记应收集 90 位女生的样本 15000

18

数据.(2)根据频率分布直方图可得1 ? 2 ? (0.100 ? 0.025) ? 0.75 .(3)根据题意 300 位学生中有 300 ? 0.75 ? 225 人的每周平均体育运动时间超过 4 小时,75 人的每周平均体 育运动时间不超过 4 小时.又因为样本数据中有 210 份是关于男生的,90 份是关于女生的. 可以画出每周平均体育运动时间与性别列联表,计算

K2 ?

300 ? (45 ? 60 ? 30 ?165) 100 ? ? 4.762 ? 3.841 .则有 95% 的把握认为“该校 75 ? 225 ? 210 ? 90 21

学生的每周平均体育运动时间与性别有关”. 【解析】

由(2)知,300 位学生中有 300 ? 0.75 ? 225 人的每周平均体育运动时间超过 4 小时,75 人的每周平均体育运动时间不超过 4 小时.又因为样本数据中有 210 份是关于男生的, 90 份 是关于女生的.所以每周平均体育运动时间与性别列联表如下: 每周平均体育运动时间与性别列联表 男生 每周平均体育运动时间 不超过 4 小时 每周平均体育运动时间 超过 4 小时 总计 210 90 300 165 60 225 45 女生 30 总计 75

结合列联表可算得 K

2

?

300 ? (45 ? 60 ? 30 ?165) 100 ? ? 4.762 ? 3.841 . 75 ? 225 ? 210 ? 90 21

有 95% 的把握认为“该校学生的每周平均体育运动时间与性别有关”. 【练一练提升能力】 1. 为了解某班学生喜爱打篮球是否与性别有关, 对本班 50 人进行了问卷调查得到了如下的

19

列联表: 喜爱打篮球 男生 女生 合计 10 50 不喜爱打篮球 5 合计

已知在全部 50 人中随机抽取 1 人抽到喜爱打篮球的学生的概率为 . (1)请将上面的列联表补充完整; (2)是否有 99.5%的把握认为喜爱打篮球与性别有关?说明你的理由; 下面的临界值表供参考: p(K ≥k) 0.15 k 2.072
2

0.10 2.706

0.05 3.841

0.025 5.024

0.010 6.635

0.005 7.879

0.001 10.828

(参考公式: 【答案】 (1) 喜爱打篮球 男生 女生 合计 20 10 30

,其中 n=a+b+c+d)

不喜爱打篮球 5 15 20

合计 25 25 50

(2)有 99.5%的把握认为喜爱打篮球与性别有关 【解析】

20

列联表补充如下: 喜爱打篮球 男生 女生 合计 20 10 30 不喜爱打篮球 5 15 20 合计 25 25 50

(2)∵ ∴有 99.5%的把握认为喜爱打篮球与性别有关. 2. 某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数据如下表: 年份 年份代号 t 人均纯收入 y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9

(Ⅰ)求 y 关于 t 的线性回归方程; (Ⅱ)利用(Ⅰ)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的 变化情况,并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:

b?

?

? ? t ? t ?? y ? y ?
i ?1 i i

n

? ?t ? t ?
i ?1 i

n

2

? ? ? y ? bt ,a

【答案】 (Ⅰ) $ (Ⅱ)在 2007 至 2013 年该地区农村居民家庭人均纯收入在 y ? 0.5t ? 2.3 ; 逐年增加,平均每年增加 0.5 千元; 6.8千 元. 【解析】

21

(一)

选择题(12*5=60 分)

1.有 3 个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能 性相同,则这两位同学不在同一个兴趣小组的概率为( A. ) D.

1 3

B.

1 2

C.

2 3

3 4

【答案】C 【解析】 试题分析:甲乙同学各自在一个小组时共有 6 种可能,甲乙同学在同一组时共有 3 种可能, 则这两位同学不在同一个兴趣小组的概率为 P ?

6 2 ? .故 C 正确. 6?3 3

2.抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:

则成绩较稳定(方差较小)的那位运动员成绩的方差为 【答案】2 【解析】由表中数据知,乙运动员成绩稳定,平均成绩 x ?
2 方差 s ?

.

89 ? 90 ? 91 ? 88 ? 92 ? 90 , 5

1 [(90 ? 89)2 ? (90 ? 90)2 ? (90 ? 91)2 ? (90 ? 88)2 ? (90 ? 92)2 ] ? 2 . 5

3.四名同学根据各自的样本数据研究变量 x, y 之间的相关关系,并求得回归直线方程,分

22

别得到以下四个结论: ① y 与 x 负相关且 ? y ? 2.347 x ? 6.423 ; ③ y 与 x 正相关且 ? y ? 5.437 x ? 8.493 ; 其中一定不正确 的结论的序号是( ... A.①② 【答案】 D 【解析】由正负相关的定义知, ①错, 表达式表示的是正相关, ④错, 表达式表示的负相关, 故①④一定错,选 D. 4. 10 名同学参加投篮比赛,每人投 20 球,投中的次数用茎叶图表示(如图) ,设其平均数 为 a ,中位数为 b ,众数为 c ,则有( ) B.②③ ② y 与 x 负相关且 ? y ? ?3.476x ? 5.648 ; ④ y 与 x 正相关且 ? y ? ?4.326x ? 4.578 . ) C.③④ D. ①④

A. a ? b ? c 【答案】D 【解析】

B. b ? c ? a

C. c ? a ? b

D. c ? b ? a

5.甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则(



A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差 【答案】C 【解析】
23

又图形可知, x甲 ?

1 1 (4 ? 5 ? 6 ? 7 ? 8) ? 6, x乙 ? (5 ? 5 ? 5 ? 6 ? 9) ? 6 ,甲成绩的方差为 5 5 1 1 2 (2 ? 2 ? 12 ? 2) ? 2 ,乙成绩的方差为 (12 ? 3 ? 32 ? 1) ? 2.4 .故选 C. 5 5

6.采用系统抽样方法从 960 人中抽取 32 人做问卷调查, 为此将他们随机编号为 1 , 2 , ??,

960 ,分组后在第一组采用简单随机抽样的方法抽到的号码为 9 .抽到的 32 人中,编号落入
区间 [1, 450] 的人做问卷 A ,编号落入区间 [451,750] 的人做问卷 B ,其余的人做问卷 C . 则抽到的人中,做问卷 C 的人数为 ( A. 7 D. 15 【答案】A 【解析】由系统抽样的原知将 960 人分 30 组,所以第一组抽 450/30=15 人,第二组抽 (750-450)/30=10,第三组抽 32-15-10=7 人.故选 A. 7.袋中装有完全相同的 5 个小球,其中有红色小球 3 个,黄色小球 2 个,如果不放回的依次 摸出 2 个小球,则在第一次摸出红球的条件下,第二次摸出红球的概率是( ) A. B. 9 ) C. 10

3 10

B.

3 5

C.

1 2

D.

1 4

【答案】C 【解析】

8.一组数据 x1 、 x 2 、 x3 、 x 4 、 x5 、 x6 的方差为 1,则 2 x1 ? 1 、 2 x2 ? 1 、 2 x3 ? 1 、 2 x4 ? 1 、

2 x5 ? 1、 2 x6 ? 1 的方差为( )
A.1 【答案】D 【解析】 B.2 C.3 D.4

24

设原来数据的平均数为 x ? 则又方差公式有 s ?

1 ? x1 ? x2 ? ? ? x6 ? , 6

2 2 2 1 [ x1 ? x ? x2 ? x ? ? ? x6 ? x ] ? 1 , 6 1 新数据的平均数 x ' ? ? 2 x1 ? 1 ? 2 x2 ? 1 ? ? ? 2 x6 ? 1? ? 2 x ? 1 , 6 2 2 1 所以新数据的方差 s ' ? [ 2 x1 ? 1 ? x ' ? ? ? 2 x6 ? 1 ? x ' ] ? 4 s ? 4 ,选 D. 6

?

? ?

?

?

?

?

?

?

?

9.设函数 f ( x) ? x 2 ? 2 x ? m , m ? R .若在区间 ? ?2, 4? 上随机取一个数 x , f ( x) ? 0 的概率 为 2 ,则 m 的值为( 3 A. 2 【答案】D 【解析】 B. ?2 ) C. 3 D. ?3

10.分别在区间 [1,6] , [1,4] 内各任取一个实数依次为 m, n ,则 m ? n 的概率是( A.0.3 【答案】C B.0.667 C.0.7 D.0.714



【解析】该题有两个变量 m, n ,所以考虑构造点 (m, n) ,因基本事件总数是无限,可考虑 几何概型求概率,所有点 (m, n) 构成一个长,宽分别为 5 和 3 的矩形,在此矩形内取点,则

9 2? 7 . 点落在 y ? x 的概率为 P ? 15 10 15 ?

25

y 4 1 1 6 x

11.下图是两组各 7 名同学体重(单位: kg )数据的茎叶图.设 1 , 2 两组数据的平均数依 次为 x1 和 x2 ,标准差依次为 s1 和 s 2 ,那么( (注:标准差 s ? )

1 [( x1 ? x ) 2 ? ( x2 ? x ) 2 ? ? ? ( xn ? x ) 2 ] ,其中 x 为 x1 , x2 , ?, xn 的平均数) n

A. x1 ? x2 , s1 ? s2 C. x1 ? x2 , s1 ? s2 【答案】C 【解析】

B. x1 ? x2 , s1 ? s2 D. x1 ? x2 , s1 ? s2

12.给出下列五个命题: ①某班级一共有 52 名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容易为 4 的 样本,已知 7 号,33 号,46 号同学在样本中,那么样本另一位同学的编号为 23; ②一组数据 1、2、3、4、5 的平均数、众数、中位数相同;

26

③一组数据 a、0、1、2、3,若该组数据的平均值为 1,则样本标准差为 2; ④根据具有线性相关关系的两个变量 的统计数据所得的回归直线方程为 y=ax+b 中,b=2, x ? 1, y ? 3 ,则 a=1; ⑤如图是根据抽样检测后得出的产品样本净重(单位:克)数据绘制的频率分布直方图,已知 样本中产品净重小于 100 克的个数是 36,则样本中净重大于或等于 98 克,并且小于 104 克的 产品的个数是 90.

【答案】B 【解析】

填空题(4*5=20 分) 13.从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 至 350 度之间,频 率分布直方图如图所示. (Ⅰ)直方图中 x 的值为_________; (Ⅱ)在这些用户中,用电量落在区间 [100, 250) 内的户数为_________.

27

【答案】 (1)0.0044 【解析】 x ?

(2)70

1 ? (0.0012 ? 0.0024 ? 2 ? 0.0036 ? 0.006) ? 50 ? 0.0044 ,用户落在 50

[100, 250) 间的概率 P ? (0.0036 ? 0.00434 ? 0.0060) ? 50 ? 0.697 ,
故在这个区间的用户 0.697 ?100 ? 70 人. 14.甲乙二人玩猜字游戏,先由甲在心中想好一个数字,记作 a ,然后再由乙猜甲刚才所想 到的数字,并把乙猜到的数字记为 b ,二人约定: a 、 b ??1,2,3,4? ,且当 a ? b ? 1 时乙 为胜方,否则甲为胜方.则甲取胜的概率是______. 【答案】 【解析】

3 8

15. 某单位为了了解用电量 y 度与气温 x℃之间的关系,统计了某 4 天的用电量与当天气 温,数据如下表 气温(℃) 18 13 34 10 38

?1
64

用电量(度) 24

? ? bx ? a 中的 b ? ?2 ,预测当气温为 5 ℃时,该单位用电量 由表中数据可得线性回归方程 y

的度数约为 【答案】 50 【解析】

度.

试题分析:先根据表格算出样本中心点的坐标 ( x, y ) ,代入回归方程后求出 a 的值,然后再

28

将 x ? 5 代入回归方程即可求得用电量的预测值.由表格数据可得样本中心点的坐标是

18 ? 13 ? 10 ? 1 24 ? 34 ? 38 ? 64 ( x, y ) ? ( , ) ? (10, 40) ,代入方程可求得 a ? 60 ,所以当 4 4

x ? 5 时预测用电量 y ? 50 度,故应填: 50 .
16.某市为增强市民的环境保护意识, 面向全市征召义务宣传志愿者.现从符合条件的志愿者 中随机抽取 100 名按年龄分组:第 1 组 ?20,25? ,第 2 组 ?25,30? ,第 3 组 ?30,35? ,第 4 组 ?35,40? ,第 5 组 [40, 45] ,得到的频率分布直方图如图所示.(1)若从第 3,4,5 组中用 分层抽样的方法抽取 6 名志愿者参广场的宣传活动,应从第 3,4,5 组各抽取 者? (2) 在(1)的条件下,该市决定在第 3,4 组的志愿者中随机抽取 2 名志愿者介绍宣传经 验,则第 4 组至少有一名志愿者被抽中的概率是 . 名志愿

【答案】 (1)第 3,4,5 组中分别抽取 3 人,2 人,1 人; (2) 【解析】

7 . 10

参考:

29

17. (本小题满分 12 分) 某国际会议在北京召开, 为了搞好对外宣传工作, 会务组选聘了 16 名男记者和 14 名女记者 担任对外翻译工作,调查发现,男、女记者中分别有 10 人和 6 人会俄语. (Ⅰ)根据以上数据完成以下 2×2 列联表: 会俄语 男 女 总计 30 不会俄语 总计

并回答能否在犯错的概率不超过 0.10 的前提下认为性别与会俄语有关?

n(ad-bc)2 参考公式:K = ,其中 n=a+b+c+d (a+b)(c+d)(a+c)(b+d)
2

参考数据:

P (K2≥k0) 0.40 0.25 0.10 0.010 k0
0.708 1.323 2.706 6.635

(Ⅱ) 会俄语的 6 名女记者中有 4 人曾在俄罗斯工作过, 若从会俄语的 6 名女记者中随机抽 取 2 人做同声翻译,求抽出的 2 人都在俄罗斯工作过的概率.

17 解: (Ⅰ)

30

15 种,其中 2 人都在俄罗斯工作过的是 AB,AC,AD,BC,BD,CD 共 6 种,所以抽出的女 6 2 记者中,2 人都在俄罗斯工作过的概率是 P= = . 15 5

31



相关文档:


更多相关文章:
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专题07 选讲内容(含解析)_高考_高中教育_教育专区。专题七 选讲部分 几何证明选讲 【背一背重点知识】 1...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专题04 立体几何解答题 理(含解析)_高考_高中教育_教育专区。专题四 立体几何解答题(理) 空间向量运算与利用...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专题04 立体几何解答题 文(含解析)_高考_高中教育_教育专区。专题四 立体几何解答题(文) 以直线与平面所成...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专题05 解析几何解答题(含...0 12 分 17 代入得 (1 ? k )( 2 4k 2 ? 12 8k 2 2 ? 1 ) ? ...
2016年高考数学 中等生百日捷进提升系列 专题01 集合与...
2016年高考数学 中等生百日捷进提升系列 专题01 集合与常用逻辑用语 (含解析)_高考_高中教育_教育专区。第一章 集合与常用逻辑用语集合的基本运算 【背一背重点...
2016年高考数学 中等生百日捷进提升系列 专题03 导数(...
2016年高考数学 中等生百日捷进提升系列 专题03 导数(含解析)_高考_高中教育_...,解得 a ? 2 ,故选 C. 2 2 (一) 选择题(12*5=60 分) 9 1. ...
2016年高考数学 中等生百日捷进提升系列 专题09 直线和...
2016年高考数学 中等生百日捷进提升系列 专题09 直线和圆的方程(含解析)_高考...到直线 l 的距离小于 2 的概率为___. 【答案】 【解析】 1 6 12 13 +...
2016年高考数学 中等生百日捷进提升系列 专题05 平面向...
2016年高考数学 中等生百日捷进提升系列 专题05 平面向量(含解析)_高考_高中...6 2 32 ? m2 | a |?| b| (一) 选择题(12*5=60 分) 1.已知点 P...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专...
2016年高考数学 中等生百日捷进提升系列(综合提升篇)专题06 导数解答题(含解析)_高考_高中教育_教育专区。专题六 导数解答题 导数与函数的单调性的综合题 【背...
2016年高考数学 中等生百日捷进提升系列 专题06 数列的...
2016年高考数学 中等生百日捷进提升系列 专题06 数列的通项公式(含解析)_高考...【解析】 n . 4(n ? 1) (一) 选择题(12*5=60 分) ) 1.设 Sn 是...
更多相关标签:
衡水中学2016百日誓师    衡水一中2016百日誓师    衡水二中2016百日誓师    2016百日安全活动主题    2016孩子百日宴主持词    百日攻坚工作小结2016    2016高三百日誓师ppt    福州市百日攻坚 2016    

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图