9512.net
甜梦文库
当前位置:首页 >> 数学 >>

1.2独立性检验的基本思想及其应用54



※高二文科班数学课堂学习单 54※ 班级 姓名 小组 1.2 独立性检验的基本思想及其应用 54 一,学习目标: 1、 理解独立性检验的基本思想及实施步骤。 2、了解随机变量 K2 的含义 二,自学导航:p10-p15 问题一:为了探究患慢性气管炎是否与吸烟有关,调查了 339 名 50 岁以上的人,调查 结果如下表所示,那么,50 岁以上的人患慢性气管炎与吸烟有关系吗? 患慢性气管炎 吸烟 不吸烟 总计 43 13 56 , b= ,n= 283 , c= 未患慢性气管炎 162 总计 205 134 339 , d= , a+b= ,

[自主解答] 2×2 列联表中可知: a= c+d= ,a+c= ,b+d=

,代入公式得 K2 的观测值

为 k= ≈ . 由于 >6.635, 所以在犯错概率不超过 的前提下认为 50 岁以 上的人患慢性气管炎与吸烟有关系. 小结:解决一般的独立性检验问题,首先由所给 2×2 列联表确定 a,b,c,d,n 的值, 然后代入随机变量的计算公式求出观测值 k, 将 k 与临界值 k0 进行对比, 确定有多大把握认 为两个分类变量有关系. 3.独立性检验 定义 公式 利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关 系”的方法称为两个分类变量的独立性检验 n?ad-bc?2 K2= ,其中 n=a+b+c+d ?a+b??c+d??a+c??b+d? ①认真读题,取出相关数据,作出 2×2 列联表; ②根据 2×2 列联表中的数据,计算 K2 的观测 ③通过观测值 k 与临界值 k0 比较,得出事件有关的可能性大小

具体步骤

4,我生成的问题:

三,我的收获:本节课的知识结构、学到的方法、易错点 四,课堂检测: 1.下面是 2×2 列联表: y1 x1 x2 总计 则表中 a、b 的值分别为 , a 2 b y2 21 25 46 。
1

总计 73 27

2.在 2×2 列联表中,数值

a c 和 相差越大,则两个变量有关系的可能性就( a+b c+d y1 y2 b d b+d 总计 a+b c+d a+b+c+d a c a+c

)

x1 x2 总计

A.越大 B.越小 C.无法判断 D.以上均不对 3.考察棉花种子经过处理跟生病之间的关系得到如下表数据:根据以上数据,则( ) 种子处理 得病 不得病 总计 32 61 93 种子未处理 101 213 314 总计 133 274 407

A.没有充分的理由说明种子经过处理跟是否生病有关;B.种子经过处理跟是否生病有关 C.种子是否经过处理决定是否生病; D.以上都是错误的 407×?32×213-61×101?2 解析:由公式得 K2 的观测值为 k= ≈0.164 133×274×93×314 4.若由一个 2×2 列联表中的数据计算得 K2 的观测值 k≈4.013,那么在犯错误的概率 不超过________的前提下,认为两个变量之间有关系. 5. 某高校统计初步课程的教师随机调查了选该课的一些学生的情况, 具体数据如下表: 专业 性别 男生 女生 50×?13×20-10×7?2 k= ≈4.844. 23×27×20×30 因 k>3.841,故确认“主修统计专业与性别有关系”,判断出错的可能性为________. 6.如图是对用药与不用药,感冒已好与未好进行统计的等高条形图.若此次统计中, 用药的患者是 70 人,不用药的患者是 40 人,试问: 能否在犯错误的概率不超过 0.01 的前提下认为“感冒 已好与用药有关”? 解: 根据题中的等高条形图, 由于用药的患者是 70 人, 不用药的患者是 40 人,因此,在用药的患者中感冒已 好的人数为 ;在不用药的患者中感冒已好 的人数为 . 2×2 列联表如下: 感冒已好 用药 不用药 总计 68 42 感冒未好 总计 70 40 110 非统计专业 13 7 统计专业 10 20

为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量 K2 的观测值为

根据 2×2 列联表中的数据,得到 k= ≈ > , 所以在犯错误的概率不超过 0.01 的前提下认为“感冒已好与用药有关”. ,五,作业
2

1. 如果在犯错误的概率不超过 0.05 的前提下认为事件 A 和 B 有关, 那么具体算出的数 据满足( ) 2 A.K >3.841 B.K2<3.841 C.K2>6.635 D.K2<6.635 2.(湖南高考)通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的 列联表: 男 爱好 不爱好 总计 40 20 60 女 20 30 50 总计 60 50 110

n?ad-bc?2 110×?40×30-20×20?2 由 K2= 算得,K2= ≈7.8. ?a+b??c+d??a+c??b+d? 60×50×60×50 附表: P(K2≥k) k 0.050 3.841 0.010 6.635 0.001 10.828

参照附表,得到的正确结论是( ) A.在犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别无关” C.有 99%以上的把握认为“爱好该项运动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关” 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) 2 A.若 K =6.635,则在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关,那 么在 100 个吸烟的人中必有 99 人患有肺病 B. 从独立性检验可知, 在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关时, 我们说某人吸烟,那么他有 99%的可能患有肺病 C.若从统计量中求出在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关,是 指有 1%的可能性使得推断出现错误 D.以上三种说法都不正确 4.下列关于等高条形图的叙述正确的是( ) A.从等高条形图中可以精确地判断两个分类变量是否有关系 B.从等高条形图中可以看出两个变量频数的相对大小 C.从等高条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 5.班级与成绩 2×2 列联表:表中数据 m,n,p,q 的值应分别为________. 优秀 甲班 乙班 总计 10 7 m 不优秀 35 38 n 总计 45 p q

6.为研究某新药的疗效,给 50 名患者服用此药,跟踪调查后得下表中的数据: 无效 男性患者 15 有效 35 总计 50
3

女性患者 总计

6 21

44 79

50 100

设 H0:服用此药的效果与患者性别无关,则 K2 的观测值 k≈________,从而得出结论: 服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 7.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感 冒的作用”,利用 2×2 列联表计算得 K2≈3.918,经查对临界表知 P(K2≥3.841)≈0.05,对 此,四名同学作出以下的判断: ①有 95%的把握认为:“这种血清能起到预防感冒的作用” ②若某人未使用该血清,则一年内他有 95%的可能得感冒 ③这种血清预防感冒的有效率为 95% ④这种血清预防感冒的有效率为 5%. 其中正确的判断是________. 8. 为了调查某生产线上某质量监督员甲在与不在对产品质量好坏有无影响, 现统计数 据如下:质量监督员甲在现场时,990 件产品中合格品 982 件,次品 8 件;甲不在现场时, 510 件产品中合格品 493 件,次品 17 件.试用列联表、独立性检验的方法对数据进行分析, 并指出你所得出的结论在什么范围内有效. 解:根据题目所给的数据作出如下的列联表: 产品正品数 甲在现场 甲不在现场 总计 982 493 1 475 次品数 8 17 25 总计 990 510 1 500

根据列联表中的数据,可得 K2 观测值为: n?ad-bc?2 k= = ?a+b??c+d??a+c??b+d? ≈ .

由于 k= > ,所以在犯错误的概率不超过 的前 提下,认为质量监督员甲在不在现场与产品质量有关系.但这个结论只对统计的这 1 500 件 产品有效.

4

10.下表是某地区的一种传染病与饮用水的调查表: 得病 干净水 不干净水 总计 52 94 146 不得病 466 218 684 总计 518 312 830

(1)这种传染病是否与饮用不干净水有关,请说明理由; (2)若饮用干净水得病 5 人,不得病 50 人,饮用不干净水得病 9 人,不得病 22 人,试 按此样本数据分析这种疾病是否与饮用不干净水有关,并比较两种样本在反映总体时的差 异. 解:(1)由公式得 K2 的观测值为 830×?52×218-466×94?2 k= ≈54.212. 146×684×518×312 因为 54.212>10.828, 所以在犯错误的概率不超过 0.001 的前提下认为这种传染病与饮用不干净水有关. (2)依题意得 2×2 列联表如下: 得病 干净水 不干净水 总计 5 9 14 不得病 50 22 72 总计 55 31 86

86×?5×22-50×9?2 此时,K 的观测值 k= ≈5.785. 55×31×14×72
2

由于 5.785>5.024, 所以我们在犯错误的概率不超过 0.025 的前提下认为这种传染病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但 (1)中我们在犯错 误的概率不超过 0.001 的前提下肯定结论的正确性,(2)中我们在犯错误的概率不超过 0.025 的前提下肯定结论的正确性.

1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系, 经过调查得到如下列联表: 积极支持 企业改革 工作积极 工作一般 总计 54 32 86 不太支持 企业改革 40 63 103 总计 94 95 189

根据列联表的独立性检验,能否在犯错误的概率不超过 0.005 的前提下认为工作态度与 支持企业改革之间有关系? 解:由列联表中的数据,得 K2 的观测值为 189×?54×63-40×32?2 k= ≈10.759>7.879, 94×95×86×103 ∴在犯错误的概率不超过 0.005 的前提下,认为工作态度与支持企业改革之间有关系.
5

考点二

有关“无关”的检验

为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了 361 名高 二在校学生,调查结果如下:理科对外语有兴趣的有 138 人,无兴趣的有 98 人,文科对外 语有兴趣的有 73 人, 无兴趣的有 52 人. 试分析学生选报文、 理科与对外语的兴趣是否有关? [自主解答] 根据题目所给的数据得到如下列联表: 理科 有兴趣 无兴趣 总计
2

文科 73 52 125

总计 211 150 361

138 98 236

根据列联表中数据由公式计算得 K 的观测值为 361×?138×52-73×98?2 - k= ≈1.871×10 4. 236×125×211×150 因为 1.871×10 4<2.706,所以据目前的数据不能认为学生选报文、理科与对外语的兴 趣有关,即可以认为学生选报文、理科与对外语的兴趣无关.


————— ————————————— 2 (1)给出的随机变量 K 的值 k,其值越大,说明“X 与 Y 有关系”成立的可能性越大, 其值越小,说明“X 与 Y 有关系”成立的可能性越小. (2)若 k≤2.076,则认为没有充分的证据显示两个分类变量有关系.

2.在从烟台——大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上 晕船的情况如表所示: 晕船 男人 女人 总计 32 8 40 不晕船 51 24 75 总计 83 32 115

据此资料,你是否认为在恶劣气候中航行,男人比女人更容易晕船? 115×?32×24-51×8?2 解:由公式得 K2 的观测值为 k= ≈1.870. 83×32×40×75 因为 1.870<2.706,所以我们没有理由说晕船跟性别有关. 考点三 独立性检验的综合应用

为了比较注射 A,B 两种药物后产生的皮肤疱疹的面积,选 200 只家兔做试验, 将这 200 只家兔随机地分成两组,每组 100 只,其中一组注射药物 A,另一组注射药物 B. 下表 1 和表 2 分别是注射药物 A 和药物 B 后的试验结果.(疱疹面积单位:mm2) 表 1:注射药物 A 后皮肤疱疹面积的频数分布表 疱疹面积 频数 疱疹面积 频数 [60,65) 30 [60,65) 10 [65,70) 25 [65,70) 40 [70,75) 20 [70,75) 20 [75,80) 30 [75,80) 10 [80,85) 15
6

表 2:注射药物 B 后皮肤疱疹面积的频数分布表

完成下面 2×2 列联表(表 3), 并回答能否在犯错误的概率不超过 0.001 的前提下认为“注 射药物 A 后的疱疹面积与注射药物 B 后的疱疹面积有差异”. 表 3: 疱疹面积小 于 70 mm2 注射药物 A 注射药物 B 总计 [自主解答] 疱疹面积小 于 70 mm2 注射药物 A 注射药物 B 总计
2

疱疹面积不小 于 70 mm2

总计

疱疹面积不 小于 70 mm2 30 65 95

总计 100 100 200

70 35 105

由列联表中的数据,得 K 的观测值为 200×?70×65-35×30?2 k= ≈24.56>10.828. 100×100×105×95 因此,能在犯错误的概率不超过 0.001 的前提下认为“注射药物 A 后的疱疹面积与注射 药物 B 后的疱疹面积有差异”. ————— ————————————— 在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中 各行、各列中数据的意义及书写格式.

3.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06) 的零件为优质品. 从两个分厂生产的零件中各抽出了 500 件, 量其内径尺寸, 得结果如下表: 甲厂: 分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02) [30.02,30.06) [30.06,30.10) [30.10,30.14) 乙厂: 分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02) [30.02,30.06) 频数 29 71 85 159 76 频数 12 63 86 182 92 61 4

7

[30.06,30.10) [30.10,30.14)

62 18

(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据建立 2×2 列联表, 并回答是否有 99%的把握认为“两个分厂生产的 零件的质量有差异”. 甲厂 优质品 非优质品 总计 解:(1)甲厂抽查的产品中有 86+182+92=360 件优质品,从而甲厂生产的零件的优质 360 品率估计为 =72%; 500 乙厂抽查的产品中有 85+159+76=320 件优质品,从而乙厂生产的零件的优质品率估 320 计为 =64%. 500 (2)由已知表中数据,可得下列 2×2 列联表: 甲厂 优质品 非优质品 总计 由列联表的数据可得 K2 的观测值 1 000×?360×180-320×140?2 k= ≈7.35>6.635, 500×500×680×320 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. 【解题高手】 【易错题】 调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示. 请估 计看营养说明是否与性别有关系? 看营养说明 男大学生 女大学生 总计 10 8 18 不看营养说明 45 27 72 总计 55 35 90 360 140 500 乙厂 320 180 500 总计 680 320 1 000 乙厂 总计

[错解] 由表中数据可知,55 名男大学生中有 10 名看营养说明,而 35 名女大学生中有 10 8 8 名看营养说明,显然男性看营养说明的比例 比女性的 要低,因此看营养说明与性别有 55 35 关. [错因] 上述解法只能说明看营养说明与性别有关成立的可能性比较大,但并不能肯定 的说二者有关,若判定看营养说明是否与性别有关需进行独立性检验. [正解] 由表中数据得 K2 的观测值为:

8

90?10×27-8×45?2 k= ≈0.292<0.455, 55×35×18×72 所以我们没有充分的证据认为看营养说明与男女性别有关.

1.2

独立性检验的基本思想及其初步应用

1.分类变量和列联表 (1)分类变量: 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表: ①定义:列出的两个分类变量的频数表,称为列联表. ②2×2 列联表: 一般地,假设两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数 列联表(称 2×2 列联表)为 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.等高条形图 (1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等 高条形图展示列联表数据的频率特征. (2)观察等高条形图发现 a c 和 相差很大,就判断两个分类变量之间有关系. a+b c+d

1.分类变量中的“变量”和“值”与函数中的变量和值有什么不同? 提示: 分类变量中所说的“变量”和“值”不一定取具体的数值. 例如: 对于性别变量, 取值有男和女两种情况,那么这里的变量指的是性别,同样这里的值是“男”或“女”.在 现实生活中,分类变量是大量存在的. 2.利用 K2 进行独立性检验,估计值的准确度与样本容量有关吗? 提示:利用 K2 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量 n 越 大,这个估计值越准确,如果抽取的样本容量很小,那么利用 K2 进行独立性检验的结果就 不具有可靠性. 3.在 K2 运算后,得到 K2 的值为 29.78,在判断变量相关时,P(K2≥6.635)≈0.01 和 P(K2≥7.879)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P(K2≥6.635)≈0.01 的含义是在犯错的概率不超过 0.01 的前提

9

下认为两个变量相关; 而 P(K2≥7.879)≈0.005 的含义是在犯错误的概率不超过 0.005 的前提 下认为两变量相关.

※高二文科班数学课堂学习单 54※ 班级 姓名 小组 1.2 独立性检验的基本思想及其应用 54 一,学习目标: 2、 理解独立性检验的基本思想及实施步骤。 2、了解随机变量 K2 的含义 二,自学导航:p10-p15 问题一:为了探究患慢性气管炎是否与吸烟有关,调查了 339 名 50 岁以上的人,调查 结果如下表所示: 患慢性气管炎 吸烟 不吸烟 总计 43 13 56 未患慢性气管炎 162 121 283 总计 205 134 339

50 岁以上的人患慢性气管炎与吸烟有关系吗? [自主解答] 2×2 列联表中可知:a=43,b=162,c=13,d=121,a+b=205,c+d =134,a+c=56,b+d=283,n=a+b+c+d=339,代入公式得 K2 的观测值为 339×?43×121-162×13?2 k= ≈7.469. 205×134×56×283 由于 7.469>6.635,所以在犯错概率不超过 1%的前提下认为 50 岁以上的人患慢性气管 炎与吸烟有关系. 小结:解决一般的独立性检验问题,首先由所给 2×2 列联表确定 a,b,c,d,n 的值, 然后代入随机变量的计算公式求出观测值 k,将 k 与临界值 k0 进行对比,确定有多大把握认 为两个分类变量有关系. 3.独立性检验 定义 公式 利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关 系”的方法称为两个分类变量的独立性检验 n?ad-bc?2 K= ,其中 n=a+b+c+d ?a+b??c+d??a+c??b+d?
2

具体步骤

①认真读题,取出相关数据,作出 2×2 列联表; ②根据 2×2 列联表中的数据,计算 K2 的观测 ③通过观测值 k 与临界值 k0 比较,得出事件有关的可能性大小

4,我生成的问题:

三,我的收获:本节课的知识结构、学到的方法、易错点 四,课堂检测: 1.下面是 2×2 列联表: y1 x1 a y2 21 总计 73
10

x2 总计

2 b

25 46

27

则表中 a、b 的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54. 答案:C 2.在 2×2 列联表中 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d )

a c 数值 和 相差越大,则两个变量有关系的可能性就( a+b c+d

A.越大 B.越小 C.无法判断 D.以上均不对 答案:A 3.考察棉花种子经过处理跟生病之间的关系得到如下表数据: 种子处理 得病 不得病 总计 32 61 93 种子未处理 101 213 314 总计 133 274 407

根据以上数据,则( ) A.没有充分的理由说明种子经过处理跟是否生病有关 B.种子经过处理跟是否生病有关 C.种子是否经过处理决定是否生病 D.以上都是错误的 解析:由公式得 K2 的观测值为 407×?32×213-61×101?2 k= ≈0.164<0.455. 133×274×93×314 答案:A 4.若由一个 2×2 列联表中的数据计算得 K2 的观测值 k≈4.013,那么在犯错误的概率 不超过________的前提下,认为两个变量之间有关系. 解析:因为 4.013>3.841,所以在犯错误的概率不超过 0.05 的前提下,认为两个变量之 间有关系. 答案:0.05 5. 某高校统计初步课程的教师随机调查了选该课的一些学生的情况, 具体数据如下表: 专业 性别 男生 女生 为 50×?13×20-10×7?2 k= ≈4.844. 23×27×20×30 因为 k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性
11

非统计专业 13 7

统计专业 10 20

为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量 K2 的观测值

为________. 解析:因为随机变量 K2 的观测值 k>3.841,所以在犯错误的概率不超过 0.05 的前提下 认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为 5%. 答案:5% 6.如图是对用药与不用药,感冒已好与未好进行统计的等高条形图.若此次统计中, 用药的患者是 70 人,不用药的患者是 40 人,试问:能否在犯错误的概率不超过 0.01 的前 提下认为“感冒已好与用药有关”?

解:根据题中的等高条形图,由于用药的患者是 70 人,不用药的患者是 40 人,因此, 在用药的患者中感冒已好的人数为 70× 3 40× =12. 10 2×2 列联表如下: 感冒已好 用药 不用药 总计 根据 2×2 列联表中的数据,得到 110×?56×28-12×14?2 k= ≈26.96>6.635, 70×40×68×42 所以在犯错误的概率不超过 0.01 的前提下认为“感冒已好与用药有关”. 56 12 68 感冒未好 14 28 42 总计 70 40 110 8 = 56 ;在不用药的患者中感冒已好的人数为 10

,五,作业

一、选择题 1. 如果在犯错误的概率不超过 0.05 的前提下认为事件 A 和 B 有关, 那么具体算出的数 据满足( ) A.K2>3.841 B.K2<3.841 C.K2>6.635 D.K2<6.635 解析:对应 P(K2≥k0)的临界值表可知,当 K2>3.841 时,在犯错误的概率不超过 0.05 的 前提下认为事件 A 与 B 有关. 答案:A 2.(湖南高考)通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的 列联表:
12

男 爱好 不爱好 总计
2

女 20 30 50

总计 60 50 110

40 20 60

n?ad-bc? 由 K2= 算得, ?a+b??c+d??a+c??b+d? 110×?40×30-20×20?2 K2= ≈7.8. 60×50×60×50 附表: P(K2≥k) k 0.050 3.841 0.010 6.635 0.001 10.828

参照附表,得到的正确结论是( ) A.在犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别无关” C.有 99%以上的把握认为“爱好该项运动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关” 解析:根据独立性检验的思想方法,正确选项为 C. 答案:C 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) 2 A.若 K =6.635,则在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关,那 么在 100 个吸烟的人中必有 99 人患有肺病 B. 从独立性检验可知, 在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关时, 我们说某人吸烟,那么他有 99%的可能患有肺病 C.若从统计量中求出在犯错误的概率不超过 0.01 的前提下认为吸烟与患肺病有关,是 指有 1%的可能性使得推断出现错误 D.以上三种说法都不正确 答案:C 4.下列关于等高条形图的叙述正确的是( ) A.从等高条形图中可以精确地判断两个分类变量是否有关系 B.从等高条形图中可以看出两个变量频数的相对大小 C.从等高条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 解析:等高条形图中仅能粗略判断两个分类变量的关系,A 错误;等高条形图中仅能找 出频率,无法找出频数,B 错误. 答案:C 二、填空题 5.班级与成绩 2×2 列联表: 优秀 甲班 乙班 总计 10 7 m 不优秀 35 38 n 总计 45 p q

表中数据 m,n,p,q 的值应分别为________. 解析:m=10+7=17,
13

n=35+38=73, p=7+38=45, q=m+n=90. 答案:17,73,45,90 6.为研究某新药的疗效,给 50 名患者服用此药,跟踪调查后得下表中的数据: 无效 男性患者 女性患者 总计 15 6 21 有效 35 44 79 总计 50 50 100

设 H0:服用此药的效果与患者性别无关,则 K2 的观测值 k≈________,从而得出结论: 服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 解析:由公式计算得 K2 的观测值 k≈4.882, ∵k>3.841,∴有 95%的把握认为服用此药的效果与患者的性别有关,从而有 5%的可能 性出错. 答案:4.882 5% 7.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感 冒的作用”,利用 2×2 列联表计算得 K2≈3.918,经查对临界表知 P(K2≥3.841)≈0.05,对 此,四名同学作出以下的判断: ①有 95%的把握认为:“这种血清能起到预防感冒的作用” ②若某人未使用该血清,则一年内他有 95%的可能得感冒 ③这种血清预防感冒的有效率为 95% ④这种血清预防感冒的有效率为 5%. 其中正确的判断是________. 解析:由题意可知只有第一位同学的判断①是正确的. 答案:① 三、解答题 8. 为了调查某生产线上某质量监督员甲在与不在对产品质量好坏有无影响, 现统计数 据如下:质量监督员甲在现场时,990 件产品中合格品 982 件,次品 8 件;甲不在现场时, 510 件产品中合格品 493 件,次品 17 件.试用列联表、独立性检验的方法对数据进行分析, 并指出你所得出的结论在什么范围内有效. 解:根据题目所给的数据作出如下的列联表: 产品正品数 甲在现场 甲不在现场 总计 982 493 1 475 次品数 8 17 25 总计 990 510 1 500

根据列联表中的数据,可得 K2 观测值为: n?ad-bc?2 k= ?a+b??c+d??a+c??b+d? 1 500×?982×17-493×8?2 = ≈13.097. 1 475×25×990×510 由于 k=13.097>10.828,所以在犯错误的概率不超过 0.001 的前提下,认为质量监督员
14

甲在不在现场与产品质量有关系.但这个结论只对统计的这 1 500 件产品有效.

10.下表是某地区的一种传染病与饮用水的调查表: 得病 干净水 不干净水 总计 52 94 146 不得病 466 218 684 总计 518 312 830

(1)这种传染病是否与饮用不干净水有关,请说明理由; (2)若饮用干净水得病 5 人,不得病 50 人,饮用不干净水得病 9 人,不得病 22 人,试 按此样本数据分析这种疾病是否与饮用不干净水有关,并比较两种样本在反映总体时的差 异. 解:(1)由公式得 K2 的观测值为 830×?52×218-466×94?2 k= ≈54.212. 146×684×518×312 因为 54.212>10.828, 所以在犯错误的概率不超过 0.001 的前提下认为这种传染病与饮用不干净水有关. (2)依题意得 2×2 列联表如下: 得病 干净水 不干净水 总计 5 9 14 不得病 50 22 72 总计 55 31 86

86×?5×22-50×9?2 此时,K2 的观测值 k= ≈5.785. 55×31×14×72 由于 5.785>5.024, 所以我们在犯错误的概率不超过 0.025 的前提下认为这种传染病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但 (1)中我们在犯错 误的概率不超过 0.001 的前提下肯定结论的正确性,(2)中我们在犯错误的概率不超过 0.025 的前提下肯定结论的正确性.

1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,
15

经过调查得到如下列联表: 积极支持 企业改革 工作积极 工作一般 总计 54 32 86 不太支持 企业改革 40 63 103 总计 94 95 189

根据列联表的独立性检验,能否在犯错误的概率不超过 0.005 的前提下认为工作态度与 支持企业改革之间有关系? 解:由列联表中的数据,得 K2 的观测值为 189×?54×63-40×32?2 k= ≈10.759>7.879, 94×95×86×103 ∴在犯错误的概率不超过 0.005 的前提下,认为工作态度与支持企业改革之间有关系. 考点二 有关“无关”的检验

为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了 361 名高 二在校学生,调查结果如下:理科对外语有兴趣的有 138 人,无兴趣的有 98 人,文科对外 语有兴趣的有 73 人, 无兴趣的有 52 人. 试分析学生选报文、 理科与对外语的兴趣是否有关? [自主解答] 根据题目所给的数据得到如下列联表: 理科 有兴趣 无兴趣 总计
2

文科 73 52 125

总计 211 150 361

138 98 236

根据列联表中数据由公式计算得 K 的观测值为 361×?138×52-73×98?2 - k= ≈1.871×10 4. 236×125×211×150 因为 1.871×10 4<2.706,所以据目前的数据不能认为学生选报文、理科与对外语的兴 趣有关,即可以认为学生选报文、理科与对外语的兴趣无关.


————— ————————————— 2 (1)给出的随机变量 K 的值 k,其值越大,说明“X 与 Y 有关系”成立的可能性越大, 其值越小,说明“X 与 Y 有关系”成立的可能性越小. (2)若 k≤2.076,则认为没有充分的证据显示两个分类变量有关系.

2.在从烟台——大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上 晕船的情况如表所示: 晕船 男人 女人 总计 32 8 40 不晕船 51 24 75 总计 83 32 115

据此资料,你是否认为在恶劣气候中航行,男人比女人更容易晕船? 115×?32×24-51×8?2 解:由公式得 K 的观测值为 k= ≈1.870. 83×32×40×75
2

因为 1.870<2.706,所以我们没有理由说晕船跟性别有关.
16

考点三

独立性检验的综合应用

为了比较注射 A,B 两种药物后产生的皮肤疱疹的面积,选 200 只家兔做试验, 将这 200 只家兔随机地分成两组,每组 100 只,其中一组注射药物 A,另一组注射药物 B. 下表 1 和表 2 分别是注射药物 A 和药物 B 后的试验结果.(疱疹面积单位:mm2) 表 1:注射药物 A 后皮肤疱疹面积的频数分布表 疱疹面积 频数 疱疹面积 频数 [60,65) 30 [60,65) 10 [65,70) 25 [65,70) 40 [70,75) 20 [70,75) 20 [75,80) 30 [75,80) 10 [80,85) 15

表 2:注射药物 B 后皮肤疱疹面积的频数分布表

完成下面 2×2 列联表(表 3), 并回答能否在犯错误的概率不超过 0.001 的前提下认为“注 射药物 A 后的疱疹面积与注射药物 B 后的疱疹面积有差异”. 表 3: 疱疹面积小 于 70 mm2 注射药物 A 注射药物 B 总计 [自主解答] 疱疹面积小 于 70 mm2 注射药物 A 注射药物 B 总计
2

疱疹面积不小 于 70 mm2

总计

疱疹面积不 小于 70 mm2 30 65 95

总计 100 100 200

70 35 105

由列联表中的数据,得 K 的观测值为 200×?70×65-35×30?2 k= ≈24.56>10.828. 100×100×105×95 因此,能在犯错误的概率不超过 0.001 的前提下认为“注射药物 A 后的疱疹面积与注射 药物 B 后的疱疹面积有差异”. ————— ————————————— 在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中 各行、各列中数据的意义及书写格式.

3.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06) 的零件为优质品. 从两个分厂生产的零件中各抽出了 500 件, 量其内径尺寸, 得结果如下表: 甲厂: 分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) 频数 12 63 86

17

[29.98,30.02) [30.02,30.06) [30.06,30.10) [30.10,30.14) 乙厂: 分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02) [30.02,30.06) [30.06,30.10) [30.10,30.14)

182 92 61 4

频数 29 71 85 159 76 62 18

(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据建立 2×2 列联表, 并回答是否有 99%的把握认为“两个分厂生产的 零件的质量有差异”. 甲厂 优质品 非优质品 总计 解:(1)甲厂抽查的产品中有 86+182+92=360 件优质品,从而甲厂生产的零件的优质 360 品率估计为 =72%; 500 乙厂抽查的产品中有 85+159+76=320 件优质品,从而乙厂生产的零件的优质品率估 320 计为 =64%. 500 (2)由已知表中数据,可得下列 2×2 列联表: 甲厂 优质品 非优质品 总计 由列联表的数据可得 K2 的观测值 1 000×?360×180-320×140?2 k= ≈7.35>6.635, 500×500×680×320 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. 【解题高手】 【易错题】 调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示. 请估 计看营养说明是否与性别有关系? 360 140 500 乙厂 320 180 500 总计 680 320 1 000 乙厂 总计

18

看营养说明 男大学生 女大学生 总计 10 8 18

不看营养说明 45 27 72

总计 55 35 90

[错解] 由表中数据可知,55 名男大学生中有 10 名看营养说明,而 35 名女大学生中有 10 8 8 名看营养说明,显然男性看营养说明的比例 比女性的 要低,因此看营养说明与性别有 55 35 关. [错因] 上述解法只能说明看营养说明与性别有关成立的可能性比较大,但并不能肯定 的说二者有关,若判定看营养说明是否与性别有关需进行独立性检验. [正解] 由表中数据得 K2 的观测值为: 90?10×27-8×45?2 k= ≈0.292<0.455, 55×35×18×72 所以我们没有充分的证据认为看营养说明与男女性别有关.

1.2

独立性检验的基本思想及其初步应用

1.分类变量和列联表 (1)分类变量: 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表: ①定义:列出的两个分类变量的频数表,称为列联表. ②2×2 列联表: 一般地,假设两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数 列联表(称 2×2 列联表)为 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.等高条形图 (1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等 高条形图展示列联表数据的频率特征. (2)观察等高条形图发现 a c 和 相差很大,就判断两个分类变量之间有关系. a+b c+d

19

1.分类变量中的“变量”和“值”与函数中的变量和值有什么不同? 提示: 分类变量中所说的“变量”和“值”不一定取具体的数值. 例如: 对于性别变量, 取值有男和女两种情况,那么这里的变量指的是性别,同样这里的值是“男”或“女”.在 现实生活中,分类变量是大量存在的. 2.利用 K2 进行独立性检验,估计值的准确度与样本容量有关吗? 提示:利用 K2 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量 n 越 大,这个估计值越准确,如果抽取的样本容量很小,那么利用 K2 进行独立性检验的结果就 不具有可靠性. 3.在 K2 运算后,得到 K2 的值为 29.78,在判断变量相关时,P(K2≥6.635)≈0.01 和 P(K2≥7.879)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P(K2≥6.635)≈0.01 的含义是在犯错的概率不超过 0.01 的前提 下认为两个变量相关; 而 P(K2≥7.879)≈0.005 的含义是在犯错误的概率不超过 0.005 的前提 下认为两变量相关.

20



更多相关文章:
1.2独立性检验的基本思想及其初步应用
1.2独立性检验的基本思想及其初步应用》_高三数学_数学_高中教育_教育专区。...52、54 D.54、52 解析:由 a+21=73,得 a=52,由 b+46=100,得 b=54....
1.2 独立性检验的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用_数学_高中教育_教育专区。高二数学导学...其中女性 70 人,男性 54 人。女 性中有 43 人主要的休闲方式是看电视,另外...
1.2 独立性检验的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用_物理_自然科学_专业资料。1.2 独立性...54 D.54、52 5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到...
1.2独立性检验的基本思想及其应用第2课时
1.2独立性检验的基本思想及其应用第2课时_数学_高中教育_教育专区。巴东一中高二...114 246 2 36 54 150 300 300 ? ?132 ? 36 ? 114 ?18? 解:由公式得...
1.2独立性检验的基本思想及其应用第1课时
1.2独立性检验的基本思想及其应用第1课时_数学_高中教育_教育专区。巴东一中高二年级数学组 §1.2 独立性检验的基本思想及其应用(一)【学情分析】 :在实际的问...
1.2 独立性检验的基本思想及其初步应用(1)
1.2 独立性检验的基本思想及其初步应用(1)_其它课程_高中教育_教育专区。高效...D.54、52 ) x1 x2 总计 y1 a 8 b y2 21 25 46 总计 73 33 2.画...
1.2 独立性检验的基本思想及其初步应用 教学设计 教案
[2] 新知应用 【师】为了深刻的理解独立性检验思想和在生活中的应用,我们来看下列个 问题 【板书/PPT】 例 2 在某医院,因为患心脏病而住院的 665 名男性...
1.2.2独立性检验的基本思想及其初步应用(二)(定稿)
统计案例 使用时间: 编写:郭道俊 审核: 编号:05 教师评价: 1.2 独立性检验的基本思想及其初步应用(二)【学习目标】 1.理解独立性检验的基本思想及实施步骤。 ...
1.2独立性检验的基本思想及其初步应用
嫩江一中高二数学选修1-2导学案(文) 设计(主备人) 芦海 学生姓名 审核人 学号 授课时间 课前批改 编号 课后批改 2 课题: 1.2 独立性检验的基本思想及其...
1.2独立性检验的基本思想及其初步应用1
高二数学学案选修 1-2(文科) 命制人: 审核人: 使用时间: 课题:独立性检验的基本思想及其初步应用 学习目标:1. 通过对典型例题的探究,了解独立性检验(只要求 ...
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图