9512.net
甜梦文库
当前位置:首页 >> 数学 >>

1.2独立性检验的基本思想及其初步应用(一)



1.2独立性检验的基本思想 及其初步应用(一)

分类变量
对于性别变量,取值为:男、女

这种变量的不同取“值”表示个体所属的 不同类别,这类变量称为分类变量 分类变量在现实生活中是大量存在的,如 是否吸烟,是否患肺癌,宗教信仰,国别, 年龄,出生月份等等。

探究

列联表

1)为了调查吸烟是否对肺癌有影响,某肿瘤研究所随 机地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表
不患肺癌 患肺癌 总计

不吸烟
吸烟 总计

7775
2099 9874

42
49 91

7817
2148 9965

在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。

2)通过图形直观判断
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

等高 条形图

患肺癌 比例
患肺癌 不患肺癌

不患肺癌 比例

上面我们通过图表的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分 析,我们构造一个随机变量-----卡方统计量

n(ad ? bc) K ? , (1) (a ? b)(c ? d )(a ? c)(b ? d )
2 2

其中n ? a ? b ? c ? d 为样本容量。
根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:

若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。

9965(7775 ? 49 ? 42 ? 2099) k? ? 56.632 7817 ? 2148 ? 9874 ? 91
2

(2)

那么这个值到底能告诉我们什么呢?

在H0成立的情况下,统计学家估算出如下的概率

即在H0 成立的情况下,K2 的值大于6.635的概率非常小,近似 于0.01。 也就是说,在H0成立的情况下,对随机变量K2进行多次观 测,观测值超过6.635的频率约为0.01。

P( K ? 6.635) ? 0.01.
2

(2)

思考
如果K 2 ? 6.635,就断定H0不成立,这种判断出错的可能性有多大 ?

答:判断出错的概率为0.01。

9965(7775 ? 49 ? 42 ? 2099)2 现在观测值k ? ? 56.632太大了, 7817 ? 2148 ? 9874 ? 91 在H 0成立的情况下能够出现这样的观测值的概率不超过0.01, 因此我们有99%的把握认为H 0不成立,即有99%的把握认为“吸烟 与患肺癌有关系”。

判断 H 0是否成立的规则
如果 k ? 6.635 ,就判断 H 0 不成立,即认为吸烟与 患肺癌有关系;否则,就判断 H 0 成立,即认为吸烟 与患肺癌有关系。

H0 在该规则下,把结论“H 0 成立”错判成“ P( 2 成立”的概率不会差过K ? 6.635) ? 0.01, 即有99%的把握认为 H 0不成立。



独立性检验的定义
上面这种利用随机变量K2来确定在多大程度上 可以认为“两个分类变量有关系”的方法,称为两 个分类变量的独立性检验。

P( K 2 ? k )

0.50 0.45 5

0.40 0.70 8

0.25 1.32 3

0.15 2.07 2

0.10 2.70 6

0.05 3.84 1

0.02 5
5.02 4

0.01 0
6.63 5

0.00 5
7.87 9

0.001 10.82 8

k

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

独立性检验的基本思想(类似反证法)
(1)假设结论不成立,即 H0 : “两个分类变量没有关系”. (2)在此假设下我们所构造的随机变量 K2 应该很小,如果由 观测数据计算得到K2的观测值k很大,则在一定可信程度上 说明 H 0 不成立.即在一定可信程度上认为“两个分类变量 有关系”;如果k的值很小,则说明由样本观测数据没有发现 反对 0 的充分证据。 H
(3)根据随机变量K2的含义,可以通过评价该假设不合理的 程度,由实际计算出的,说明假设不合理的程度为1%,即“两 个分类变量有关系”这一结论成立的可信度为约为99%.

怎样判断K2的观测值k是大还是小呢?
这仅需要确定一个正数 k0 ,当 k ? k 时就认为K2的观测 0 值 k大。此时相应于 k0 的判断规则为: 如果 k ? k0 ,就认为“两个分类变量之间有关系”;否则 就认为“两个分类变量之间没有关系”。 k ----临界值
0

按照上述规则,把“两个分类变量之间没有关系”错误的判断 为“两个分类变量之间有关系”的概率为P( ? k ). K2
0

在实际应用中,我们把 k ? k0解释为有(1 ? P( K 2 ? k )) ?100% 的把握认为“两个分类变量之间有关系”;把 ? k0 解释为 k 不能以 ? P( K 2 ? k )) ?100% 的把握认为“两个分类变量 (1 之间有关系”,或者样本观测数据没有提供“两个分类变量 之间有关系”的充分证据。

思考:
利用上面的结论,你能从列联表的三维柱形图中 看出两个分类变量是否相关呢? 一般地,假设有两个分类变量X和Y,它们的值域 分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2x2列 联表)为: 表1-11 2x2联表
x1 x2 总计

y1 a c a+c

y2 b d b+d

总计 a+b c+d a+b+c+d

若要判断的结论为:H1 :“X与Y有关系”,可以 按如下步骤判断H1成立的可能性: 1、通过三维柱形图和二维条形图,可以粗略地判断两个变
量是否有关系,但是这种判断无法精确地给出所得结论的可靠 程度。 (1)在三维柱形图中, 主对角线上两个柱形高度的乘积 ad与副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大。 a a?b c (2)在二维条形图中,可以估计满足条件X=x1的个体中具 a c?d 有Y=y1的个体所占的比例 a ? b ,也可以估计满足条件X=x2 c

的个体中具有Y=y1的个体所占的比例c ? d 。两个比例相差越 大,H1成立的可能性就越大。

2、可以利用独立性检验来考察两个分类变量是否有关系,并
且能较精确地给出这种判断的可靠程度。

具体作法是: (1)根据实际问题需要的可信程度确定临界值 k0; (2)利用公式(1),由观测数据计算得到随机变量 K 2 的观测值; (3)如果 k ? k0 ,就以 (1 ? P( K ? k0 )) ?100%的把握认为“X 与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系” 的充分证据。
2

在实际应用中,要在获取样本数据之前通过下表确定临界值:
P(K2 ? k0 ) 0.50

k0 k0

0.40 0.25 0.15 0.455 0.708 1.323 2.072 0.025 0.010 0.005 3.841 5.024 6.636 7.879

0.10 2.706 0.001 10.828

P(K2 ? k0 ) 0.05



更多相关文章:
独立性检验的基本思想及其初步应用测试题
独立性检验的基本思想及其初步应用河北乐亭一中 李金泉 邮编:063600 练习一一、选择题 1.下面是一个 2×2 列联表 y1 x1 x2 总计 a 2 b y2 21 25 46 ...
1.2独立性检验的基本思想及其初步应用(一)》教学案2
1.2独立性检验的基本思想及其初步应用(一)》教学案2_高二数学_数学_高中教育_教育专区。《1.2独立性检验的基本思想及其初步应用(一)》教学案2 教学目标 通过...
独立检验的基本思想及其初步应用
2 八、板书设计 1.2 独立性检验的基本思想及其初步应用(一) 一、 有关概念 1、 分类变量 2、 列联表 二、独立性检验 1、独立性检验的思想 2、独立性检验...
1.2独立性检验的基本思想及其初步应用二》教学案
《1.2独立性检验的基本思想及其初步应用二》教学案_高二数学_数学_高中教育_教育专区。1.2独立性检验的基本思想及其初步应用(二) 教学要求: 通过探究“吸烟是否...
§1.2独立性检验的基本思想及其初步应用
它们的取值分别为 {x1,x2 } 和 { y1,y2 } ,其 样本频数列联表(称为 2 ? 2 列联表)为: y1 y2 §1.2 独立性检验的基本思想及其初步应用 总计 a...
1.2 独立性检验的基本思想及其初步应用 学案(人教A版选...
1.2 独立性检验的基本思想及其初步应用 课标解读 1.了解独立性检验的基本思想、方法及其简单应用.(重点) 2.通过收集数据,并依据独立性检验的原理作出合理推断,...
3.2.1独立性检验的基本思想及其初步应用
学校:临清二中 学科:数学 编写人: 游恒涛教学目标 审稿人:马英济 3.2.1 独立性检验的基本思想及其初步应用(1)通过对典型案例的探究,了解独立性检验(只要求 2...
1.2 独立性检验的基本思想及其初步应用《云师大“1+1”...
1.2 独立性检验的基本思想及其初步应用《云师大“1+1”专业数学辅导》_其它...【问题导思】 表格和图形哪一个更能直观地反映出两个分类变量间是否相互影响?...
1.2独立性检验的基本思想及其应用54
检验的基本思想及其应用 54 一,学习目标: 1、 理解独立性检验的基本思想及实施...1.2 独立性检验的基本思想及其初步应用 1.分类变量和列联表 (1)分类变量: ...
选修1-2第一章 《独立性检验的基本思想及其初步应用
学科教师辅导讲义讲义编号 学员编号: 学员姓名: 课题 年级: 辅导科目: 课时数: 学科教师: 独立性检验的基本思想及其初步应用 授课日期及时段 1、了解独立性检验的...
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图