9512.net
甜梦文库
当前位置:首页 >> 数学 >>

回归分析与独立性检验



回归分析与独立性检验
知识要点及解析 1.函数关系与相关关系的区别? 函数关系是一种确定性关系,而相关关系是一种非确定性关系.
n n

?? 2.回归公式 b

? ( xi ? x )( yi ? y )
i ?1

? (x ? x)
i ?1 i

n<

br />
?

? x y ? nxy
i ?1 n i i

2

?x
i ?1

?x ? ? y ?b a

?x ? a ? ?b ? y

2 i

? nx 2

3.回归分析的步骤? 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 其步骤:收集数据 ?作散点图 ?求回归直线方程 ?利用方程进行预报. 4.回归直线的性质 ⑴回归直线

?x ? a ? y ?b

?x ? a ? ?b ?过样本点的中心 ?x , y ? y
1 n ? xi n i ?1
预报变量 y 的平均数为: y ?

其中解释变量 x 的平均数为: x ?

1 n ? yi n i ?1

? 的意义: ⑵回归直线的斜率的估计值 b ? 个单位. 解释变量 x 每增加一个单位,预报变量 y 就增加 b
5.求线性回归方程的五个步骤: ⑴计算 x、y、x 2、xy ⑵计算

? ? xi yi ⑶计算 ? xi2 ⑷代入系数公式求 b? ⑸代入公式计算 a
i ?1 i ?1

n

n

例题 1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的 能耗 y(吨标准煤)的几组数据: ⑴画出散点图;

?x ? a ? ?b ? ⑵求出线性回归方程 y
⑶已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤,试根据(2)问求出的线性回 归方程预测(估计)生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? x y 3 2.5 4 3 5 4 6 4.5

1

回归分析与独立性检验

例题 2:从某大学中随机选取 8 名女大学生,其身高和体重数据如表所示: 编号 身高/cm 体重/kg 1 165 48 2 165 57 3 157 50 4 170 54 5 175 64 6 165 61 7 155 43 8 170 59

⑴画出散点图;

?x ? a ? ?b ? ⑵求出根据身高预报体重的回归方程 y
⑶根据以上回归方程预测一名身高为 172cm 的女大学生的体重.

例题 3:下表是某厂 1~4 月份用水量(单位:百吨)的一组数据,由散点图可知:用水量 y 与

? ? ?0.7 x ? a ? , 月份 x 之间有较好的线性相关关系,其线性回归方程为 y
请你预测该厂 5 月份的用水量大约为多少百吨? 月份 x 1 2 3 3 4 2.5 用水量 y 4.5 4

6.线性回归模型 y=bx+a+e 中随机误差 e 产生的原因? ⑴选用的函数模型不恰当引起的误差 ⑵忽略了某些因素的影响 7.如何发现数据中的错误?

⑶存在观测误差

? x?a ? ? yi ? y ?i ? yi ? b ? 然后选取横坐标为编号或解释变量 x 或预 先分别计算出残差 e i
报变量 y,纵坐标为残差,作出残差图;最后观察:如果样本点的残差较大(落在带状区域外),说 明数据的采集有可能错误。 8.如何衡量模型的拟合效果? 方法 1:在残差图中,残差点比较均匀落在带状水平区域内,说明选用的模型比较合适;带 状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高 例题 1:根据一位母亲记录儿子 3~9 岁身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)

? ? 7.19x ? 73.93 ,若用此方程预测儿子 10 岁时的身高,下列有关叙 的线性回归方程 y
述正确的是( ) A.身高一定为 145.83cm; C.身高小于 145.83cm; B.身高大于 145.83cm; D.身高在 145.83cm 左右

2

回归分析与独立性检验

例 2.用两个模型分别去拟合某组数据,这两个模型的残差图(以样本编号为横坐标)分别 如图 1、图 2,试判断这两个模型哪一个的拟合效果更好,为什么?

残差 3 2 1 0 -1 -2 1 2 3 4 5 6 编号
3 2 1

残差

编号 0 -1 -2 图2 1 2 3 4 5 6

图1

例 3.下表是某产品的广告费 x 与销售额 y 的统计数据.由散点图可知广告费 x 与销售额 y

? ? 9.4 x ? a ? 之 间 有 较 好 的 线 性 相 关 关 系 , 其 线 性 回 归 方 程 为 y
根据此模型,请你预测广告费为 6 万元时,销售额大约为多少万元? 广告费用 x/万元 4 销售额 y /万元 2 3 5 49 26 39 54

,

方法 2:残差平方和:

?i 的平方和越小,回归模型拟合效果越好. 残差 e

方法 3:相关指数 R :

2

R2 ? 1?

? ?y
i ?1 n i ?1

n

i

?i ? ?y ? y?

2

? ?y

其中

2

?0 ? R

2

?1

?
2

i

.

在线性回归模型中,R 表示解释变量对于预报变量变化的贡献率,相关指数 R 越

2

接近于 1(越大),回归模型拟合效果越好。 例题:在两个变量 y 与 x 的回归模型中,分别选择了 4 个不同的模型,它们的相关指数 R 如 下,其中拟合效果最好的模型是(
2 2 2

)
2

A. 模型 1 的 R =0.98 B. 模型 2 的 R =0.80 C. 模型 3 的 R =0.50

D. 模型 4 的 R =0.25

2

9.用线性回归模型进行预报时应注意的几个问题: ⑴样本数据来自哪个总体,预报时也仅适用这个总体 ⑵模型的时效性,利用不同时间段的样本数据建立的模型,只能用来对那段时间范围的数据 进行预报 ⑶建立模型时,变量的取值范围决定了预报时模型的适用范围,通常不能超出太多 ⑷在回归模型中,因变量的值不能由自变量完全确定.

3

回归分析与独立性检验

10.建立回归模型的基本步骤: ⑴确定研究对象,明确哪个是解释变量,哪个是预报变量 ⑵画出散点图,观察两个变量之间的关系 ⑶由经验确定回归方程的类型 ⑷按一定规则(如最小二乘法)估算回归方程中的参数 ⑸回归分析残差图是否异常、数据是否有误、所选模型是否合适等; ⑹最后才利用回归方程进行预报。 例题:调查显示某地若干户家庭的年收入 x(单位:万元)与年饮食支出 y(单位:万元)具有线 ? ? 0.254x ? 0.321 y 性相关关系,其回归方程为 ,利用回归方程,求家庭年收入每增 加 1 万元,年饮食支出平均增加多少万元?

11.用换元法求非线性回归方程 例题 1:在一次抽样调查中测得样本的 5 组数据,试建立 y 与 x 之间的回归方程. x y 0.25 0.5 16 12 1 5 2 2 4 1

分析:由散点图知 y 与 x 近似地呈反比例函数关系,可设 y ?

b 1 ? a 令 t ? 则 y ? bt ? a x x

?t ? a ? ?b ? 画出 y 关于 t 的散点图知 y 与 t 呈近似的线性相关关系,可设线性回归方程为: y

?? 得 ?b

? (t
i ?1

5

i

? t )( yi ? y )
i

? (t
i ?1

5

?

? t )2

38 .45 ?t ? 7.2 ? 4.1344 ?1.55 ? 0.8 ? ? y ?b ? 4.1344 ? a 9 .3 4.1344 ? 0.8 x

?? ? ? 4.1344 ?y t ? 0.8 ∴y 与 x 之间的回归方程为 y

例题 2:下表记录了篮球爱好者小明某月 1 号到 5 号每天打篮球时间 x(单位:小时)与当天投 篮命中率 y 之间的关系。 ⑴求投篮命中率 y 关于打篮球时间 x 之间的线性回归方程 ⑵预测小明该月 6 号打 6 小时篮球的命中率 x y 1 2 3 4 5 0.4 0.4 0.5 0.6 0.6

例题 2:为了研究某种细菌随时间 x 变化,繁殖的个数,收集数据如下: 天数 x/天 繁殖个数 y/个 1 6 2 12 3 25 4 49 5 95 6 190

⑴用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;

? =e0.69 x ?1.112 .) ⑵试求出预报变量对解释变量的回归方程. (所求非线性回归方程为 y
4 回归分析与独立性检验

12.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 13.2×2 列联表与等高条形图: 例题 1:某学校对高三学生作了一次调查发现:在平时的模拟考试中,性格内向学生 426 人中 有 332 人在考前心情紧张;性格外向学生 594 人中有 213 人在考前心情紧张 ⑴先作出 2×2 列联表,然后作出等高条形图; ⑵利用等高条形图判断考前心情紧张与性格类别是否有关

例题 2:下表是某地区的一种传染病与饮用水的调查统计表: 得病 饮用干净水 饮用不干净水 总计 ⑴先填表,后计算饮用干净水得传染病的频率,以及饮用不干净水得传染病的频率 ⑵作出等高条形图 ⑶利用等高条形图判断得传染病是否与饮用水有关 52 人 94 人 不得病 466 人 218 人 总计

14.独立性检验的定义:利用随机变量 K 来判断“两个分类变量有关系”的方法称为独立 性检验

2

K2 ?

n(ad ? bc) 2 (a ? b)(c ? d )(a ? c)(b ? d )

其中 n ? a ? b ? c ? d

15.独立性检验的步骤: ⑴制定判别规则:根据实际问题的需要,确定容许推断 “两个分类变量有关系” 犯错误概率的 上界 ? ,然后查表确定临界值 k 0 ⑵利用公式计算随机变量 K 的观测值 k ⑶如果 K 的观测值 k 很大,说明“X 与 Y 有关系”,观测值 k 很小,说明“X 与 Y 没有关系” 如果 k≥k 0 ,就推断 “X 与 Y 有关系” ,这种推断犯错误的概率不超过 ? ,即有 1 ? ? 的把握认 为“X 与 Y 有关系”
2 2

5

回归分析与独立性检验

例题: 针对某地区的一种传染病与饮用水进行抽样调查发现:饮用干净水得病 5 人,不得病 50 人;饮用不干净水得病 9 人,不得病 22 人。 ⑴作出 2×2 列联表 ⑵能否有 90%的把握认为该地区中得传染病与饮用水有关? 分析:作出 2×2 列联表 得病 饮用干净水 饮用不干净水 总计
2

不得病 50 22 72

总计 55 31 86

5 9 14

计算随机变量 K 的观测值 k ?
2

86? (5 ? 22 ? 50? 9) 2 ? 5.785 查表知 5.785>2.706 55? 31?14? 72

且 P(K ≥2.706)=0.10∴在犯错误的概率不超过 0.10 的前提下, 可以认为“该地区中得传染 病与饮用水有关”, 即 有 90%的把握认为该地区中得传染病与饮用水有关

16.如何判断两个分类变量之间有关系? 方法 1:观察等高条形图,若发现小矩形的高相差很大,就可以粗略判断两个分类变量之间有关 系 方法 2:计算|ad-bc|,若|ad-bc|越大,则说明两个分类变量之间关系越强; 方法 3:计算 W ?

a c ,若 W 越大,则说明两个分类变量之间关系越强; ? a?b c?d

方法 4:计算 K 的观测值 k,若 k 越大,则说明“X 与 Y 的关系”越强.

2

例题: 通过随机调查发现:爱好运动的大学生中男生有 40 人,女生有 20 人;不爱好运动的大学 生中男生有 20 人,女生 30 人. ⑴作出 2×2 列联表; ⑵能否有 99%的把握认为 “爱好运动与性别有关”.

6

回归分析与独立性检验



更多相关文章:
知识精讲:变量间的相关关系、回归分析及独立性检验
知识精讲:变量间的相关关系、回归分析独立性检验_高二数学_数学_高中教育_教育专区。变量间的相关关系、回归分析独立性检验【知识精讲】 1.会作两个相关变量...
回归分析与独立性检验
回归分析与独立性检验_数学_高中教育_教育专区。回归分析 线性回归方程 独立性检验 犯错误的概率 教学设计方案 XueDa PPTS Learning Center 姓名 学科 阶段 课题 ...
回归分析与独立性检验
3 回归分析与独立性检验 10.建立回归模型的基本步骤: ⑴确定研究对象,明确哪个是解释变量,哪个是预报变量 ⑵画出散点图,观察两个变量之间的关系 ⑶由经验确定...
回归分析与独立性检验
回归分析与独立性检验_数学_高中教育_教育专区。龙源期刊网 http://www.qikan.com.cn 回归分析与独立性检验 作者:金石 来源:《数学金刊· 高考版》2015 年第 ...
回归分析与独立性检验
回归分析与独立性检验_高二数学_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 回归分析与独立性检验_高二数学_数学_高中教育_教育专区。湛江一中 ...
回归分析、独立性检验80
两个变量的线性相关性越强;反之,线性相关性越小; ②残差平方越小的模型,拟合的效果越好; ③用相关指数 R2 来刻画回归效果,R2 越小,说明模型的拟合效果越好...
回归分析与独立性检验(说课案)
回归分析与独立性检验(文数) 英山二中 陈政 一、教材分析 (一)地位与作用: 本节课复习内容为新课标人教版高中数学课本选修 1-2 第一章 《统计案例》p1-19 ...
回归分析及独立性检验)
回归分析及独立性检验)_数学_高中教育_教育专区。学生:佳洁 时间:10;00-12;00 回归分析与独立性检验 1. 回归分析的含义是什么?有哪些基本步骤?线性回归模型怎样...
回归分析及独立性检验的基本知识点及习题集锦
回归分析独立性检验的基本知识点及习题集锦_数学_高中教育_教育专区。回归分析的基本知识点及习题本周题目:回归分析的基本思想及其初步应用 本周重点: (1)通过对...
更多相关标签:
独立性检验    卡方独立性检验    相关与回归分析    相关与回归分析的关系    spss独立性检验    列联表独立性检验    方差分析与回归分析    相关性分析与回归分析    

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图