9512.net
甜梦文库
当前位置:首页 >> 数学 >>

高中数学人教A版选修2-3课时提升卷(十八) 第三章 3.1 回归分析的基本思想及其初步应用



课时提升卷(十八)
回归分析的基本思想及其初步应用 (45 分钟 100 分) 一、选择题(每小题 6 分,共 30 分) 1.在对两个变量 x,y 进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释; ②收集数据(xi,yi),i=1,2,?,n; ③求线性回归方程; ④求 R2; ⑤根据所搜集的数据绘制散点图. 如果根据可靠性要求能够作出变量 x,y 具有

线性相关结论,则在下列 操作顺序中正确的是 A.①②⑤③④ C.②④③①⑤ ( )

B.③②④⑤① D.②⑤③④①

2.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随
? =0.577x-0.448(x 为人的年龄,y 机样本数据,运用 Excel 软件计算得 y

为人体脂肪含量 ). 对年龄为 37 岁的人来说 , 下面说法正确的是 ( )

A.年龄为 37 岁的人体内脂肪含量都为 20.90% B.年龄为 37 岁的人体内脂肪含量都为 21.01% C.年龄为 37 岁的人群中的大部分人的体内脂肪含量为 20.90% D.年龄为 37 岁的大部分的人体内脂肪含量为 31.5%
第 1 页 共 10 页
[来源:学优 gkstk]

3.(2013·中山高二检测)已知 x,y 的取值如下表所示:若 y 与 x 线性
? =0.95x+a,则 a= ( 相关,且 y

) 1 4.3 3 4.8 D.2.6 4 6.7

x y A.2.2 B.2.9

0 2.2

C.2.8

4.(2012 · 新 课 标 全 国 卷 ) 在 一 组 样 本 数 据 (x1,y1),(x2,y2),?,(xn,yn)(n≥2,x1,x2,?,xn 不全相等)的散点图中, 若所有样本点(xi,yi)(i=1,2,?,n)都在直线 y= x+1 上,则这组样本 数据的样本相关系数为 ( A.-1 B.0 C. ) D.1

5.(2013·福建高考)已知 x 与 y 之间的几组数据如下表: x y 1 0 2 2 3 1 4 3 5 3 6 4

?=b ? x+ a ? ,若某同学根据 假设根据上表数据所得线性回归直线方程为 y

上表中的前两组数据 则以下结论正确的是



求得的直线方程为 y′=b′x+a′,

(
? >b′, a ? >a′ B. b ? >b′, a ? <a′ A. b ? <b′, a ? >a′ D. b ? <b′, a ? <a′ C. b

)

二、填空题(每小题 8 分,共 24 分) 6.(2013·渭南高二检测)某化工厂为预测某产品的回收率 y,需要研 究它和原料有效成分含量 x 之间的线性相关关系,现取 8 组观测值,
第 2 页 共 10 页

计算得 线方程是

xi=52,

yi=228,

=478,

xiyi=1849,则 y 对 x 的回归直

.(精确到小数点后两位数)

7.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单 位:万元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由
? =0.254x+0.321.由回归直线 调查数据得到 y 对 x 的回归直线方程: y

方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加 万元. 8.(2013·西安高二检测)某数学老师身高 176cm,他爷爷、父亲和儿 子的身高分别是 173cm,170cm 和 182cm.因儿子的身高与父亲的身高 有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 三、解答题(9~10 题各 14 分,11 题 18 分) 9.(2013·济宁高二检测)已知某校 5 个学生的数学和物理成绩如下: 学生的编号 数学成绩 x 物理成绩 y 1 80 70 2 75 66 3 70 68 4 65 64 5 60
[来源:学优]

62

(1)通过大量事实证明发现,一个学生的数学成绩和物理成绩是具有 很强的线性相关关系的,在上述表格中,用 x 表示数学成绩,用 y 表示 物理成绩,求 y 关于 x 的回归方程. (2) 利用残差分析回归方程的拟合效果 ,若残差和在(-0.1,0.1) 范围 内,则称回归方程为 “优拟方程” ,问:该回归方程是否为 “优拟方程” .

第 3 页 共 10 页

10.为研究质量 x(单位:克)对弹簧长度 y(单位:厘米)的影响,对不同 质量的 6 个物体进行测量,数据如下表所示:

x y

5 7.25

10 8.12

15 8.95

20 9.90
gkstk] [来源:学优

25 10.9

30 11.8

(1)作出散点图并求线性回归方程. (2)求出 R2. (3)进行残差分析. 11.(能力挑战题)为了研究某种细菌随时间 x 变化繁殖个数 y 的变化 情况,收集数据如下: 时间 x(天) 繁殖个数 y 1 6 2 12
[来源:学优 gkstk]

3 25

4 49

5 95

6 190

(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图. (2)求 y 与 x 之间的回归方程. (3)计算残差,R2,并描述解释变量与预报变量之间的关系.

第 4 页 共 10 页

答案解析
1.【解析】选 D.由回归分析知识可知 D 正确.
? =0.577×37-0.448=20.901≈20.90, 2.【解析】选 C.当 x=37 时, y

由此估计 : 年龄为 37 岁的人群中的大部分人的体内脂肪含量为 20.90%. 3.【解析】选 D. =2, =4.5,线性回归直线过样本中心点(2,4.5)得 4.5=0.95×2+a,得 a=2.6. 4.【解题指南】理清相关系数与相关性强弱的关系是解决本题关键. 【解析】 选 D.样本相关系数越接近 1,相关性越强,现在所有的样本点 都在直线 y= x+1 上,样本的相关系数应为 1. 5.【解析】选 C.过(1,0)和(2,2)的直线方程为 y=2x-2, 画出六点的散点图,回归直线的大概位置如图所示,

? ,a ? >a′. 显然 b′> b

【变式备选】(2012·湖南高考)设某大学的女生体重 y(单位:kg)与
第 5 页 共 10 页

身 高 x( 单 位 :cm) 具 有 线 性 相 关 关 系 , 根 据 一 组 样 本 数 据 (xi,yi)(i=1,2, ? ,n), 用 最 小 二 乘 法 建 立 的 回 归 方 程 为
? =0.85x-85.71,则下列结论中不正确的是 y

(

)

A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( , ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 【解题指南】根据线性相关 ,回归直线,样本点的中心等相关概念判 断. 【解析】选 D. 选项 A B 点( , ) 由一次函数的单调性知,x 每增加 1cm,体重约增加 C 0.85kg,是估计变量 D 体重应约为 58.79kg,是估计变量 xi= , 不正确 正确 具体分析 x 的系数大于零,正相关
? = -b ? 可知直线必过 由回归直线方程的计算公式 a

结论 正确 正确

6.【解析】根据给出的数据可先求 =

=

?= yi= ,然后代入公式 b

?x y
i ?1 8 i

8

i

? 8xy ? 8x
2

?x
i ?1

2 i

第 6 页 共 10 页

=

≈2.62,

? = -b ? ≈ -2.62× =11.47. 从而 a

? =11.47+2.62x. 所以回归直线方程为 y ? =11.47+2.62x 答案: y

7.【解析】由线性回归直线斜率的几何意义可知,家庭收入每增加 1 万元,年饮食支出平均增加 0.254 万元. 答案:0.254 8. 【 解 析 】 由 题 得 父 亲 和 儿 子 的 身 高 组 成 了 三 个 坐 标 (173,170),(170,176), (176,182),其中前面的是父亲的身高, 所以 = =
?= 所以 b

=173, =176,

=1,
? = -b ? · =176-173=3, 所以 a

? =1×182+3=185(cm). 所以孙子的身高为 y

答案:185
? =0.36, a ? =40.8,故回归 9.【解析】(1)由已知数据得, =70, =66, b

? =0.36x+40.8. 直线方程为 y ? =0.36x+40.8, 可 知 y ? =0.36 × 80+40.8=69.6, 同 理 可 得 (2) 由 y 1
第 7 页 共 10 页

? =67.8, y ? =66, y ? =64.2, y ? =62.4,所以 y 2 3 4 5

? )=0∈(-0.1,0.1). (yi- y i

故该回归方程是“优拟方程”. 10.【解析】(1)作出散点图如图所示:

= ×(5+10+15+20+25+30)=17.5. = ×(7.25+8.12+8.95+9.90+10.9+11.8) ≈9.487, =2275, xiyi=1076.2

? ≈0.183, a ? ≈6.285, 计算得, b

? =6.285+0.183x. 所求回归直线方程为 y

(2)列表如下:
? yi- y i

0.05

0.005 -0.08 -0.045 0.04 0.025 0.41 1.41 2.31

yi所以

-2.24 -1.37 -0.54

? )2≈0.01318, (yi- y i

(yi- )2=14.6784. 所以,R2=1≈0.9991,

(3)由残差表中的数值可以看出第 3 个样本点的残差比较大,需要确 认在采集这个数据的时候是否有人为的错误 ,如果有的话,需要纠正

第 8 页 共 10 页

数据,重新建立回归模型 ;由表中数据可以看出残差点比较均匀地落 在不超过 0.15 的狭窄的水平带状区域中,说明选用的线性回归模型 的精度较高,由以上分析可知,弹簧长度与质量具有线性关系. 【拓展提升】建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. (2)画出确定好的解释变量和预报变量的散点图 ,观察它们之间的关 系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选 用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或 残差呈现不随机的规律性等 ).若存在异常 ,则检查数据是否有误 ,或 模型是否合适等. 11.【解析】(1)散点图如图所示:

(2)由散点图看出样本点分布在一条指数曲线 y=c1 z=lny,则 x 1 2 3 4 5 6

的周围,于是令

z 1.79 2.48 3.22 3.89 4.55 5.25
第 9 页 共 10 页

? =e0.69x+1.112. ? =0.69x+1.112,则有 y 所以 z

(3)
? y

6.06 12.09 24.09 48.04 95.77 190.9 6 12 25 49 95 190

y
? ?e
i ?1 6 2 i

=

? )2=3.1643, (yi- y i

(yi- )2=

-6

≈24642.83,

R2=

? (y
i ?1 6 i ?1

6

i

? )2 ?y i ? y)
2

? (y

≈1-

≈0.9999,

i

即解释变量时间对预报变量繁殖细菌的个数解释了 99.99%.

[来源:学优 GKSTK]

第 10 页 共 10 页



更多相关文章:
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图