9512.net
甜梦文库
当前位置:首页 >> 数学 >>

全国通用2018高考数学大一轮复习第九篇统计与统计案例第3节变量的相关性与统计案例课件理_图文

第3节 变量的相关性与统计案例

最新考纲
1.会作两个有关联变量的数据的散 点图,并利用散点图认识变量间的 相关关系. 2.了解最小二乘法的思想,能根据 给出的线性回归方程系数公式建立

线性回归方程(线性回归方程系 数公式不要求记忆). 3.了解回归分析的思想、方法 及其简单应用. 4.了解独立性检验的思想、方 法及其初步应用.

知识链条完善 考点专项突破 解题规范夯实

知识链条完善
【教材导读】
1.变量的相关关系与变量的函数关系有什么区别?

把散落的知识连起来

提示:相关关系是一种不确定关系,函数关系是确定关系.

2.如何判断两个变量间的线性相关关系?
提示:散点图中点的分布从整体上看大致在一条直线附近,或者通过计算相 关系数作出判断.

3.独立性检验的基本步骤是什么?
提示:列出2×2列联表,计算k值,根据临界值表作出结论.

知识梳理
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关 系;与函数关系不同,相关关系是一种非确定性关系.

(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这
种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的 这种相关关系为负相关.

2.回归方程与回归分析
(1)线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在 一条直线 附近,就称这两个 变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程 ①最小二乘法:使得样本数据的点到回归直线的 距离的平方和 最小的 方法叫做最小二乘法.

? x+ a ? =b ②回归方程:方程 y ? 是两个具有线性相关关系的变量的一组 ? 是待定数. 数据(x1,y1),(x2,y2),?,(xn,yn)的回归方程,其中 a ? ,b
n ? ? ? xi ? x yi ? y ? i ?1 ? ? ?b = n 2 ? xi ? x ? ? i ?1 ? ? . ? ? y ? bx ? ?a

?

??

? ? x y ? nx y
n i ?1 n i i 2 x ? i ? nx i ?1 2

?

?

,

(3)回归分析

①定义:对具有 相关关系 的两个变量进行统计分析的一种常用方法.
②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),?,(xn,yn) 中, x =
y=

1 (x1+?+xn), n

1 ? ,( x , y )称为样本点的中心. ? = y - bx (y1+?+yn), a n

③相关系数 r=

? ? x ? x ?? y
n i ?1 i n 2 n i ?1 i i ?1

i

?y
i

? ?
2

?? x ? x? ?? y

,当 r>0 时,两变量 正 相关,当 r<0 时,

?y

两变量 负 相关,当|r|≤1 且|r|越接近于 1,相关程度 越强 ,当|r|≤1 且|r| 越接近于 0,相关程度 越弱 .

3.独立性检验
(1)独立性检验的有关概念 ①分类变量

可用变量的不同“值”表示个体所属的 不同类别 的变量称为分类变量.

②2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频

数列联表(称为2×2列联表)为 y1 x1 x2
总计 (2)独立性检验

y2 b d
b+d
2

总计 a+b c+d
a+b+c+d

a c
a+c
n ? ad ? bc ?

利用随机变量K2= ? a ? b ?? c ? d ?? a ? c ?? b ? d ? (其中n=a+b+c+d为样本容量) 来判断“两个分类变量有关系”的方法称为独立性检验. 步骤如下:

①计算随机变量K2的观测值k,查表确定临界值k0: P(K2≥ k0) k0 0.5 0 0.4 55 0.4 0 0.7 08 0.2 5 1.3 23 0.1 5 2.0 72 0.1 0 2.7 06 0.0 5 3.8 41 0.0 25 5.0 24 0.0 10 6.6 35 0.0 05 7.8 79 0.001 10.82 8

②如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过
P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能 推断“X与Y有关系”. 【拓展提升】 1.线性回归直线的斜率为正(负)时,两个变量正(负)相关. 2.线性回归直线一定经过样本点的中心.

对点自测
1.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些 样本点通过最小二乘法得到的(如图),以下结论中正确的是( C )

(A)x和y正相关
(B)x和y的相关系数为直线l的斜率 (C)x和y的相关系数在-1到0之间 (D)当n为偶数时,分布在l两侧的样本点的个数一定相同

解析:根据回归直线可知变量x,y负相关,且由l的斜率知相关系数在 (-1,0)之间.故选C.

2.某饮料店的日销售收入y(百元)与当天的平均气温x(℃)之间有下列5 组样本数据 x y -2 5 -1 4 0 2 1 2 D ) 2 1

这组样本数据具有线性相关关系,则其回归方程可能是( ? =x+2.6 ? =-x+2.6 (A) y (B) y
? =x+2.8 (C) y ? =-x+2.8 (D) y

解析:负相关,且过样本点的中心(0,2.8),可知为选项D中方程.故选D.

3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5
? ? =0.68 x 次试验,根据收集到的数据(如表),由最小二乘法求得回归直线方 y

+54.6,利用表中数据推断 a 的值为( B

)

零件数x(个)

10

20

30

40

50

加工时间y(min)
(A)68.2

62

a
(C)69

75
(D)67

81

89

(B)68

解析: x =30,由于 y =0.68 x +54.6=75,所以 75=
62 ? a ? 75 ? 81 ? 89 ,解得 a=68.故选 B. 5

4.某产品的广告费用x与销售额y的统计数据如表: 广告费用x(万元) 销售额y(万元) 3 25 4 30 5 40 6 45

? x+ a ? 为 7.据此模型预报广告费用为 10 万元时 ? =b 根据表可得回归方程 y ? 中的 b

销售额为

万元.

? =7×10+3.5=73.5(万元). 解析: x =4.5, y =35,所以 a ? =35-7×4.5=3.5,所以 y

答案:73.5

5.为了判断中学生是否喜欢足球运动与性别的关系,现随机抽取50名学生, 得到2×2列联表: 喜欢 男 女 总计 则在犯错误的概率不超过
50 ? ?15 ? 20 ? 5 ? 10? 20 ? 30 ? 25 ? 25
2

不喜欢 10 20 30

总计 25 25 50

15 5 20

的前提下认为“喜欢足球与性别有关”.

解析: k=

≈8.333>7.879,故在犯错误的概率不超过

0.005 的前提下认为“喜欢足球与性别有关”.

答案:0.005

考点专项突破
考点一 变量的相关性

在讲练中理解知识

【例 1】 导学号 18702547 在一组样本数据(x1,y1),(x2,y2),?,(xn,yn)(n≥ 2,x1,x2,?,xn 不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,?,n)都在 直线 y=(A)-1
1 x+1 上,则这组样本数据的样本相关系数为( 2

)

(B)0

(C) ?

1 2

(D)1

解析:完全的线性关系,且为负相关,故其相关系数为-1.故选A.

反思归纳 两个具有相关关系的变量之间,可以从散点图直观看出是否 具有较好的线性相关关系,定量的方法就是计算相关系数,相关系数的绝

对值越接近1,其线性相关关系越强.

【即时训练】 (2015·湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y 与z正相关.下列结论中正确的是( (A)x与y正相关,x与z负相关 (B)x与y正相关,x与z正相关 (C)x与y负相关,x与z负相关 )

(D)x与y负相关,x与z正相关
解析:由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,

所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相
关,故选C.

考点二

回归分析

【例2】 (2016·石家庄质量检测)为了解某地区某种农产品的年产量
x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产 品的年产量和价格统计如表: x y 1 7.0 2 6.5 3 5.5 4 3.8 5 2.2

? x+ a ? =b (1)求 y 关于 x 的线性回归方程 y ?;

解:(1) x =3, y =5,

?x y
i ?1 i

5

i

=62.7, ? xi2 =55,
i ?1

5

? =-1.23, a 解得 b ? =8.69,
? =8.69-1.23x. 所以 y

(2)若每吨该农产品的成本为 2 千元,假设该农产品可全部卖出,预测当年产量为多少 时,年利润 z 取到最大值?(保留两位小数)

?= 参考公式: b

?? x
n i ?1

i

? x yi ? y
i

??

? ? x y ? nx y
n

?? x
n i ?1

?x

?

2

=

i ?1 n

i

i

?x
i ?1

2 i

? nx

2

,

? . ? = y - bx a

解: (2)年利润z=x(8.69-1.23x)-2x=-1.23x2+6.69x, 所以x≈2.72时,年利润最大.

反思归纳

(1)求回归直线方程要注意正确使用公式、注意题目对精确

度的要求;(2)由得出的回归直线方程作出的预测是近似的.

【即时训练】 (2016·广东广州质检)某种商品价格与该商品日需求量 之间的几组对照数据如表: 价格x(元/kg) 10 15 10 20 8 25 6 30 5 日需求量y(kg) 11 (1)求y关于x的线性回归方程;

1 解:(1)由所给数据计算得 x = (10+15+20+25+30)=20, 5
5 1 y = (11+10+8+6+5)=8, ? xi ? x 5 i ?1 5

?

?

2

=(-10)2+(-5)2+02+52+102=250,

? ? x ? x ?? y ? y ? =-10×3+(-5)×2+0×0+5×(-2)+10×(-3)=-80.
i ?1 i i

?= b

?? x
5 i ?1

i

? x yi ? y xi ? x

??

?

??
5 i ?1

?

2

=

?80 ? =8+0.32×20=14.4. ? = y - bx =-0.32. a 250

? =-0.32x+14.4. 所求线性回归方程为 y

(2)利用(1)中的回归方程,当价格 x=40 元/kg 时,日需求量 y 的预测值为多少?

? x+ a ?= ? =b 参考公式:线性回归方程 y ? ,其中 b

?? x
n i ?1

i

? x yi ? y xi ? x

??

?

??
n i ?1

?

2

? . ,a ? = y - bx

解: (2)由(1)知当x=40元/kg时, =-0.32×40+14.4=1.6(kg),

故当价格x=40元/kg时,日需求量y的预测值为1.6 kg.

考点三

独立性检验

【例3】 导学号 18702548 某商场对甲、乙两种品牌的牛奶进行为期100

天的营销活动,为调查这100天的日销售情况,用简单随机抽样抽取10天进
行统计,以日销售数量(单位:件)作为样本,样本数据的茎叶图如图.已知该 样本中,甲品牌牛奶日销量的平均数为48,乙品牌牛奶日销量的中位数为43, 将日销量不低于50件的日期称为畅销日. (1)求出x,y的值;

解:(1)因为甲品牌牛奶日销量的平均数为 48, 所以
1 (31+33+42+42+43+51+57+63+65+50+y)=48,解得 y=3, 10

又因为乙品牌牛奶日销量的中位数为 43, 所以
42 ? 40 ? x =43,解得 x=4. 2

(2)以10天的日销量为样本,估计100天的日销量,请完成这两种品牌100天
日销量的2×2列联表,并判断是否有99%的把握认为品牌与畅销日天数有关. 2 n ? ad ? bc ? 2 附:K = (其中n=a+b+c+d为样本容量) ? a ? b ?? c ? d ?? a ? c ?? b ? d ? P(K2≥k0) 0.050 0.010 0.001

k0

3.841
畅销日天数

6.635
非畅销日天数

10.828
合计

甲品牌

乙品牌
合计

解:(2)2×2 列联表如表, 畅销日天数 甲品牌 50 乙品牌 30 合计 80 结合列联表可算得 K 的观测值 k= 8.33>6.635.
2

非畅销日天数 50 70 120
200 ? ? 50 ? 70 ? 50 ? 30 ? 80 ? 120 ?100 ?100
2

合计 100 100 200 ≈

所以有 99%的把握认为品牌与畅销日天数有关.

反思归纳 (1)统计中要注意表达数据的几个图表:频数分布表、频率分 布表、频率分布直方图、茎叶图、列联表等;(2)独立性检验类似反证法, 即在假设其无关的情况下,得出其假设成立为小概率事件,从而否定其假 设,得出两个分类变量有关,并且得出其结论成立的概率.

【即时训练】 现对某市工薪阶层关于“楼市限购令”的态度进行调查,随 机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如表. 月收入 (单位: 百元) [15,25) [25,35) [35,45) [45,55) [55,65) [65,75)

频数
赞成人数

5
4

10
8

15
12

10
5

5
2

5
1

由以上统计数据填2×2列联表并判断是否能够在犯错误的概率不超过0.01 的前提下认为月收入以55百元为分界点对“楼市限购令”的态度有差异. 月收入不低于 55百元的人数 赞成 不赞成 a= c= 月收入低于 55百元的人数 b= d=

合计

合计

解:2×2列联表 月收入不低于 55百元的人数 赞成 a=3 月收入低于 55百元的人数 b=29 合计 32

不赞成
合计 k=

c=7
10
2

d=11
40 ≈6.27<6.635.

18
50

所以不能够在犯错误的概率不超过0.01的前提下认为月收入以55百元 为分界点对“楼市限购令”的态度有差异.

? 3 ? 7 ?? 29 ? 11?? 3 ? 29 ?? 7 ? 11?

50 ? ? 3 ? 11 ? 7 ? 29 ?

备选例题
【例1】 (2014·全国Ⅱ卷)某地区2007年至2013年农村居民家庭人均纯 收入y(单位:千元)的数据如下表: 年份 年份代号t 人均纯收 入y 2007 1 2008 2 2009 3 2010 4 2011 5 2012 6 2013 7

2.9

3.3

3.6

4.4

4.8

5.2

5.9

(1)求y关于t的线性回归方程;

解:(1)由所给数据计算得
t=

1 (1+2+3+4+5+6+7)=4, 7 1 (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, 7

y=

??t
7 i ?1 7 i ?1

i

?t

?

2

=9+4+1+0+1+4+9=28,

??t

i

? t yi ? y

??

?

=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+ 2×0.9+3×1.6=14,

?= b

? ?t
7 i ?1

i

?t
i

?? y ? y ?
i

? ?t
7 i ?1

?t

?

2

=

14 =0.5, 28

? =4.3-0.5×4=2.3, ? = y - bt a
? =0.5t+2.3. 所求回归方程为 y

(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人 均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.

附:回归直线的斜率和截距的最小二乘法估计公式分别为

?= b

? ?t
n i ?1

i

?t
i

?? y ? y ?
i

? ?t
n i ?1

?t

?

2

? . ,a ? = y - bt

? =0.5>0.故 2007 年至 2013 年该地区农村居民家庭 解:(2)由(1)知, b

人均纯收入逐年增加,平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得
? =0.5×9+2.3=6.8, y

故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.

【例2】 (2015·全国Ⅰ卷)某公司为确定下一年度投入某种产品的宣 传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润 z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,?,8) 数据作了初步处理,得到下面的散点图及一些统计量的值.

x

y

w

??
8 i ?1

xi ? x

?

2

? ? w ? w?
8 i ?1 i

2

? ? x ? x ?? y
8 i ?1 i

i

?y

?

?? w ? w?? y ? y ?
8 i ?1 i i

46.6

563

6.8

289.8

1.6

1 469

108.8

1 8 表中 wi= xi , w = ? wi , 8 i ?1

(1)根据散点图判断,y=a+bx与y=c+d

x 哪一个适宜作为年销售量y关

于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

解:(1)由散点图可以判断,y=c+d x 适宜作为年销售量 y 关于年宣 传费 x 的回归方程类型.
(2)令 w= x ,先建立 y 关于 w 的线性回归方程.由于

?= d

? ? w ? w?? y
8 i ?1 i n i ?1 i

i

?y
2

?

? ? w ? w?

=

108.8 =68, 1.6

? w =563-68×6.8=100.6, ?= y -d c
? =100.6+68w,因此 y 关于 x 的回归 所以 y 关于 w 的线性回归方程为 y ? =100.6+68 x . 方程为 y

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x,根据(2)的结果回 答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

解: (3)①由(2)知,当 x=49 时,年销售量 y 的预报值
? =100.6+68 49 =576.6, y

? =576.6×0.2-49=66.32. 年利润 z 的预报值 z

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α +β u的
斜率和截距的最小二乘估计分别为
? = ?

? ?u
n i ?1 n

i

? u vi ? v
i

??

?

? ?u
i ?1

?u

?

2

? =v -? ?u . ,?

解: ②根据(2)的结果知,年利润 z 的预报值

? =0.2(100.6+68 x )-x=-x+13.6 x +20.12. z
所以当 x =
13.6 ? 取得最大值. =6.8,即 x=46.24 时, z 2

故年宣传费为 46.24 千元时,年利润的预报值最大.

【例3】 (2016·安徽十校二模)为提高学生对读书的重视,让更多的人畅 游于书海中,从而获得更多的知识,某高中的校学生会开展了主题为“让 阅读成为习惯,让思考伴随人生”的实践活动.校学生会实践部的同学随 机抽查了学校的40名高一学生,通过调查他们是喜欢读纸质书还是喜欢读 电子书,来了解在校高一学生的读书习惯,得到如下列联表: 喜欢读纸质书 不喜欢读纸质书 合计


女 合计

16
8 24

4
12 16

20
20 40

(1)根据上表,能否有99%的把握认为是否喜欢读纸质书与性别有关系?

解:(1)计算 K2 的观测值 k=

40 ? ?16 ?12 ? 8 ? 4? 24 ?16 ? 20 ? 20

2

≈6.667>6.635,故有

99%的把握认为是否喜欢读纸质书与性别有关系.

(2)从被抽查的16名不喜欢读纸质书的学生中随机抽取2名学生,求抽到男 生人数ξ 的分布列及其数学期望E(ξ ). 2 n ad ? bc ? ? 参考公式:K2= ,其中n=a+b+c+d. ? a ? b ?? c ? d ?? a ? c ?? b ? d ? 下面的临界值供参考: P(K2≥k0) k0 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828

解: (2)ξ的可能取值为 0,1,2,
2 1 C12 C1 C2 11 2 1 12C 4 P(ξ=0)= 2 = ;P(ξ =1)= 2 = ;P(ξ =2)= 24 = .ξ 的分布列为 5 C16 C16 20 C16 20

ξ P E(ξ )=0×

0
11 20 11 2 1 1 +1× +2× = . 20 5 20 2

1
2 5

2
1 20

【例4】 (2016·河南许昌二次调研)某校高二年级共有学生1 000名,其 中走读生750名,住宿生250名,现采用分层抽样的方法从该年级抽取100名 学生进行问卷调查.根据问卷取得了这100名学生每天晚上有效学习时间 (单位:分钟)的数据,按照以下区间分为八组:①[0,30),②[30,60),③ [60,90),④[90,120),?得到频率分布直方图(部分)如图.

(1)如果把“学生晚上有效学习时间达到两小时”作为是否充分利用时间 的标准,对抽取的100名学生,完成下列2×2列联表;并判断能否在犯错误的 概率不超过0.05的前提下认为学生利用时间是否充分与走读、住宿有关? 参考公式:K2= . ? a ? b ?? c ? d ?? a ? c ?? b ? d ? 参考列表:
n ? ad ? bc ?
2

P(K2≥k0) 0.50 k0 走读生 住宿生 总计

0.40

0.25

0.15

0.10

0.05

0.025 总计

0.455 0.708 1.323 2.072 2.706 3.841 5.024 利用时间充分 50 10 60 利用时间充分 利用时间不充分 100 总计 利用时间不充分

解: (1)列联表如表,

走读生
住宿生 总计
K2 的观测值 k=

50
10 60
100 ? ? 50 ? 15 ? 25 ? 10? 75 ? 25 ? 40 ? 60
2

25
15 40

75
25 100

≈5.556>3.841,所以能在犯错误的概率

不超过 0.05 的前提下认为学生利用时间是否充分与走读、住宿有关.

(2)若在第①组、第②组、第③组中共抽出3人调查影响有效利用时间的 原因,记抽到“有效学习时间少于60分钟”的学生人数为X,求X的分布列 和数学期望.
解:(2)设第 由图可知 P1= P2= P3=
1 1 ×30= , 3000 100 1 4 ×30= , 750 100 1 10 ×30= , 300 100

组的频率为 Pi(i=1,2,?,8),

可得第①组 1 人,第②组 4 人,第③组 10 人.

3?i C1 5 C10 则 X 的所有可能取值为 0,1,2,3,P(X=i)= (i=0,1,2,3), 3 C15 0 3 2 C5 C10 24 C1 45 5C10 所以 P(X=0)= 3 = ,P(X=1)= 3 = , 91 91 C15 C15 2 1 0 C5 C10 20 C3 C 2 P(X=2)= 3 = ,P(X=3)= 5 3 10 = , 91 91 C15 C15

所以 X 的分布列为 P X E(X)=0× 0
24 91

1
45 91

2
20 91

3
2 91

24 45 20 2 +1× +2× +3× =1. 91 91 91 91

解题规范夯实
圾无害化处理量(单位:亿吨)的折线图.

把典型问题的解决程序化

【典例】 (12分) (2016·全国Ⅲ卷) 如图是我国2008年至2014年生活垃

(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以 说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量.
参考数据:

?y
i ?1

7

i

=9.32,

?t y
i ?1

7

i i

=40.17,

?? y
7 i ?1

i

?y

?

2

=0.55, 7 ≈2.646.

参考公式:相关系数 r=

??t
n i ?1

i

? t yi ? y

??

? ?
2

??
n i ?1

ti ? t

? ??
2 n i ?1

,

yi ? y

? t 中斜率和截距的最小二乘估计公式分别为 ? =a 回归方程 y ? +b

?= b

? ?t
n i ?1

i

?t

?? y ? y ?
i

??
n i ?1

ti ? t

?

2

? . ,a ? = y - bt

审题指导 关键信息 信息转化 得出变量t,y的7组样本数据. 折线图; 参考数据和公式 根据数据和公式进行相关计算. ①利用相关系数说明两变量具有 较好的线性相关关系;②求出回

归直线方程并作出预测
解题突破:(1)读懂折线图,得出样本数据; (2)准确使用给出的数据和公式进行正确计算.

(3)利用计算结果,回答实际问题

满分展示:

解:(1)由已知条件知,
t =4,

??t
7 i ?1

i

?t

?

2

=28,
7

?? y
7 i ?1

i

?y

?

2

=0.55,

??t
7 i ?1

i

? t yi ? y = ? ti yi - t ? yi =40.17-4×9.32=2.89,
i ?1 i ?1

??

?

7

r≈

2.89 ≈0.99.……………………………………3 分 0.55 ? 2 ? 2.646

因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度 相当大,从而可以用线性回归模型拟合 y 与 t 的关系. ……5 分

(2)由 y =

9.32 ≈1.331 及(1)得 7

?= b

? ?t
7 i ?1

i

?t
i

?? y ? y ?
i

? ?t
7 i ?1

?t

?

2

=

2.89 ≈0.103.????????????7 分 28

? ≈1.331-0.103×4≈0.92. ? = y - bt a
? =0.92+0.10t. ?????????9 分 所以,y 关于 t 的回归方程为 y

将 2016 年对应的 t=9 代入回归方程得
? =0.92+0.10×9=1.82. ??????????????????11 分 y

所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨. ??12 分

答题模板:第一步:得出具有相关关系的两个变量的样本数据; 第二步:利用已知公式求相关系数、回归直线方程的系数,得出回归直

线方程;
第三步:利用回归直线方程进行预测,解决实际问题.



学霸百科 | 新词新语

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图