


还剩13页未读,
继续阅读
多维层次练63-随机抽样、用样本估计总体学案
展开
这是一份多维层次练63-随机抽样、用样本估计总体学案,共16页。
1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
解析:因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大约介于15%到20%之间,故脂肪含量的中位数小于20%.故选B.
答案:B
2.根据如下样本数据:
得到的线性回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则( )
A.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))>0 B.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0
C.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))>0 D.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))<0
解析:根据给出的数据可发现:整体上y与x呈现负相关,所以eq \(b,\s\up6(^))<0,由样本点(3,4.0)及(4,2.5)可知eq \(a,\s\up6(^))>0,故选B.
答案:B
3.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
由表中数据得回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=-2,预测当气温为-4 ℃时,用电量度数为( )
A.68 B.67
C.65 D.64
解析:回归直线过点(eq \(\s\up8(—),\s\d4(x)),eq \(\s\up8(—),\s\d4(y))),根据题意知eq \(\s\up8(—),\s\d4(x))=eq \f(18+13+10+(-1),4)=10,eq \(\s\up8(—),\s\d4(y))=eq \f(24+34+38+64,4)=40,将(10,40)代入eq \(\s\up8(—),\s\d4(y))=-2x+eq \(a,\s\up6(^))中,解得eq \(a,\s\up6(^))=60,则eq \(y,\s\up6(^))=-2x+60,当x=-4时,eq \(y,\s\up6(^))=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.
答案:A
4.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=eq \(b,\s\up6(^))1x+eq \(a,\s\up6(^))1相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=eq \(b,\s\up6(^))2x+eq \(a,\s\up6(^))2,相关系数为r2.则( )
A.0C.-1解析:由散点图得这两个变量呈负相关,所以r1,r2<0.因为剔除点(10,21)后,剩下的数据更具有线性相关性,所以|r2|更接近1.所以-1答案:D
5.下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.
答案:B
6.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:
由K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得,
K2=eq \f(110×(40×30-20×20)2,60×50×60×50)≈7.8.
附表:
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析:根据独立性检验的定义,由K2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关.”
答案:A
7.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归直线方程为eq \(y,\s\up6(^))=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
解析:因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68(吨)是废品.
答案:16.68
8.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如下表:
经计算K2的值,则有________%的把握认为玩手机对学习有影响.
附:
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),n=a+b+c+d
解析:由表中数据,计算K2=eq \f(30×(4×2-8×16)2,12×18×20×10)=10,且10>7.879,
则有99.5%的把握认为玩手机对学习有影响.
答案:99.5
9.(2020·山东模拟)下面给出了根据我国2012年—2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年—2018年的年份代码x分别为1~7).
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得eq \i\su(i=0,7, )yi=1 074,eq \i\su(i=0,7, )xiyi=4 517,求y关于x的线性回归方程;
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.
附:回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为eq \(b,\s\up6(^))=,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))
解:(1)由散点图可以看出,点大致分布在某一直线的附近,且当x由小变大时,y也由小变大,从而y与x之间是正相关关系.
(2)由题中数据可得eq \(\s\up8(—),\s\d4(x))=eq \f(1,7)(1+2+3+4+5+6+7)=4,
eq \(\s\up8(—),\s\d4(y))=eq \f(1,7)×1 074=eq \f(1 074,7),
从而eq \(b,\s\up6(^))==
eq \f(4 517-7×\f(1,7)×1 074×4,12+22+32+42+52+62+72-7×42)=eq \f(221,28),
eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))=eq \f(1 074,7)-eq \f(221,28)×4=eq \f(853,7),
从而所求y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(221,28)x+eq \f(853,7).
(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.
10.为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸质阅读的人数之比为3∶1.将这200人按年龄(单位:岁)分组,统计得到通过电子阅读的'居民的频率分布直方图如图所示.
(1)求a的值及通过电子阅读的居民的平均年龄;
(2)把年龄在[15,45)的居民称为中青年,年龄在[45,65]的居民称为中老年,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并判断是否有97.5%的把握认为阅读方式与年龄有关?
附:
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
解:(1)由题中频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,
解得a=0.035,
所以通过电子阅读的居民的平均年龄为
20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)这200人中通过电子阅读的人数为200×eq \f(3,3+1)=150,通过纸质阅读的人数为200-150=50.
因为(0.01+0.015+0.035)∶(0.03+0.01)=3∶2,
所以通过电子阅读的中青年的人数为150×eq \f(3,3+2)=90,
中老年的人数为150-90=60.
2×2列联表为
由表中数据,得K2=eq \f(200×(90×30-20×60)2,110×90×150×50)≈6.061>5.024,
所以有97.5%的把握认为阅读方式与年龄有关.
[综合应用练]
11.(2020·长沙模拟)为了解某社区居民购买水果和牛奶的-年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计表:
根据上表可得回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=0.59,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x)),据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )
A.1.795万元 B.2.555万元
C.1.915万元 D.1.945万元
解析:eq \(\s\up8(—),\s\d4(x))=eq \f(1,5)×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),eq \(\s\up8(—),\s\d4(y))=eq \f(1,5)×(1.25+1.30+1.50+1.70+1.75)=1.50(万元),其中eq \(b,\s\up6(^))=0.59,则eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))=0.025,eq \(y,\s\up6(^))=0.59x+0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为eq \(y,\s\up6(^))=0.59×3.00+0.025=1.795(万元).
答案:A
12.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表:
得K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
得K2=eq \f(100×(45×22-20×13)2,65×35×58×42)≈9.616.
参照下表:
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.
答案:C
13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析:K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案:①
14.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的eq \f(1,2),男生喜欢韩剧的人数占男生人数的eq \f(1,6),女生喜欢韩剧的人数占女生人数的eq \f(2,3).若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.
解析:设男生人数为x,由题意可得列联表如下:
若有95%的把握认为是否喜欢韩剧和性别有关,
则k>3.841,
即k=eq \f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\c1(\f(x,6)·\f(x,6)-\f(5x,6)·\f(x,3)))\s\up12(2),x·\f(x,2)·\f(x,2)·x)=eq \f(3x,8)>3.841.
解得x>10.243.
因为eq \f(x,6),eq \f(x,2)为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.
答案:12
15.一只红铃虫的产卵数y(单位:个)和温度x(单位:℃)有关,现收集了4组观测数据列于下表中,
根据数据作出散点图如下:
(1)根据散点图判断y=bx+a与y=ebx+a哪一个更适宜作为产卵数y关于温度x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(数字保留两位小数);
(3)要使得产卵数不超过50个,则温度应控制在多少以下(最后结果保留到整数)?
参考数据:eq \(\s\up8(—),\s\d4(x))=27.5,eq \(\s\up8(—),\s\d4(y))=112.5,eq \(\s\up8(—),\s\d4(z))=3.75,
4eq \(\s\up8(—),\s\d4(x)) eq \(\s\up8(—),\s\d4(y))=12 375,4eq \(\s\up8(—),\s\d4(x)) eq \(\s\up8(—),\s\d4(z))=412.5,4eq \(\s\up8(—),\s\d4(x))2=3 025,
eq \i\su(i=1,4, )xiyi=14 975, eq \i\su(i=1,4, ) xizi=447.8,
eq \i\su(i=1,4, )xeq \\al(2,i)=3 150,ln 50≈3.91
解:(1)由散点图可以判断,y=ebx+a更适宜作为产卵数y关于温度x的回归方程类型.
(2)因为y=ebx+a,令z=ln y=bx+a,
所以z与x之间具有线性相关关系,
所以b==eq \f(447.8-412.5,3 150-3 025)≈0.28,
a=eq \(\s\up8(—),\s\d4(z))-b,eq \(\s\up8(—),\s\d4(x))=3.75-0.28×27.5=-3.95,
所以z=0.28x-3.95,
即y=e0.28x-3.95.
(3)由y≤50,
即e0.28x-3.95≤50,
得0.28x-3.95≤ln 50≈3.91,
解得x≤28.07,
要使得产卵数不超过50个,则温度应控制在28 ℃以下.
[拔高创新练]
16.随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:
(1)从这5天中任选2天,记这2天药用昆虫的产卵数分别为m,n,求事件“m,n均不小于25”的概率;
(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.
①若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;
②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?
附:回归直线的斜率和截距的最小二乘估计公式分别为
eq \(b,\s\up6(^))=,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))
解:(1)依题意得,m,n的所有情况有{23,25},{23,30},{23,26},{23,16},{25,30},{25,26},{25,16},{30,26},{30,16},{26,16},共10个.
设“m,n均不小于25”为事件A,则事件A包含的所有情况有{25,30},{25,26},{30,26},共3个,
所以P(A)=eq \f(3,10),
故事件“m,n均不小于25”的概率为eq \f(3,10).
(2)①由已知数据得eq \(\s\up8(—),\s\d4(x))=12,eq \(\s\up8(—),\s\d4(y))=27,eq \i\su(i=1,3, )(xi-eq \(\s\up8(—),\s\d4(x)))(yi-eq \(\s\up8(—),\s\d4(y)))=5,eq \i\su(i=1,3, ) (xi-eq \(\s\up8(—),\s\d4(x)))2=2,
所以eq \(b,\s\up6(^))==eq \f(5,2),
eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \f(5,2)eq \(\s\up8(—),\s\d4(x))=27-eq \f(5,2)×12=-3.
所以y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(5,2)x-3.
②由①知,y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(5,2)x-3.
当x=10时,eq \(y,\s\up6(^))=eq \f(5,2)×10-3=22,|22-23|<2,
当x=8时,eq \(y,\s\up6(^))=eq \f(5,2)×8-3=17,|17-16|<2.
所以①中所得的线性回归方程eq \(y,\s\up6(^))=eq \f(5,2)x-3是可靠的.
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1
气温x/℃
18
13
10
-1
用电量y/度
24
34
38
64
分类
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总 计
60
50
110
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
玩手机
不玩手机
合计
学习成绩优秀
4
8
12
学习成绩不优秀
16
2
18
合计
20
10
30
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
项目
电子阅读
纸质阅读
总计
中青年
中老年
总计
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
项目
电子阅读
纸质阅读
总计
中青年
90
20
110
中老年
60
30
90
总计
150
50
200
购买食品的年支出费用x/万元
2.09
2.15
2.50
2.84
2.92
购买水果和牛奶的年支出费用y/万元
1.25
1.30
1.50
1.70
1.75
项目
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
分类
喜欢韩剧
不喜欢韩剧
总计
男生
eq \f(x,6)
eq \f(5x,6)
x
女生
eq \f(x,3)
eq \f(x,6)
eq \f(x,2)
总计
eq \f(x,2)
x
eq \f(3x,2)
温度x/℃
20
25
30
35
产卵数y/个
5
20
100
325
y
5
20
100
325
z=ln y
1.61
3
4.61
5.78
日期
2日
7日
15日
22日
30日
温度x/℃
10
11
13
12
8
产卵数y/个
23
25
30
26
16
1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
解析:因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大约介于15%到20%之间,故脂肪含量的中位数小于20%.故选B.
答案:B
2.根据如下样本数据:
得到的线性回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则( )
A.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))>0 B.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0
C.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))>0 D.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))<0
解析:根据给出的数据可发现:整体上y与x呈现负相关,所以eq \(b,\s\up6(^))<0,由样本点(3,4.0)及(4,2.5)可知eq \(a,\s\up6(^))>0,故选B.
答案:B
3.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
由表中数据得回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=-2,预测当气温为-4 ℃时,用电量度数为( )
A.68 B.67
C.65 D.64
解析:回归直线过点(eq \(\s\up8(—),\s\d4(x)),eq \(\s\up8(—),\s\d4(y))),根据题意知eq \(\s\up8(—),\s\d4(x))=eq \f(18+13+10+(-1),4)=10,eq \(\s\up8(—),\s\d4(y))=eq \f(24+34+38+64,4)=40,将(10,40)代入eq \(\s\up8(—),\s\d4(y))=-2x+eq \(a,\s\up6(^))中,解得eq \(a,\s\up6(^))=60,则eq \(y,\s\up6(^))=-2x+60,当x=-4时,eq \(y,\s\up6(^))=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.
答案:A
4.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=eq \(b,\s\up6(^))1x+eq \(a,\s\up6(^))1相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=eq \(b,\s\up6(^))2x+eq \(a,\s\up6(^))2,相关系数为r2.则( )
A.0
5.下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.
答案:B
6.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:
由K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得,
K2=eq \f(110×(40×30-20×20)2,60×50×60×50)≈7.8.
附表:
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析:根据独立性检验的定义,由K2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关.”
答案:A
7.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归直线方程为eq \(y,\s\up6(^))=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
解析:因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68(吨)是废品.
答案:16.68
8.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如下表:
经计算K2的值,则有________%的把握认为玩手机对学习有影响.
附:
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),n=a+b+c+d
解析:由表中数据,计算K2=eq \f(30×(4×2-8×16)2,12×18×20×10)=10,且10>7.879,
则有99.5%的把握认为玩手机对学习有影响.
答案:99.5
9.(2020·山东模拟)下面给出了根据我国2012年—2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年—2018年的年份代码x分别为1~7).
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得eq \i\su(i=0,7, )yi=1 074,eq \i\su(i=0,7, )xiyi=4 517,求y关于x的线性回归方程;
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.
附:回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为eq \(b,\s\up6(^))=,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))
解:(1)由散点图可以看出,点大致分布在某一直线的附近,且当x由小变大时,y也由小变大,从而y与x之间是正相关关系.
(2)由题中数据可得eq \(\s\up8(—),\s\d4(x))=eq \f(1,7)(1+2+3+4+5+6+7)=4,
eq \(\s\up8(—),\s\d4(y))=eq \f(1,7)×1 074=eq \f(1 074,7),
从而eq \(b,\s\up6(^))==
eq \f(4 517-7×\f(1,7)×1 074×4,12+22+32+42+52+62+72-7×42)=eq \f(221,28),
eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))=eq \f(1 074,7)-eq \f(221,28)×4=eq \f(853,7),
从而所求y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(221,28)x+eq \f(853,7).
(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.
10.为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸质阅读的人数之比为3∶1.将这200人按年龄(单位:岁)分组,统计得到通过电子阅读的'居民的频率分布直方图如图所示.
(1)求a的值及通过电子阅读的居民的平均年龄;
(2)把年龄在[15,45)的居民称为中青年,年龄在[45,65]的居民称为中老年,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并判断是否有97.5%的把握认为阅读方式与年龄有关?
附:
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
解:(1)由题中频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,
解得a=0.035,
所以通过电子阅读的居民的平均年龄为
20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)这200人中通过电子阅读的人数为200×eq \f(3,3+1)=150,通过纸质阅读的人数为200-150=50.
因为(0.01+0.015+0.035)∶(0.03+0.01)=3∶2,
所以通过电子阅读的中青年的人数为150×eq \f(3,3+2)=90,
中老年的人数为150-90=60.
2×2列联表为
由表中数据,得K2=eq \f(200×(90×30-20×60)2,110×90×150×50)≈6.061>5.024,
所以有97.5%的把握认为阅读方式与年龄有关.
[综合应用练]
11.(2020·长沙模拟)为了解某社区居民购买水果和牛奶的-年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计表:
根据上表可得回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=0.59,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x)),据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )
A.1.795万元 B.2.555万元
C.1.915万元 D.1.945万元
解析:eq \(\s\up8(—),\s\d4(x))=eq \f(1,5)×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),eq \(\s\up8(—),\s\d4(y))=eq \f(1,5)×(1.25+1.30+1.50+1.70+1.75)=1.50(万元),其中eq \(b,\s\up6(^))=0.59,则eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))=0.025,eq \(y,\s\up6(^))=0.59x+0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为eq \(y,\s\up6(^))=0.59×3.00+0.025=1.795(万元).
答案:A
12.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表:
得K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
得K2=eq \f(100×(45×22-20×13)2,65×35×58×42)≈9.616.
参照下表:
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.
答案:C
13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析:K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案:①
14.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的eq \f(1,2),男生喜欢韩剧的人数占男生人数的eq \f(1,6),女生喜欢韩剧的人数占女生人数的eq \f(2,3).若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.
解析:设男生人数为x,由题意可得列联表如下:
若有95%的把握认为是否喜欢韩剧和性别有关,
则k>3.841,
即k=eq \f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\c1(\f(x,6)·\f(x,6)-\f(5x,6)·\f(x,3)))\s\up12(2),x·\f(x,2)·\f(x,2)·x)=eq \f(3x,8)>3.841.
解得x>10.243.
因为eq \f(x,6),eq \f(x,2)为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.
答案:12
15.一只红铃虫的产卵数y(单位:个)和温度x(单位:℃)有关,现收集了4组观测数据列于下表中,
根据数据作出散点图如下:
(1)根据散点图判断y=bx+a与y=ebx+a哪一个更适宜作为产卵数y关于温度x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(数字保留两位小数);
(3)要使得产卵数不超过50个,则温度应控制在多少以下(最后结果保留到整数)?
参考数据:eq \(\s\up8(—),\s\d4(x))=27.5,eq \(\s\up8(—),\s\d4(y))=112.5,eq \(\s\up8(—),\s\d4(z))=3.75,
4eq \(\s\up8(—),\s\d4(x)) eq \(\s\up8(—),\s\d4(y))=12 375,4eq \(\s\up8(—),\s\d4(x)) eq \(\s\up8(—),\s\d4(z))=412.5,4eq \(\s\up8(—),\s\d4(x))2=3 025,
eq \i\su(i=1,4, )xiyi=14 975, eq \i\su(i=1,4, ) xizi=447.8,
eq \i\su(i=1,4, )xeq \\al(2,i)=3 150,ln 50≈3.91
解:(1)由散点图可以判断,y=ebx+a更适宜作为产卵数y关于温度x的回归方程类型.
(2)因为y=ebx+a,令z=ln y=bx+a,
所以z与x之间具有线性相关关系,
所以b==eq \f(447.8-412.5,3 150-3 025)≈0.28,
a=eq \(\s\up8(—),\s\d4(z))-b,eq \(\s\up8(—),\s\d4(x))=3.75-0.28×27.5=-3.95,
所以z=0.28x-3.95,
即y=e0.28x-3.95.
(3)由y≤50,
即e0.28x-3.95≤50,
得0.28x-3.95≤ln 50≈3.91,
解得x≤28.07,
要使得产卵数不超过50个,则温度应控制在28 ℃以下.
[拔高创新练]
16.随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:
(1)从这5天中任选2天,记这2天药用昆虫的产卵数分别为m,n,求事件“m,n均不小于25”的概率;
(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.
①若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;
②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?
附:回归直线的斜率和截距的最小二乘估计公式分别为
eq \(b,\s\up6(^))=,eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \(b,\s\up6(^))eq \(\s\up8(—),\s\d4(x))
解:(1)依题意得,m,n的所有情况有{23,25},{23,30},{23,26},{23,16},{25,30},{25,26},{25,16},{30,26},{30,16},{26,16},共10个.
设“m,n均不小于25”为事件A,则事件A包含的所有情况有{25,30},{25,26},{30,26},共3个,
所以P(A)=eq \f(3,10),
故事件“m,n均不小于25”的概率为eq \f(3,10).
(2)①由已知数据得eq \(\s\up8(—),\s\d4(x))=12,eq \(\s\up8(—),\s\d4(y))=27,eq \i\su(i=1,3, )(xi-eq \(\s\up8(—),\s\d4(x)))(yi-eq \(\s\up8(—),\s\d4(y)))=5,eq \i\su(i=1,3, ) (xi-eq \(\s\up8(—),\s\d4(x)))2=2,
所以eq \(b,\s\up6(^))==eq \f(5,2),
eq \(a,\s\up6(^))=eq \(\s\up8(—),\s\d4(y))-eq \f(5,2)eq \(\s\up8(—),\s\d4(x))=27-eq \f(5,2)×12=-3.
所以y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(5,2)x-3.
②由①知,y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(5,2)x-3.
当x=10时,eq \(y,\s\up6(^))=eq \f(5,2)×10-3=22,|22-23|<2,
当x=8时,eq \(y,\s\up6(^))=eq \f(5,2)×8-3=17,|17-16|<2.
所以①中所得的线性回归方程eq \(y,\s\up6(^))=eq \f(5,2)x-3是可靠的.
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1
气温x/℃
18
13
10
-1
用电量y/度
24
34
38
64
分类
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总 计
60
50
110
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
玩手机
不玩手机
合计
学习成绩优秀
4
8
12
学习成绩不优秀
16
2
18
合计
20
10
30
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
项目
电子阅读
纸质阅读
总计
中青年
中老年
总计
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
项目
电子阅读
纸质阅读
总计
中青年
90
20
110
中老年
60
30
90
总计
150
50
200
购买食品的年支出费用x/万元
2.09
2.15
2.50
2.84
2.92
购买水果和牛奶的年支出费用y/万元
1.25
1.30
1.50
1.70
1.75
项目
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
分类
喜欢韩剧
不喜欢韩剧
总计
男生
eq \f(x,6)
eq \f(5x,6)
x
女生
eq \f(x,3)
eq \f(x,6)
eq \f(x,2)
总计
eq \f(x,2)
x
eq \f(3x,2)
温度x/℃
20
25
30
35
产卵数y/个
5
20
100
325
y
5
20
100
325
z=ln y
1.61
3
4.61
5.78
日期
2日
7日
15日
22日
30日
温度x/℃
10
11
13
12
8
产卵数y/个
23
25
30
26
16
相关学案
多维层次练56-排列组合学案: 这是一份多维层次练56-排列组合学案,共8页。
多维层次练51- 抛物线学案: 这是一份多维层次练51- 抛物线学案,共13页。
多维层次练50-双曲线学案: 这是一份多维层次练50-双曲线学案,共12页。