- 第二章 随机变量及其分布达标检测 试卷 1 次下载
- 3.1 回归分析的基本思想及其初步应用练习题 试卷 1 次下载
- 3.2 独立性检验的基本思想及其初步应用练习题 试卷 1 次下载
- 第三章 统计案例复习提升 试卷 试卷 1 次下载
- 选修2-3综合测评 试卷 2 次下载
高中数学人教版新课标A选修2-3第三章 统计案例综合与测试当堂检测题
展开本章达标检测
一、选择题(本大题共12小题,每小题5分,共60分)
1.有以下五组变量:
①某商品的销售价格与销售量;
②学生的学号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮的销售量;
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关关系的是( )
A.①③ B.②④ C.②⑤ D.④⑤
2.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )
A.频率分布直方图 B.回归分析
C.独立性检验 D.用样本估计总体
3.某地区不同身高的未成年男性的体重平均值如下表:
身高 (cm) | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
体重 (kg) | 6.13 | 7.90 | 9.99 | 12.15 | 15.02 | 17.50 | 20.92 | 26.86 | 31.10 | 38.56 |
给出两个回归方程:(1)=0.42x-25.32;(2)=2×1.02x.通过计算,得到它们的相关指数分别为=0.931,=0.998,则拟合效果较好的回归方程是( )
A.=2×1.02x B.=0.42x-25.32
C.两个一样好 D.无法判断
4.某同学将收集到的6组数据制作成如图所示的散点图(各点旁的数据为该点坐标),并由这6组数据计算得到其回归直线l的方程:=x+和相关系数r.现给出以下3个结论:①r>0;②直线l恰过点D;③>1.其中正确结论的序号是( )
A.①② B.①③ C.②③ D.①②③
5.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,用最小二乘法建立的回归方程为=-5x+150,则下列结论正确的是( )
A.y与x具有正的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=-5
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
6.在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,x3,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+2上,则这组样本数据的相关系数为( )
A.- B. C.1 D.-1
7.在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:
| 优秀 | 非优秀 | 合计 |
甲班 | 10 | 50 | 60 |
乙班 | 20 | 30 | 50 |
合计 | 30 | 80 | 110 |
附:K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.05 | 0.025 | 0.010 | 0.001 |
k0 | 3.841 | 5.024 | 6.635 | 10.828 |
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )
A.95% B.97.5% C.99.9% D.99%
8.一车间为规定工时定额,需要确定加工零件的数量x(个)与所花费的时间y(分钟)之间的关系,为此进行了4次试验,测得的数据如下:
零件数量x(个) | 2 | 3 | 4 | 5 |
加工时间y(分钟) | 26 | a | 49 | 54 |
根据上表可得y与x之间的回归方程=9.4x+9.1,则实数a的值为( )
A.37.3 B.38
C.39 D.39.5
9.在一次独立性检验中,认为其结论成立的把握超过99%但不超过99.5%,则K2的可能值为( )
独立性检验临界值表:
P(K2≥k0) | 0.100 | 0.050 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
A.5.424 B.6.765
C.7.897 D.11.897
10.为了考察两个变量x和y之间的线性相关性,甲和乙两位同学各自独立做了10次和15次试验,并且利用最小二乘法求得回归直线分别为l1,l2.已知两人所得的试验数据中,变量x和y的数据的平均值都相等,分别是,,则下列说法正确的是( )
A.直线l1和l2一定有公共点(,)
B.直线l1和l2相交,但交点不一定是(,)
C.必有直线l1∥l2
D.l1和l2必定重合
11.学校通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:
| 男 | 女 | 总计 |
爱吃 | 10 | 40 | 50 |
不爱吃 | 20 | 30 | 50 |
总计 | 30 | 70 | 100 |
附表:
P(K2≥k0) | 0.10 | 0.05 | 0.025 |
k0 | 2.706 | 3.841 | 5.024 |
其中K2=,n=a+b+c+d.
下列结论正确的是( )
A.在犯错误的概率不超过0.05的前提下,认为“爱吃零食与性别有关”
B.在犯错误的概率不超过0.05的前提下,认为“爱吃零食与性别无关”
C.在犯错误的概率不超过0.025的前提下,认为“爱吃零食与性别有关”
D.在犯错误的概率不超过0.025的前提下,认为“爱吃零食与性别无关”
12.已知两个分类变量X和Y,它们的取值分别为{X1,X2}和{Y1,Y2},通过抽样得到的频数表如下:
| Y1 | Y2 |
X1 | a | b |
X2 | c | d |
则下列哪两个比值相差越大,两个分类变量之间的关系越强( )
A.与 B.与
C.与 D.与
二、填空题(本大题共4小题,每小题5分,共20分)
13.博鳌亚洲论坛2018年年会于4月8日至4月11日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在“性别与是否会俄语”的2×2列联表中,a-b+d= .
| 会俄语 | 不会俄语 | 总计 |
男 | a | b | 20 |
女 | 6 | d |
|
总计 | 18 |
| 50 |
14.某商品A的广告投入费用x(万元)与销售利润y(万元)的统计数据如下表:
广告投入费用x(万元) | 2 | 3 | 5 | 6 |
销售利润y(万元) | 5 | 7 | 9 | 11 |
设线性回归方程为=x+,则当x=7时,销售利润y的估计值为 .
其中:=,=-.
15.已知具有相关关系的两个随机变量的一组观测数据所对应的点均匀分布在函数y=3e2x+1的图象附近,则可通过转换得到的线性回归方程为 .
16.为了了解学案的使用是否对学生的学习成绩有影响,随机抽取100名学生进行调查,得到2×2列联表,经计算得到K2的观测值k≈7.4,则可以得到结论:能在犯错误的概率不超过 的前提下,认为学生的学习成绩与使用学案有关.
参考数据:
P(K2≥k0) | 0.1 | 0.05 | 0.025 | 0.01 | 0.005 | 0.001 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
三、解答题(共70分)
17.(10分)某商城在2018年前7个月的销售额y(单位:万元)的数据如下表,已知销售额 y与月份t具有较好的线性关系.
月份t | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
销售额y | 58 | 66 | 72 | 88 | 96 | 104 | 118 |
(1)求y关于t的线性回归方程;
(2)分析该商城2018年前7个月的销售额的变化情况,并预测该商城2020年8月份的销售额.
附:=,=-.
18.(12分)已知某地区居民在2012年至2017年的人民币储蓄存款(年底余额)如下表:
年份 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 |
时间代号x | 1 | 2 | 3 | 4 | 5 | 6 |
储蓄存款 y(千亿元) | 3.5 | 5 | 6 | 7 | 8 | 9.5 |
(1)求y关于x的回归方程=x+,并预测该地区2020年的人民币储蓄存款(用最简分数作答);
(2)在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方,当R2>0.8时,认为线性回归模型是有效的,请计算R2并评价模型的拟合效果(计算结果精确到0.001).
附:=,=-,
r=.
19.(12分)为推动更多人阅读,联合国教科文组织规定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3∶1,将这200人按年龄(单位:岁)分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.
(1)求a的值及通过电子阅读的居民的平均年龄;
(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成下面的2×2列联表,并判断是否有97.5%的把握认为阅读方式与年龄有关.
| 电子阅读 | 纸质阅读 | 合计 |
青少年 |
|
|
|
中老年 |
|
|
|
合计 |
|
|
|
附:K2=,n=a+b+c+d.
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
20.(12分)在2017年年初的时候,国家政府工作报告明确提出,2017年要坚决打好蓝天保卫战,加快解决燃煤污染问题,全面实施散煤综合治理.实施煤改电工程后,某县城的近六个月的月用煤量逐渐减少,6月至11月的用煤量如下表所示:
月份x | 6 | 7 | 8 | 9 | 10 | 11 |
用煤量y(千吨) | 4.5 | * | 3 | 2.5 | 2 | 1.2 |
(1)由于某些原因,y中的一个数据丢失,但已知6至9月份y的样本平均值是3.5,求出丢失的数据;
(2)在(1)的条件下,根据6至9月份的数据,求出y关于x的线性回归方程=x+;
(3)现在用(2)中得到的线性回归方程估计10月、11月的用煤量,与10月、11月的实际数据比较,利用误差来判断该地区的改造项目是否达到预期,若误差均不超过0.3,则认为该地区的改造已经达到预期,否则认为改造未达预期.
参考公式:线性回归方程=x+中,==,=-.
21.(12分)司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门随机调查了100名机动车司机,并得到以下统计结果:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.
(1)试完成“开车时是否使用手机与司机的性别”的2×2列联表,并判断是否有99.5%的把握认为“开车时使用手机与司机的性别”有关;
(2)用上述样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望E(X).
参考数据与公式:
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
K2=,其中n=a+b+c+d.
22.(12分)某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.已知甲流水线上生产的样本落在(490,495]、(495,500]、(500,505]、(505,510]、(510,515]的频数依次为6、8、14、8、4,下图是乙流水线样本的频率分布直方图.
(1)试作出甲流水线样本的频率分布直方图;
(2)若以频率作为概率,试估计从乙流水线上任取1件产品,该产品恰好是合格品的概率;
(3)根据以上统计数据完成下面2×2列联表,试问能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?
| 甲流水线 | 乙流水线 | 总计 |
合格品 |
|
|
|
不合格品 |
|
|
|
总计 |
|
|
|
附表:
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
答案全解全析
一、选择题
1.D ①销售价格越高,销售量通常会越低,所以不是正相关关系;
②学生的数学成绩与学号无关;③医学证明不吃早餐的人容易患胃病,因此吃早餐的人数和患胃病的人数之间是负相关关系;④气温越高,冷饮销量越高,故是正相关关系;⑤电瓶车越重,耗电量越大,所以是正相关关系,故选D.
2.C 根据题意,结合题目中的数据,列出2×2列联表,求出K2,对照数表可得出结论,这种分析数据的方法是独立性检验.故选C.
3.A 因为在两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,所以回归方程=2×1.02x的拟合效果较好.
4.A 由散点图可得,从左到右各点是上升排列的,变量具有正相关性,所以r>0,①正确;由题中数据可得:==4,==3.5,
所以回归直线恰过点D(4,3.5),②正确;==≈0.514<1,③错误.故选A.
5.D 由回归方程=-5x+150可知y与x具有负的线性相关关系,故A错误;|r|≤1,故B错误;当销售价格为10元/件时,销售量约为-5×10+150=100件,故C错误,D正确.
6.D 由题意可得这两个变量具有负相关性,故这组样本数据的样本相关系数为负值,又所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+2上,∴其相关系数r=-1.故选D.
7.D 由题表中的数据可得:
K2=≈7.49,因为7.49>6.635,所以可以认为数学考试成绩与班级有关系的把握为99%.故选D.
8.C 由题意可得,==3.5,==,
由回归直线必过样本点的中心(,),得=9.4×3.5+9.1,解得a=39,故选C.
9.B 由题意得P(K2≥6.635)≈0.010,P(K2≥7.879)≈0.005,若认为其结论成立的把握超过99%但不超过99.5%,则6.635≤K2<7.879,故选B.
10.A 回归直线必过样本点的中心,故选A.
11.A 由题意得,K2=≈4.762>3.841,
又因为P(K2≥3.841)≈0.05,所以在犯错误的概率不超过0.05的前提下,认为“爱吃零食与性别有关”,故选A.
12.A K2越大,说明两个分类变量之间有关系的把握程度越大,即两个分类变量之间的关系就越强,又-=,故与的值相差越大,K2就越大,两个分类变量之间的关系就越强,故选A.
二、填空题
13.答案 28
解析 由题得解得a=12,b=8,d=24.所以a-b+d=28.故答案为28.
14.答案 12.2
解析 由题中数据可得:==4,==8,所以===1.4,
所以=-=8-1.4×4=2.4,故回归方程为=1.4x+2.4,
所以当x=7时,=1.4×7+2.4=12.2.
15.答案 =1+ln 3+2x
解析 由y=3e2x+1,得ln y=ln(3e2x+1),即ln y=ln 3+2x+1.
令u=ln y,则线性回归方程为=1+ln 3+2x.故答案为=1+ln 3+2x.
16.答案 0.01
解析 K2的观测值k≈7.4,与题表中数据比较可知7.879>7.4>6.635,所以能在犯错误的概率不超过0.01的前提下,认为学生的学习成绩与使用学案有关.
三、解答题
17.解析 (1)由所给数据计算得=×(1+2+3+4+5+6+7)=4,
=×(58+66+72+88+96+104+118)=86,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-28)+(-2)×(-20)+(-1)×(-14)+0×2+1×10+2×18+3×32=280,
∴= = =10,
=-=86-10×4=46.
故所求回归方程为=10t+46.
(2)由(1)知,=10>0,故前7个月该商城月销售额逐月增加,平均每月增加10万元.将t=32代入(1)中的回归方程,得=10×32+46=366.
故预测该商城2020年8月份的销售额为366万元.
18.解析 (1)由题意得=×(1+2+3+4+5+6)=,=×(3.5+5+6+7+8+9.5)=,
xiyi=156.5,=91,
所以==,=-×=,故回归方程为=x+.2020年对应的时间代号为9,当x=9时,=,故预测该地区2020年的人民币储蓄存款是千亿元.
(2)经计算,得r=≈0.997,故R2≈0.994>0.8,所以该回归模型是有效的,且拟合效果较好.
19.解析 (1)由频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,
解得a=0.035,所以通过电子阅读的居民的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)∵200人中通过电子阅读与纸质阅读的人数之比为3∶1,∴通过纸质阅读的人数为200×=50,其中中老年有30人,∴通过纸质阅读的青少年有20人;通过电子阅读的总人数为150,其中青少年人数为150×(0.1+0.15+0.35)=90,则中老年有60人,得2×2列联表如下:
| 电子阅读 | 纸质阅读 | 合计 |
青少年 | 90 | 20 | 110 |
中老年 | 60 | 30 | 90 |
合计 | 150 | 50 | 200 |
K2==≈6.061>5.024,∴有97.5%的把握认为阅读方式与年龄有关.
20.解析 (1)设丢失的数据为m,则4.5+m+3+2.5=3.5×4,解得m=4,即丢失的数据是4.
(2)由(1)及题表中数据得=7.5,=3.5,由公式求得===-0.7,
∴=-=3.5-(-0.7)×7.5=8.75,∴y关于x的线性回归方程为=-0.7x+8.75.
(3)当x=10时,=1.75,|1.75-2|=0.25<0.3;
当x=11时,=1.05,|1.05-1.2|=0.15<0.3.
∴该地区的煤改电项目已经达到预期.
21.解析 (1)根据题意可得如下2×2列联表:
| 开车时使用手机 | 开车时不使用手机 | 合计 |
男性司机 | 40 | 15 | 55 |
女性司机 | 20 | 25 | 45 |
合计 | 60 | 40 | 100 |
∵K2=≈8.249>7.879,∴有99.5%的把握认为“开车时使用手机与司机的性别”有关.
(2)由(1)中表格可知,随机抽检1辆机动车,其司机为男性且开车时使用手机的概率为=.
由题意可知,X的所有可能取值是0,1,2,3,且X~B,
∴P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
∴X的分布列为
X | 0 | 1 | 2 | 3 |
P |
数学期望E(X)=3×=1.2.
22.解析 (1)根据所给的每一组的频数和样本容量求出每一组的频率,在平面直角坐标系中作出频率分布直方图.甲流水线样本的频率分布直方图如下:
(2)由题图知,乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故合格品的频率为=0.9,据此可估计从乙流水线上任取1件产品,该产品恰好是合格品的概率为0.9.
(3)补充完整的2×2列联表如下:
| 甲流水线 | 乙流水线 | 总计 |
合格品 | 30 | 36 | 66 |
不合格品 | 10 | 4 | 14 |
总计 | 40 | 40 | 80 |
计算得K2≈3.117>2.706,∴能在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.
高中数学高考第63讲 变量间的相关关系、统计案例(达标检测)(学生版): 这是一份高中数学高考第63讲 变量间的相关关系、统计案例(达标检测)(学生版),共13页。
高考数学(理数)一轮复习:课时达标检测51《统计案例》(学生版): 这是一份高考数学(理数)一轮复习:课时达标检测51《统计案例》(学生版)
高考数学(理数)一轮复习:课时达标检测51《统计案例》(教师版): 这是一份高考数学(理数)一轮复习:课时达标检测51《统计案例》(教师版)