高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析本章综合与测试当堂达标检测题
展开第八章 章末测试
一、单选题(每题只有一个选项为正确答案,每题5分,8题共40分)
1.(2021·应城市第一高级中学高二期末)已知x与y之间的一组数据如下表:
x | 3 | 4 | 5 | 6 |
y | 30 | 40 | 60 | 50 |
若y与x线性相关,根据上表求得y与x的线性回归方程,中的为8,据此模型预报时y的值为( )
A.70 B.63 C.65 D.66
【答案】C
【解析】由表中数据可知:,
所以,所以,
令,,
故选:C
2.(2021·黄石市有色第一中学高二期末)下列关于回归分析的说法中错误的是( )
A.回归直线一定过样本中心
B.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适
C.甲、乙两个模型的分别约为和,则模型乙的拟合效果更好
D.两个模型中残差平方和越小的模型拟合的效果越好
【答案】C
【解析】对于A选项,回归直线一定过样本中心,A选项正确;
对于B选项,残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,B选项正确;
对于C选项,甲、乙两个模型的分别约为和,则模型甲的拟合效果更好,C选项错误;
对于D选项,两个模型中残差平方和越小的模型拟合的效果越好,D选项正确.
故选:C.
3.(2021·云南高二期末)某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数与当天气温的回归方程.下列选项正确的是( )
A.与线性正相关 B.与线性负相关
C.随增大而增大 D.随减小而减小
【答案】B
【解析】由回归方程,可得:与线性负相关,且随增大而减小.
故选:B
4.(2021·安徽阜阳市)如图,根据已知的散点图,得到y关于x的线性回归方程为,则( )
A.1.5 B.1.8 C.2 D.1.6
【答案】D
【解析】因为,所以,解得.故选:D.
5.(2020·全国高二课时练习)两个变量与的回归模型中,分别选择了四个不同的模型来拟合与之间的关系,它们的相关系数如下,其中拟合效果最好的模型是( )
模型 | 1 | 2 | 3 | 4 |
0.98 | 0.80 | 0.50 | 0.25 |
A.模型1 B.模型2 C.模型3 D.模型4
【答案】A
【解析】两个变量与的回归模型中,它们的相关系数越接近于1,这个模型的拟合效果越好,在所给的四个相关系数中0.98的绝对值最接近1,所以拟合效果最好的模型是模型1.
故选:A.
6.(2020·全国高二课时练习)2019年10月18日至27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.
| 男性运动员 | 女性运动员 |
对主办方表示满意 | 200 | 220 |
对主办方表示不满意 | 50 | 30 |
则正确说法的个数为( )
A.0 B.1 C.2 D.3
【答案】B
【解析】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为,故①错误;
,故②错误,③正确.
故选:B.
7.(2020·河南新乡市·高三一模(文))年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
| ||
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价与月份代码呈正相关关系
B.根据可以预测年月在售二手房均价约为万元/平方米
C.曲线与的图形经过点
D.回归曲线的拟合效果好于的拟合效果
【答案】C
【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正相关关系,故A正确;
对于B,令,由,
所以可以预测年月在售二手房均价约为万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过,故C错误;
对于D,越大,拟合效果越好,故D正确.
故选:C.
8.(2020·全国)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),下左图为选取的15名志愿者身高与臂展的折线图,下右图为身高与臂展所对应的散点图,并求得其回归方程为,以下结论中正确的为( )
A.15名志愿者身高的极差大于臂展的极差 B.身高相差10厘米的两人臂展都相差11.6厘米
C.身高为190厘米的人臂展一定为189.65厘米 D.15名志愿者身高和臂展成正相关关系
【答案】D
【解析】对于A,身高极差大约是25,臂展极差大于等于30,故A不正确;
对于B,身高相差10厘米的两人展臂的估计值相差11.6厘米,但不是准确值,回归方程上的点并不都是准确的样本点,故B不正确;
对于C,身高为190厘米,代入回归方程可得展臂等于189.65厘米,但不是准确值,故错误;
对于D,很明显根据散点图以及回归方程得到,身高矮展臂就会短一些,身高高一些,展臂就会长一些,故D正确.
故选:D.
二、多选题(每题有多个选项为正确答案,每题5分,4题共20分)
9.(2021·江苏高二月考)关于变量x,y的n个样本点及其线性回归方程.下列说法正确的有( )
A.相关系数r的绝对值|r|越接近0,表示x,y的线性相关程度越强
B.相关指数的值越接近1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若,则点一定在线性回归方程上
【答案】BD
【解析】根据线性相关系数的意义可知,当的绝对值越接近于0时,
两个随机变量线性相关性越弱,则A错误;
用相关指数来刻画回归效果,
越大,说明模型的拟合效果越好,则B正确;
拟合效果的好坏是由残差平方和来体现的,
残差平方和越大,拟合效果越差,则C错误;
样本中心点一定在回归直线上,则D正确.
故选:BD.
10.(2021·河北张家口市)两个相关变量,的5组对应数据如下:
8.3 | 8.6 | 9.9 | 11.1 | 12.1 | |
5.9 | 7.8 | 8.1 | 8.4 | 9.8 |
根据上表,可得回归直线方程,求得.据此估计,以下结论正确的是( )
A. B. C. D.当时,
【答案】AC
【解析】易求得,,∴.
.
故选:AC.
11.(2020·全国高二单元测试)下列有关样本线性相关系数r的说法,正确的是( )
A.相关系数r可用来衡量x与y之间的线性相关程度
B.|r|≤1,且|r|越接近0,相关程度越小
C.|r|≤1,且|r|越接近1,相关程度越大
D.|r|≤1,且|r|越接近1,相关程度越小
【答案】ABC
【解析】相关系数是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,
故选:ABC.
12.(2021·江苏常州市)年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
| ||
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是( )
A.当月在售二手房均价与月份代码呈负相关关系
B.由预测年月在售二手房均价约为万元/平方米
C.曲线与都经过点
D.模型回归曲线的拟合效果比模型的好
【答案】BD
【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;
对于B,令,由,
所以可以预测2021年2月在售二手房均价约为1.05091.0509万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过 ,故C错误;
对于D,越大,拟合效果越好,由,故D正确.
故选:BD
三、填空题(每5分,4题共20分,双空题第一空2分,第二空3分)
13.(2020·全国高二专题)某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为________.
【答案】84%
【解析】因为y与x具有线性相关关系,满足回归方程,该城市居民人均工资为,所以可以估计该城市的职工人均消费水平,所以可以估计该城市人均消费额占人均工资收入的百分比为84%.
故答案为:84%
14.(2020·全国)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)
①若的观测值为,在犯错误的概率不超过的前提下认为吸烟与患肺癌有关系,那么在个吸烟的人中必有人患有肺癌;
②由独立性检验可知,在犯错误的概率不超过的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有的可能患有肺癌;
③若从统计量中求出在犯错误的概率不超过的前提下认为吸烟与患肺癌有关系,是指有的可能性使得判断出现错误
【答案】③
【解析】若从统计量中求出在犯错误的概率不超过的前提下认为吸烟与患肺癌有关系,是指有的可能性使得判断出现错误,故③正确.
故答案为:③.
15.(2020·全国)2020年4月份,华为举行中国区春季新品发布会,华为消费者业务余承东正式发布系列手机.现调查得到该系列手机上市时间和市场占有率(单位:的几组相关对应数据,绘制如图所示的折线图,图中的,2,3,4,5,,分别代表2020年的4月份,5月份,6月份,7月份,8月份,.据此数据得出关于的回归方程为,用此方程预测该系列手机市场占有率的变化趋势,要使该系列手机的市场占有率超过,最早应在2021年的__月份.
【答案】4
【解析】,,
样本中心点为,
将其代入,得,解得,
,
当时,有,解得,
应取,对应的年份为2021年4月份.
故答案为:4.
16.(2020·西安市长安区第五中学)面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:,,,,,,则销量每增加1千箱,单位成本下降________元.
【答案】1.8182
【解析】由已知可得,,销量每增加1千箱,则单位成本下降1.8182元.
故答案为:1.8182
四、解答题(17题10分,其余每题12分,共70分)
17.(2021·河南)为激活国内消费市场,挽回疫情造成的损失,国家出台一系列的促进国内消费的优惠政策,某机构从某一电商的线上交易大数据中来跟踪调查消费者的购买力,界定3至8月份购买商品在5000元以上人群属“购买力强人群”,购买商品在5000元以下人群属“购买力弱人群”.现从电商平台消费人群中随机选出200人,发现这200人中属购买力强的人数占80%,并将这200人按年龄分组,记第1组,第2组,第3组,第4组,第5组,得到频率分布直方图,如图.
(1)求出频率分布直方图中的值和这200人的平均年龄;
(2)从第1,2组中用分层抽样的方法抽取5人,并再从这5人中随机抽取2人进行电话回访,求这两人恰好属于不同组别的概率;
(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中“购买力弱人群”的中老年人有20人,问是否有99%的把握认为是否属“购买力强人群”与年龄有关?
附:
0.150 | 0.100 | 0.050 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
,
【答案】(1),41.5;(2);(3)没有.
【解析】(1)由题意得:,
所以,
200人的平均年龄为:.
(2)由题意得:利用分层抽样的方法从第一组抽取2人,从第二组抽取3人,
记从第一组抽取的2人为,,从第二组抽取的3人为,,
则从这5人中随机抽取2人的基本事件有,即10种,
其中两人恰好属于不同组别的基本事件有种,即6种,
故所求的概率.
(3)由题意可得列联表为:
| 购买力强人群 | 购买力弱人群 | 合计 |
青少年组 | 100 | 20 | 120 |
中老年组 | 60 | 20 | 80 |
合计 | 160 | 40 | 200 |
故的观测值,
故没有99%的把握认为是否属“购买力强人群”与年龄有关.
18.(2021·广东清远市·高二期末)某企业投资两个新型项目,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的散点图如图所示.
(1)求关于的线性回归方程;
(2)根据(1)中的回归方程,若,两个项目都投资60万元,试预测哪个项目的收益更好.
附:回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1);(2)项目的收益更好.
【解析】(1)由散点图可知,取时,的值分别为,
所以,,
,
则,
故关于的线性回归方程为.
(2)因为投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,
所以若项目投资60万元,则该企业所得纯利润的估计值为万元;
因为关于的线性回归方程为,
所以若项目投资60万元,则该企业所得纯利润的估计值为万元.
因为,所以可预测项目的收益更好.
19.(2021·河南驻马店市)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由),并求出关于的回归方程;
(2)已知每辆单车的购入成本为元,年调度费以及维修等的使用成本为每人次元,按用户每使用一次,收费元计算,若投入辆单车,则几年后可实现盈利?
参考数据:
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)适宜,;(2)6年.
【解析】(1)由散点图判断,适宜作为投放量与年使用人次的回归方程类型.
由,两边同时取常用对数得.
设,则.
因为,,,,
所以.
把代入,得,
所以,所以,
则,
故关于的回归方程为.
(2)投入千辆单车,则年使用人次为千人次,
每年的收益为(千元),
总投资千元,
假设需要年开始盈利,则,即,
故需要年才能开始盈利.
20.(2021·江苏泰州市)2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A”、“B”、“C”三个等级,A、B等级都是合格品,C等级是次品,统计结果如下表所示:
等级 | A | B | C |
频数 | 20 | 120 | 60 |
(表一)
厂家 | 合格品 | 次品 | 合计 |
甲 | 75 |
|
|
乙 |
| 35 |
|
合计 |
|
|
|
(表二)
在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.
(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?
(2)每件玩具的生产成本为30元,A、B等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.
附:,其中.
0.50 | 0.40 | 0.25 | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
0.455 | 0.708 | 1.323 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
【答案】(1)列联表答案见解析,没有95%的把握认为产品的合格率与厂家有关;(2)甲厂能盈利,乙不能盈利,理由见解析.
【解析】(1)2×2列联表如下
厂家 | 合格品 | 次品 | 合计 |
甲 | 75 | 25 | 100 |
乙 | 65 | 35 | 100 |
合计 | 140 | 60 | 200 |
,
没有95%的把握认为产品的合格率与厂家有关.
(2)甲厂10件A等级,65件B等级,25件次品,
对于甲厂,单件产品利润X的可能取值为30,10,.
X的分布列如下:
X | 30 | 10 | |
P |
,
甲厂能盈利,
对于乙厂有10件A等级,55件B等级,35件次品,
对于乙厂,单位产品利润Y的可能取值为30,10,,
Y分布列如下:
Y | 30 | 10 | |
P |
,乙不能盈利.
21.(2020·长沙市·湖南师大附中高二期中)近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(BodyMassIndex,缩写)来衡量人体胖瘦程度以及是否健康,其计算公式是.中国成人的数值标准为:为偏瘦;为正常;为偏胖;为肥胖.为了解某公司员工的身体质量指数,研究人员从公司员工体检数据中,抽取了8名员工(编号1~8)的身高和体重数据,并计算得到他们的值(精确到0.1)如表:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高 | 164 | 176 | 165 |
|
|
| 168 | 182 |
体重 | 60 | 72 | 77 |
|
|
| 72 | 55 |
(近似值) | 22.3 | 23.2 | 28.3 | 20.3 | 23.5 | 23.7 | 25.5 | 16.6 |
(1)现从这8名员工中选取2人进行复检,求至少一人值“正常”的概率.
(2)某调查机构分析发现公司员工的身高和体重之间有较强的线性相关关系,在部分体检数据丢失之前调查员甲已进行相关的数据分析,并计算得出该组数据的线性回归方程为,且根据回归方程预估一名身高为的员工体重为.计算得到的其他数据如下:,.
①求的值及表格中体重的平均值;
②在数据处理时,调查员乙发现编号为8的员工体重数据有误,应为增加为,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为的员工的体重.
(附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计分别为:,.
【答案】(1);(2)①;;②;.
【解析】(1)由表中的数值可知,8名员工中数值为“正常”的员工有5人,
则从这8名员工中选取2人进行复检,至少一人值“正常”的概率;
(2)①根据回归方程预估一名身高为的员工体重为,
∴,得.
∵样本点的中心一定在回归直线上,∴;
②由①知更正前的数据,,
∵,
∴,
更正后的数据,,
,,
∴,
故.
当时,.
∴预估一名身高为的员工的体重为.
22.(2021·湖南长沙市·长沙一中)定向越野起源于欧洲,是一种借助地图、指南针,在一个划定的区域内,通过对地形地貌的判断.设计合理路线到达各个目标点位,最后到达终点的运动.湖南青奠定向体育发展有限公司为了推广定向活动,对学生群体进行定向越野的介绍和培训,并对初步了解了定向活动的学生是否会参加定向越野活动进行调查.随机抽取了200位中小学生进行调查,得到如下数据:准备参加定向越野的小学生有80人,不准备参加定向越野的小学生有40人,准备参加定向越野的中学生有40人.
(1)完成下列列联表,并根据列联表判断是否有97.5%的把握认为这200位参与调查的中小学生是否准备参加定向越野与中学生、小学生年龄有关.
| 准备参加定向越野 | 不准备参加定向越野 | 合计 |
小学生 |
|
|
|
中学生 |
|
|
|
合计 |
|
|
|
(2)为了储备定向后备力量,备战全国赛,提高会员定向水平,俱乐部将小学生会员分组进行比赛.两人一组,每周进行一轮比赛,每小组两人每人跑两张地图(跑一张地图视为一次),达到教练设定的成绩标准的次数之和不少于3次称为“优秀小组”.小超与小红同一小组,小超、小红达到教练设定的成绩标准的概率分别为,,且,理论上至少要进行多少轮比赛,才能使得小超、小红小组在比赛中获得“优秀小组”次数的期望值达到16次?并求此时,的值.
附:,.
0.50 | 0.25 | 0.05 | 0.025 | 0.010 | |
0.455 | 1.323 | 3.840 | 5.024 | 6.635 |
【答案】(1)列联表答案见解析,有97.5%的把握认为这200位参与调查者是否准备参加定向越野与年龄有关;(2)理论上至少要进行27轮游戏,,.
【解析】(1)由题意得2×2列联表如下:
| 准备参加定向越野 | 不准备参加定向越野 | 合计 |
小学生 | 80 | 40 | 120 |
中学生 | 40 | 40 | 80 |
合计 | 120 | 80 | 200 |
因为,
所以有97.5%的把握认为这200位参与调查者是否准备参加定向越野与年龄有关.
(2)他们在一轮游戏中获“优秀小组”的概率为
∵,所以.
∵,,∴,
又,∴,
∴可看成关于的二次函数,
当时,,
当或时,.
∴,
令,∴,∴,
当时,,他们小组在轮游戏中获“优秀小组”次数满足,
由,则,
所以理论上至少要进行27轮游戏.
此时,,.
人教版高中数学选择性必修第三册第六章 计数原理 章末单元测试(含解析): 这是一份人教版高中数学选择性必修第三册第六章 计数原理 章末单元测试(含解析),共16页。试卷主要包含了多选题,填空题,解答题等内容,欢迎下载使用。
人教版高中数学选择性必修第三册第八章成对数据的统计分析 章末单元测试(含解析): 这是一份人教版高中数学选择性必修第三册第八章成对数据的统计分析 章末单元测试(含解析),共32页。试卷主要包含了多选题,填空题,解答题等内容,欢迎下载使用。
高中数学选择性必修三 章末检测试卷三(第八章): 这是一份高中数学选择性必修三 章末检测试卷三(第八章),共13页。