所属成套资源:高二数学考点知识详解+模拟测试(人教A版选择性必修第一、二、三册)
第八章 成对数据的统计分析(基础检测卷)-高二数学知识详解+模拟测试(人教A版选择性必修第三册)
展开
这是一份第八章 成对数据的统计分析(基础检测卷)-高二数学知识详解+模拟测试(人教A版选择性必修第三册),文件包含第八章成对数据的统计分析基础检测卷-高二数学知识详解+模拟测试人教A版选择性必修第三册解析版docx、第八章成对数据的统计分析基础检测卷-高二数学知识详解+模拟测试人教A版选择性必修第三册原卷版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。
第八章成对数据的统计分析基础检测卷
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.已知变量和满足关系,变量与正相关,则下列结论中正确的是( ).
A.与正相关,与负相关 B.与正相关,与正相关
C.与负相关,与负相关 D.与负相关,与正相关
【答案】C
【分析】根据可得负相关,结合正相关可得结果.
【详解】,和负相关,又和正相关,和负相关.
故选:C.
2.如图是根据的观测数据得到的散点图,可以判断变量,具有线性相关关系的图是( )
A.①② B.③④ C.②③ D.①④
【答案】B
【分析】根据变量具有线性相关关系,则散点在某条直线附近,从左下至右上或从左上至右下即可.
【详解】根据变量具有线性相关关系,则散点在某条直线附近,从左下至右上或从左上至右下,
所以③④图的变量具有线性相关关系.
故选:B
3.某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度( )
参考数据如下:,.
A.低于 B.低于 C.高于 D.高于
【答案】C
【分析】根据临界值表求得正确答案.
【详解】由于,
而,
所以可信度高于.
故选:C
4.两个具有线性相关关系的变量的一组数据,,,下列说法错误的是( )
A.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
B.相关系数越接近,变量,相关性越强
C.相关指数越小,残差平方和越大,即模型的拟合效果越差
D.若表示女大学生的身高,表示体重,则表示女大学生的身高解释了的体重变化
【答案】A
【分析】根据变量间的相关关系中:相关指数或相关系数的意义进行判定.
【详解】对于A:回归直线方程拟合效果的强弱是由相关指数或相关系数判定,故不正确;
对于B:根据相关系数越接近,变量相关性越强,故正确;
对于C:相关指数越小,残差平方和越大,效果越差,故正确;
对于D:根据的实际意义可得,表示女大学生的身高解释了的体重变化,故正确;
故选:.
5.某社区医院统计了该社区在夏季某4天患肠道感染类疾病的人数与平均气温(℃)的数据如下表,由表中数据算得线性回归方程中的,预测当平均气温为35℃时,该社区患肠道感染类疾病的人数为( )
平均气温(℃)
22
26
29
32
患肠道感染类疾病的人数
12
25
27
56
A.57 B.59 C.61 D.65
【答案】C
【分析】由已知数据计算,根据回归方程的性质求,再利用回归方程预测当平均气温为35℃时,该社区患肠道感染类疾病的人数.
【详解】由表格数据可得,,,
因为点在直线上,,
所以,
所以,
故当时,,
即预测当平均气温为35℃时,该社区患肠道感染类疾病的人数为61,
故选:C.
6.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗的预防效果,在进行动物试验时,得到如下统计数据:
未发病
发病
总计
未注射疫苗
30
注射疫苗
40
总计
70
30
100
现从试验动物中任取一只,取得“注射疫苗”的概率为0.5,则下列判断中错误的是( ).A.注射疫苗发病的动物数为10
B.某个发病的小动物为未注射疫苗动物的概率为
C.能在犯错概率不超过0.005的前提下认为疫苗有效
D.该疫苗的有效率约为80%
【答案】C
【分析】由题意,完善列联表,利用古典概型的概率计算公式以及独立性检验的卡方计算,可得答案.
【详解】由题意,“注射疫苗”与“未注射疫苗”的动物分别为50,故完善表格如下:
未发病
发病
总计
未注射疫苗
30
20
50
注射疫苗
40
10
50
总计
70
30
100
由表格可知,A正确;
某个发病的小动物为未注射疫苗动物的概率为,故B正确;
,故C错误;
注射疫苗的50个动物中,未发病的概率约为,故D正确.
故选:C.
7.下列说法中,正确的命题的是( )
A.一台晩会有6个节目,其中有2个小品,如果2个小品不连续演出,共有不同的演出顺序240种
B.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则c,k的值分别是和0.3
C.若事件与事件互斥,则事件与事件独立
D.若样本数据,,…的方差为2,则数据,,…,的方差为16
【答案】B
【分析】根据插空法即可判断选项A,由计算可判断选项B,根据互斥事件和独立事件的概念可以判断选项C,由方差的计算公式可以判断选项D.
【详解】A:先把其余4个节目排列,共有5个空,再将2个小品插入5个空,
所以共有种不同的方法,故A错误;
B:设,求得线性回归方程为,则,故的值分别是和,故B正确;
C:若事件A与事件B互斥,则事件A与事件B不独立,故C错误;
D:若样本数据的方差为2,
则数据的方差为8,故D错误.
故选:B.
8.给出以下四个命题:
①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
②回归模型中离差是实际值与估计值的差,离差点所在的带状区域宽度越窄,说明模型拟合精度越高;
③在一组样本数据(,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
④对分类变量与的统计量来说,值越小,判断“与有关系”的把握程度越大.
其中,真命题的个数为( )
A. B. C. D.
【答案】B
【分析】根据相关指数、离差图、相关系数和独立性检验的知识依次判断各个选项即可.
【详解】对于①,由相关指数的定义知:越大,模型的拟合效果越好,①正确;
对于②,离差点所在的带状区域宽度越窄,则离差平方和越小,模型拟合精度越高,②正确;
对于③,若所有样本点都在直线上,则线性相关系数,③错误;
对于④,由独立性检验的思想知:值越大,“与有关系”的把握程度越大,④错误.
故选:B.
二. 选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0
9.某校高三一名数学教师从该校高三学生中随机抽取男、女生各50名进行了身高统计,得到男、女身高分别近似服从正态分布和,并对其是否喜欢体育锻炼进行数据统计,得到如下2×2列联表:
喜欢
不喜欢
合计
男生
37
m
50
女生
n
32
50
合计
55
45
100
参考公式:
α
0.01
0.005
0.001
6.635
7.879
10.828
则下列说法正确的是( )A.,
B.男生身高的平均数约为173,女生身高的平均数约为164
C.男生身高的标准差约为11,女生身高的标准差约为9
D.依据的独立性检验,认为喜欢体育锻炼与性别有关联
【答案】ABD
【分析】A选项,根据列联表中数据分析求出,A正确;BC选项,由男、女身高分别近似服从正态分布和,得到平均数和标准差;D选项,计算出卡方,与6.635比较大小后得到结论.
【详解】对于A.因为,,算得,,故A正确:
对于B,在正态分布中,μ约为平均数,所以男生身高的平均数约为173,女生身高的平均数约为164,故B正确;
对于C,在正态分布中,为方差,为标准差,男生身高的标准差为,女生身高的标准差为3,故C不正确;
对于D,由,
依据的独立性检验,认为喜欢体育锻炼与性别有关联,故D正确.
故选:ABD.
10.关于相关系数r,下面说法正确的是( )
A.r∈【-1,1】
B.若,则两个变量线性不相关
C.若,则一个变量增加,另一个变量有减少的趋势
D.越小,变量之间的线性相关程度越高
【答案】ABC
【分析】根据相关系数的定义以及性质即可求解.
【详解】r∈【-1,1】,故A正确,若,则两个变量线性不相关,故B正确,若,则一个变量增加,另一个变量有减少的趋势,C正确,越大,变量之间的线性相关程度越高,故D错误,
故选:ABC
11.给出下列说法,其中正确的是( )
A.若数据,,…,的方差为0,则此组数据的众数唯一
B.已知一组数据2,3,5,7,8,9,9,11,则该组数据的第40百分位数为6
C.一组样本数据的频率分布直方图是单峰的且形状是对称的,则该组数据的平均数和中位数近似相等
D.经验回归直线恒过样本点的中心(),且在回归直线上的样本点越多,拟合效果一定越好
【答案】AC
【分析】依据方差定义及众数定义去判断选项A;求得第40百分位数去判断选项B;依据中位数定义和平均数定义去判断选项C;依据回归直线拟合效果判断标准去判断选项D.
【详解】对于选项A:由方差
可得,即此组数据众数唯一,A正确;
对于选项B:数据2,3,5,7,8,9,9,11.共有8个数,由可知,该组数据的第40百分位数为第4个数7,B错误;
对于选项C:依据中位数定义和平均数定义,一组样本数据的频率分布直方图是单峰的且形状是对称的,则该组数据的平均数和中位数近似相等,C正确;
对于选项D:回归直线的拟合效果看残差平方和,残差平方和越小,拟合效果越好,不是回归直线上的样本点多,拟合效果就越好,D错误.
故选:AC
12.下列说法中正确的是( )
A.一组数据7,8,8,9,11,13,15,17,20,22的第80百分位数为17
B.若随机变量,且,则.
C.袋中装有除颜色外完全相同的4个红球和2个白球,从袋中不放回的依次抽取2个球.记事件第一次抽到的是红球,事件第二次抽到的是白球,则
D.已知变量、线性相关,由样本数据算得线性回归方程是,且由样本数据算得,,则
【答案】BCD
【分析】根据第百分位数的计算公式可判断A项;根据正态分布的对称性可求解,判断B项;根据条件概率的公式求解相应概率,可判断C项;将代入回归方程,即可判断D项.
【详解】对于A,共有10个数,,所以数据的第80百分位数为17和20的平均数,即为18.5,故A错误;
对于B,因为随机变量,且,
所以,,故B正确;
对于C,由题意可知,,
所以,故C正确;
对于D,因为线性回归方程是经过样本点的中心,所以有,解得,故D正确.
故选:BCD.
三.填空题 本题共4小题,每小题5分,共20分
13.已知某车间在上半年的六个月中,每个月的销售额y(万元)与月份()满足线性回归方程,则该车间上半年的总销售额约为______万元.
【答案】198
【分析】根据线性回归方程,分别将x的值代入,结果相加,即可得答案.
【详解】由题意可得该车间上半年的总销售额约为:
(万元),
故答案为:198
14.某省采用“3+1+2”新高考模式,其中“3”为语文、数学和外语3门全国统考科目;“1”为考生在物理和历史中选择1门;“2”为考生在思想政治、地理、化学和生物4门中再选择2门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的为120人,选考历史的为80人.统计各选科人数如下表:
选择科目选考类别
思想政治
地理
化学
生物
物理类
35
50
90
65
历史类
50
45
30
35
根据上表________(填“可以”或“不可以”)确定“是否选择生物与选考类别有关”.
【答案】不可以
【分析】根据表中数据,结合卡方计算公式进行求解判断即可.
【详解】由表中数据可以确定物理类中选生物和不选生物的人数分别为65和55,
历史类中选生物和不选生物的人数分别为35和45,
所以有,
所以没有以上的把握认为择生物与选考类别有关,
故答案为:不可以
15.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,蟋蟀鸣叫的频率(单位次数/分钟)与气温(单位:)有较强的线性相关关系.某同学在当地通过观测,得到如下数据,并利用最小二乘法建立了关于的线性回归方程当蟋蟀每分钟鸣叫次时,该地当时的气温预报值为_______.
x(次数/分数)
24
36
40
60
y(℃)
26
28.6
30
35.4
【答案】
【分析】由回归直线必过样本中心求参后,代入x的值可得结果.
【详解】∵,,
又∵必过样本中心,
∴,解得:,
∴,
∴当时,
故答案为:33.
16.已知变量x和y的统计数据如下表:
x
6
7
8
9
10
y
3.5
4
5
5.5
7
如果由表中数据可得经验回归直线方程为,那么,当时,残差为______.(注:残差=观测值-预测值)
【答案】##
【分析】先求出回归方程,再根据回归方程求出预测值,最后计算残差即可.
【详解】,
所以,
所以时,,
所以残差为.
故答案为:.
四.解答题:本题共6小题,17题10分,剩下每题12分。共70分,解答应写出文字说明、证明过程或演算步骤
17.考取驾照是一个非常严格的过程,有的人并不能够一次性通过,需要补考.现在有一张某驾校学员第一次考试结果汇总表,由于保管不善,只残留了如下数据(见下表):
成绩
性别
合格
不合格
合计
男性
45
10
女性
30
合计
105
(1)完成此表;
(2)根据此表判断:是否可以认为性别与考试是否合格有关?如果可以,请问有多大把握;如果不可以,试说明理由.
参考公式:①相关性检验的临界值表:
0.40
0.25
0.15
0.10
0.05
0.025
0.10
0.708
1.323
2.072
2.706
3.841
5.024
6.635
②卡方值计算公式:.其中.
【答案】(1)答案见解析
(2)可以,有97.5%的把握
【分析】(1)直接根据题意即可完成表格;
(2)计算得出,根据独立性检验思想即可得结果.
【详解】(1)
成绩
性别
合格
不合格
合计
男性
45
10
55
女性
30
20
50
合计
75
30
105
(2)假设:性别与考试是否合格无关,.
若成立,,
∵,
∴有97.5%的把握认为性别与考试是否合格有关.
18.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
根据最小二乘法公式求得线性回归方程为.
(1)若9月份物流成本是90万元,预测9月份利润;
(2)经再次核实后发现8月份真正利润应该为116万元,重新预测9月份的利润.
附:,,,.
,.
【答案】(1)136.2万元
(2)131.2万元
【分析】(1)直接利用回归方程预测求解;
(2)根据题意,结合已知数据利用最小二乘法公式求解即可.
【详解】(1)9月份利润:万元.
(2)由已知数据可得:,
因为点在回归直线上,所以,
所以,
因为8月份的真正利润应该为116万元,
此时,
又,所以,
,
所以数据核实后的新的线性回归方程为,
令,得万元.
所以重新预测9月份的利润为万元.
19.机动车辆保险即汽车保险(简称车险),是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险.机动车辆保险一般包括交强险和商业险,商业险包括基本险和附加险两部分.经验表明新车商业险保费与购车价格有较强的线性相关关系,下面是随机采集的相关数据:
购车价格x(万元)
5
10
15
20
25
30
35
商业险保费y(元)
1737
2077
2417
2757
3097
3622
3962
(1)根据表中数据,求y关于x的线性回归方程(精确到0.01);
(2)某保险公司规定:上一年的出险次数决定了下一年的保费倍率,上一年没有出险,则下一年保费倍率为85%,上一年出险一次,则下一年保费倍率为100%,上一年出险两次,则下一年保费倍率为125%.太原王女士2022年1月购买了一辆价值32万元的新车.若该车2022年2月已出过一次险,4月又发生事故,王女士到汽车维修店询价,预计修车费用为800元,理赔人员建议王女士自费维修(即不出险),你认为王女士是否应该接受该建议?请说明理由.(假设车辆2022年与2023年都购买相同的商业险产品)
参考数据:.
参考公式:.
【答案】(1)
(2)王女士应接受理赔专员的建议;理由见解析
【分析】(1)根据公式带入数据计算出 ,即可写出回归方程
(2)根据(1)计算出32万元车辆的商业车险保费预报值,因该车已出险一次,加上本次出险,按照保费倍率为 计算保费与800比较大小即可得出结论
【详解】(1)(万元),
所以
(2)价值为32万元的车辆的商业车险保费预报值为元.
由于该车已出险一次,若再出险一次,则保费要增加25%,
即保费增加元.
因为,若出险,2023年增加的保费大于800元,
所以王女士应接受理赔专员的建议.
20.某出租车公司为推动驾驶员服务意识和服务水平大提升,对出租车驾驶员从驾驶技术和服务水平两个方面进行了考核,并从中随机抽取了100名驾驶员,这100名驾驶员的驾驶技术与性别的2×2列联表和服务水平评分的频率分布直方图如下,已知所有驾驶员的服务水平评分均在区间内.
驾驶技术
优秀
非优秀
男
25
45
女
5
25
(1)判断能否有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关;
(2)从服务水平评分在,内的驾驶员中用分层抽样的方法抽取5人,再从这5人中随机抽取3人,求这3人中恰有2人的评分在内的概率.
附:,其中.
0.10
0.050
0.010
2.706
3.841
6.635
【答案】(1)没有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关,理由见解析
(2)
【分析】(1)计算出卡方,与3.841比较后得到相应结论;
(2)先根据频率之和为1得到,从而得到评分在,内的驾驶员人数比例,及两个区间各抽取的人数,利用列举法求出概率.
【详解】(1),
没有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关;
(2),
解得:,
故服务水平评分在,内的驾驶员人数比例为,
故用分层抽样的方法抽取5人中,内有4人,设为,内有1人,设为,
再从这5人中随机抽取3人,共有以下情况:
,共10种情况,
其中这3人中恰有2人的评分在的有,6种情况,
故这3人中恰有2人的评分在内的概率为.
21.某数学兴趣小组为研究本校学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从学校抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:
语文成绩
合计
优秀
不优秀
数学成绩
优秀
50
30
80
不优秀
40
80
120
合计
90
110
200
(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?
(2)在人工智能中常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从该校学生中任选一人,表示“选到的学生语文成绩不优秀”,表示“选到的学生数学成绩不优秀”请利用样本数据,估计的值.
(3)现从数学成绩优秀的样本中,按分层抽样的方法选出8人组成一个小组,从抽取的8人里再随机抽取3人参加数学竞赛,求这3人中,语文成绩优秀的人数的概率分布列及数学期望.
附:
【答案】(1)认为数学成绩与语文成绩有关;
(2);
(3)分布列见解析,.
【分析】(1)零假设后,计算的值与比较即可;
(2)根据条件概率公式计算即可;
(3)分层抽样后运用超几何分布求解.
【详解】(1)零假设:数学成绩与语文成绩无关.
据表中数据计算得:
根据小概率值的的独立性检验,我们推断不成立,而认为数学成绩与语文成绩有关;
(2)∵,
∴估计的值为;
(3)按分层抽样,语文成绩优秀的5人,语文成绩不优秀的3人,随机变量的所有可能取值为.
,,
,,
∴的概率分布列为:
0
1
2
3
∴数学期望.
22.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.从中国信息通信研究院发布的《云计算白皮书(2022年)》可知,我国2017年至2021年云计算市场规模数据统计表如下:
年份
2017年
2018年
2019年
2020年
2021年
年份代码x
1
2
3
4
5
云计算市场规模y/亿元
692
962
1334
2091
3229
经计算得:=36.33,=112.85.
(1)根据以上数据,建立y关于x的回归方程(为自然对数的底数).
(2)云计算为企业降低生产成本、提升产品质量提供了强大助推力.某企业未引入云计算前,单件产品尺寸与标准品尺寸的误差,其中m为单件产品的成本(单位:元),且=0.6827;引入云计算后,单件产品尺寸与标准品尺寸的误差.若保持单件产品的成本不变,则将会变成多少?若保持产品质量不变(即误差的概率分布不变),则单件产品的成本将会下降多少?
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为=,.
若,则,,
【答案】(1)
(2),成本下降3元.
【分析】(1)将非线性回归模型转化为线性回归模型求解;
(2)利用真态分布的概率模型求解,并结合特殊概率值求解.
【详解】(1)因为,所以,
所以,
所以,
所以.
(2)未引入云算力辅助前,,所以,
又,所以,所以.
引入云算力辅助后,,所以,
若保持产品成本不变,则,
所以
若产品质量不变,则,所以,
所以单件产品成本可以下降元.