高考数学一轮复习:9统计与概率-跟踪训练7(题型归纳与重难专题突破提升)
展开
这是一份高考数学一轮复习:9统计与概率-跟踪训练7(题型归纳与重难专题突破提升),文件包含跟踪训练07成对数据的统计分析原卷版docx、跟踪训练07成对数据的统计分析解析版docx等2份试卷配套教学资源,其中试卷共32页, 欢迎下载使用。
1.一组成对数据,,,,,,,,样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使 最小.
A.总偏差平方和
B.残差平方和
C.回归平方和
D.竖直距离和
【解答】解:一组成对数据,,,,,,,,,
由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使残差平方和最小.
故选:.
2.2003年春季,我国部分地区流行,党和政府采取果断措施,防治结合,很快使病情得到控制,下表是某同学记载的5月1日至5月12日每天北京市治愈者数据,以及根据这些数据绘制出的散点图
下列说法:
①根据此散点图,可以判断日期与人数具有线性相关关系;
②根据此散点图,可以判断日期与人数具有一次函数关系.
其中正确的个数为
A.0个B.1个C.2个D.以上都不对
【解答】解:根据数据,作出散点图,由散点图可知,日期与人数具有线性相关关系,
所以①正确,②错误.
故选:.
3.下列四个命题中,正确命题的个数为
①甲乙两组数据分别为:甲:28,31,39,42,45,55,57,58,66;;乙:,29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.
②相关系数,表明两个变量的相关性较弱.
③若由一个列联表中的数据计算得的观测值,那么有的把握认为两个变量有关.
④用最小二乘法求出一组数据,,,,的回归直线方程后要进行残差分析,相应于数据,,,,的残差是指.
A.1B.2C.3D.4
【解答】解:对于①,甲组数据的中位数为45,乙组数据的中位数为,①错误;
对于②,相关系数时,两个变量有很强的相关性,②错误;
对于③,的观测值约为,那么有的把握认为两个变量有关,③正确;
对于④,残差分析中,相应数据,,,2,,的残差,④正确;
所以命题正确的序号是③④.
故选:.
4.下列命题错误的是
A.在回归分析模型中,残差平方和越大,说明模型的拟合效果越好
B.线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱
C.由变量和的数据得到其回归直线方程,则一定经过,
D.在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位.
【解答】解:比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好,故错误;
线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱,正确;
回归直线方程,则一定经过,,正确;
在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位,正确.
故选:.
5.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:
由表格可得关于的二次回归方程为,则此回归模型第2周的残差(实际值与预报值之差)为
A.5B.4C.1D.0
【解答】解:设,则,,
,所以,
令,得.
故选:.
6.已知一组样本点,其中,2,3,,30,根据最小二乘法求得的回归直线方程是,则下列说法正确的是
A.若所有样本点都在回归直线上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线上
C.变量,之间的线性相关程度越强,其相关系数越接近1
D.若的斜率,则变量与正相关
【解答】解:选项,若所有样本点都在回归直线上,则变量间的相关系数的绝对值为1,相关系数,故错误;
选项,回归直线必过样本点的中心,但样本点可能都不在回归直线上,故错误;
选项,随机变量之间的线性相关程度越强,越接近1,故错误;
选项,相关系数与符号相同,若的斜率,则,样本点的分布从左至右上升,变量与正相关,故正确.
故选:.
7.下列说法正确的是
A.线性回归模型是一次函数
B.在线性回归模型中,因变量是由自变量唯一确定的
C.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适
D.用来刻画回归方程,越小,拟合的效果越好
【解答】解:线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一,分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.不正确,
根据线性回归方程做出的的值是一个预报值,不是由唯一确定,故不正确;
残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故正确;
用相关指数可以刻画回归的效果,的值越大说明模型的拟合效果越好,故不正确.
故选:.
8.在研究某种线性相关问题时获得5组数据,为解释变量,为预报变量),并根据这五组数据得到线性回归方程,如果已知前四组数据依次为,,,,,第五组数据不慎丢失,但知道该组数据为,则的值为
A.47B.48C.49D.50
【解答】解:,,
因为回归直线方程过样本中心点,又回归直线方程:,
所以,所以.
所以该组数据为,
故选:.
9.若直线的回归方程为,当变量增加一个单位时,则下列说法中正确的是
A.变量平均增加2个单位B.变量平均增加1个单位
C.变量平均减少2个单位D.变量平均减少1个单位
【解答】解:根据题意,直线的回归方程为,其中斜率估计值为,
当变量增加一个单位时,变量平均减少2个单位;
故选:.
10.设成年儿子身高(单位:英寸)与父亲身高(单位:英寸)具有线性相关关系,根据一组样本数据,,2,,,用最小二乘法求得的回归直线方程,则下列结论中不正确的是
A.与正相关
B.若,,则回归直线过点,
C.若父亲身高增加1英寸,则儿子身高约增加33.73英寸
D.若父亲身高增加1英寸,则儿子身高增加量必为33.73英寸
【解答】解:回归直线方程中,,
与正相关,故正确;
回归直线必过点,,故正确;
回归直线方程表示一种不确定的关系,
即若父亲身高增加1英寸,则儿子身高约增加33.73英寸,
故正确,错误;
故选:.
11.已知和之间的一组数据;
则与的线性回归方程必过点
A.B.,C.D.,
【解答】解:,,
则线性回归方程必过点.
故选:.
12.某老师为了了解数学学习成绩得分(单位:分)与每天数学学习时间(单位:分钟)是否存在线性关系,搜集了100组数据,并据此求得关于的线性回归方程为.若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为
A.106B.122C.136D.140
【解答】解:,
则,,
关于的线性回归方程为,
则,解得,
故,
当时,.
故选:.
13.某工厂为研究某种产品的产量(吨与所需某种原材料的质量(吨的相关性,在生产过程中收集5组对应数据,如表所示.(残差观测值预测值)
根据表中数据,得出关于的经验回归方程为.据此计算出在样本处的残差为,则表中的值为
A.1.5B.1.2C.D.
【解答】解:在样本处的残差为,
,解得,
经验回归方程为,
,,
则,解得.
故选:.
14.某小型服装厂生产一种风衣,日销售量(件与单价(元之间的关系为,生产件所需成本为(元,其中元,若要求每天获利不少于1300元,则日销量的取值范围是
A.B.C.D.
【解答】解:设该厂每天获得的利润为元,则.
由题意,知,
解得:,
所以日销量在20至45件(包括20和之间时,每天获得的利润不少于1300元.
故选:.
15.2019年底,武汉出现新型冠状病毒肺炎疫情,并快速席卷我国其他地区,口罩成了重要的防疫物资.某口罩生产厂不断加大投入,提高产量.现对其在2020年2月1日月9日连续9天的日生产量(单位:十万只,,2,,数据做了初步处理,得到如图所示的散点图.那么不可能作为关于的回归方程类型的是
A.B.C.D.
【解答】解:由导数的几何意义可知,函数的导数表示该点处切线的斜率,
对于,,则,若函数为增函数,则,随着的增大,减小,故满足条件;
对于,,则,若函数为增函数,则,随着的增大,减小,故满足条件;
对于,,则,若函数为增函数,则,随着的增大,减小,故满足条件;
对于,,则,若函数为增函数,则,随着的增大,增大,不满足条件.
故选:.
二.多选题(共5小题)
16.总和生育率有时也简称生育率,是指一个人口群体的各年龄别妇女生育率的总和.为了了解中国人均(单位:万元)和总和生育率以及女性平均受教育年限(单位:年)的关系,采用近十年来的数据,,,2,,绘制了散点图,并得到回归方程,,对
应的相关系数分别为,,则
A.人均和女性平均受教育年限正相关
B.女性平均受教育年限和总和生育率负相关
C.
D.未来三年总和生育率将继续降低
【解答】解:由回归方程可知,人均和女性平均受教育年限正相关,故正确;
因为,所以女性平均受教育年限和总和生育率的关系式为,
所以女性平均受教育年限和总和生育率负相关,故正确;
由散点图可知,回归方程相对拟合效果更好,所以,故错误;
根据回归方程预测,未来总和生育率预测值有可能降低,但实际值不一定会降低,故错误.
故选:.
17.下列说法正确的有
A.经验回归方程中,若线性相关系数越大,则两个变量的线性相关性越强
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
D.某校共有男女学生1500人,现按性别采用分层抽样的方法抽取容量为100人的样本,若样本中男生有55人,则该校女生人数是675
【解答】解:对于,相关系数,且越接近于1,相关程度越大,反之两个变量的线性相关性越弱,
当时,线性相关系数越大,则越小,线性相关性越弱,故选项错误;
对于,数据1,3,4,5,7,9,11,16是从小到大排列的,由,
则第75百分位数为第6项数据与第7项数据的平均数,故选项正确;
对于,因为,
所以有的把握可判断分类变量与有关联,
此推断犯错误的概率不大于0.05,故选项正确;
对于,设该校女生人数是,则由分层抽样的比例分配方式,
得,解得,故选项正确.
故选:.
18.近年来,随着人工智能技术的不断发展,各种应用也不断普及,就是一款具有人类沟通能力的智能工具.随着人工智能的加入,各类传媒、影视、游戏行业迎来了高速的发展,技术降低了这些行业的人力成本,提高了效率.如图是某公司近年来在人力成本上的投入资金变化情况的散点图,其中为年份代号(第1年第7年),(单位:万元)为人力成本的投入资金,小明选用2个模型来拟合,模型一:,已知,其中决定系数,模型二:,其中决定系数
则下列说法正确的有
A.
B.模型一中解释变量增加1个单位,响应变量则大致减少5个单位
C.模型一中第7年的残差为5
D.模型一的拟合效果更好
【解答】解:,.
样本点的中心的坐标为,代入,得,故正确;
模型一中解释变量增加1个单位,响应变量则大致减少5个单位,故正确;
取,得,则模型一中第7年的残差为,故错误;
模型一的决定系数,模型二的决定系数,
,模型二的拟合效果更好,故错误.
故选:.
19.下列命题中,正确的命题是
A.数据4,5,6,7,8的第80百分位数为7
B.若经验回归方程为 时,则变量与负相关
C.对于随机事件,,若(A),则与相互独立
D.某学习小组调查5名男生和5名女生的成绩,其中男生成绩的平均数为9,方差为13;女生成绩的平均数为7,方差为10,则该10人成绩的方差为10.5
【解答】解:对于,由,得4,5,6,7,8的第80百分位数为,故错;
对于,若经验回归方程为 时,由,得变量与负相关,故正确;
对于,若(A),则有,
可得(A)(B),由此可知与相互独立,故正确;
对于,10人的成绩平均,
则10人的方差,故错.
故选:.
20.下列说法正确的是
A.在一组样本数据的散点图中,若所有样本点都在直线上,则这组数据的样本相关系数为1
B.若变量,的样本相关系数为0,则与不存在相关关系
C.若以模型拟合一组样本数据,设,将样本数据进行相应变换后算得回归直线的方程为,则,的估计值分别为和0.5
D.在回归分析中,相关指数的值越大,说明模型拟合的效果越好
【解答】解:在一组样本数据的散点图中,若所有样本点都在直线上,则这组数据完全相关,样本相关系数为1,故正确;
当变量,的样本相关系数为0,则与不存在线性相关关系,但未必不存在其它类型的相关关系,故错误;
两边取对数得,,,故,,故正确;
在回归分析中,决定系数的值越大,模型解释因变量的能力越强,即模型拟合的效果越好,故正确.
故选:.
三.填空题(共5小题)
21.某人的年龄与脂肪含量百分比的统计数据如表
根据上表可得回归方程中的为0.62,据此模型预测此人60岁时的脂肪含量百分比为 36.5 .
【解答】解:由题意可得:,
则:,
回归方程为:,
据此预测:此人60岁时的脂肪含量百分比为.
故答案为:36.5.
22.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:
由上表数据可知,与的相关系数为 0.99 .
(精确到0.01,参考公式和数据:,,,
【解答】解:由题意,知,
,
.
所以.
所以与的相关系数近似为0.99.
故答案为:0.99.
23.若线性回归方程为,则变量增加一个单位,变量平均 减少 3.5 个单位.
【解答】解:是斜率的估计值,说明每增加一个单位,平均减少3.5个单位.
故答案为:3.5.
24.已知下列表格所示的数据的回归直线方程为多,则的值为 242 .
【解答】解:由题意,样本中心横坐标为:,
纵坐标为:.
由回归直线经过样本中心点,
所以:,
所以.
故答案为:242.
25.如表为某班5位同学身高(单位:与体重(单位的数据,
若两个量间的回归直线方程为,则的值为 .
【解答】解:由题意可得:,
回归方程过样本中心点,则:,.
故答案为:.
四.解答题(共3小题)
26.某校用随机抽样的方法调查了100名学生参加数学校外补习的情况,将所有数据整理后如下表所示,其中,为正整数.已知从样本中随机抽取1名学生,其数学成绩不低于60分的概率为0.92.
(1)求,的值;
(2)若数学成绩按是否为良好进行分类,在犯错误的概率不超过0.1的条件下,能否认为学生的数学成绩与参加校外补习有关.
参考公式:,其中.
参考数据:
其中.
【解答】解:(1)由已知得
解得,.
(2)由已知及(1)的结论得列联表如下:
,
所以在犯错误的概率不超过0.1的条件下,不能认为学生的数学成绩与参加校外补习有关.
27.一企业生产某种产品,通过加大技术创新投入降低了每件产品成本,为了调查年技术创新投入(单位:千万元)对每件产品成本(单位:元)的影响,对近10年的年技术创新投入,和每件产品成本,2,3,,的数据进行分析,得到如图散点图,并计算得:,,,,.
(1)根据散点图可知,可用函数模型拟合与的关系,试建立关于的回归方程;
(2)已知该产品的年销售额(单位:千万元)与每件产品成本的关系为.该企业的年投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入出为何值时,年利润的预报值最大?(注:年利润年销售额年投入成本)
参考公式:附:对于一组数据,,,,,,,其回归直线方程的斜率和截距的最小二乘法估计公式分别为:,.
【解答】解:(1)令,则关于的线性回归方程为,
由题意可得,
,则,
所以关于的回归方程为.
(2)由可得,
年利润
,
当且仅当,即时,年利润取得最大值,此时,
所以当年技术创新投入为20千万元时,年利润的预报值取最大值.
28.2023上海蒸蒸日上迎新跑于2023年2月19日举办,该赛事设有21.6公里竞速跑、5.4公里欢乐跑两个项目.某马拉松兴趣小组为庆祝该赛事,举行一场小组内有关于马拉松知识的有奖比赛,一共有25人报名(包括20位新成员和5位老成员),其中20位新成员的得分情况如表所示(满分30分)
得分在20分以上(含20分)的成员获得奖品一份.
(1)请根据上述表格中的统计数据,将下面的列联表补充完全,并通过计算判断在20位新成员中,是否有的把握认为“获奖”与性别有关?
(2)若5名老成员的性别相同并全部获奖,且进行计算发现在所有参赛人员中,有的把握认为“获奖”与性别有关.请判断这5名老成员的性别?
附:参考公式:.
临界值表:
【解答】解:(1)依题意可得列联表如下:
由列联表中数据,计算得到,所以没有的把握认为“获奖”与性别有关.
(2)当这5名老成员中都为女成员时,
计算得,不合题意;
当5名老成员都为男成员时,
计算得,符合题意.
故这5名老成员全是男成员.
日期
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
人数
100
109
115
118
121
134
141
152
168
175
186
203
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
周数
1
2
3
4
5
治愈人数
2
17
36
93
142
0
1
2
3
1
3
5
7
3
4
5
6
7
4.0
2.5
0.5
年龄
20
30
40
50
脂肪含量
9
21
26
28
使用年限(单位:年)
1
2
3
4
5
6
7
失效费(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
2
3
4
5
6
251
254
257
262
266
身高
170
171
166
178
160
体重
75
80
70
85
65
数学成绩
不及格,
及格,
良好,
调查的学生人数
52
参加校外补习人数
15
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参加校外补习
不参加校外补习
合计
数学成绩为良好
10
30
40
数学成绩为及格或不及格
20
40
60
合计
30
70
100
得分
,
,
,
,
,
,
人数
2
3
4
6
4
1
没获奖
获奖
合计
男
4
女
7
8
合计
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
没获奖
获奖
合计
男
8
4
12
女
7
1
8
合计
15
5
20
相关试卷
这是一份高考数学一轮复习:4三角函数-跟踪训练5(题型归纳与重难专题突破提升),文件包含跟踪训练05三角函数的图象与性质原卷版docx、跟踪训练05三角函数的图象与性质解析版docx等2份试卷配套教学资源,其中试卷共24页, 欢迎下载使用。
这是一份高考数学一轮复习:4三角函数-跟踪训练4(题型归纳与重难专题突破提升),文件包含跟踪训练04简单的三角恒等变换原卷版docx、跟踪训练04简单的三角恒等变换解析版docx等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。
这是一份高考数学一轮复习:4三角函数-跟踪训练2(题型归纳与重难专题突破提升),文件包含跟踪训练02同角三角函数基本关系式及诱导公式原卷版docx、跟踪训练02同角三角函数基本关系式及诱导公式解析版docx等2份试卷配套教学资源,其中试卷共15页, 欢迎下载使用。