![备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析第1页](http://img-preview.51jiaoxi.com/3/3/15298985/0-1706410755733/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析第2页](http://img-preview.51jiaoxi.com/3/3/15298985/0-1706410755754/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析第3页](http://img-preview.51jiaoxi.com/3/3/15298985/0-1706410755773/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:备考2024届高考数学一轮复习分层练习全套
备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析
展开
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
1.在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据的残差图,则用线性回归模型拟合效果最佳的是( A )
AB
CD
解析 用残差图判断模型的拟合效果时,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.
2.[全国卷Ⅰ]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到如图所示的散点图.
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( D )
A.y=a+bxB.y=a+bx2
C.y=a+bexD.y=a+blnx
解析 由散点图可以看出,随着温度x的增加,发芽率y增加到一定程度后,变化率越来越慢,符合对数型函数的图象特征.
3.[2024江苏徐州模拟]如图,在一组样本数据A(2,2),B(4,3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉D(8,7),则下列说法正确的为( D )
A.样本相关系数r变小
B.残差平方和变大
C.决定系数R2变小
D.自变量x与因变量y的相关程度变强
解析 由散点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,且为正相关,所以样本相关系数r变大,决定系数R2变大,残差平方和变小,故选D.
4.[2024青岛市检测]已知某设备的使用年限x(年)与年维护费用y(千元)的对应数据如下表:
由所给数据分析可知:x与y之间具有线性相关关系,且y关于x的经验回归方程为y=1.05x+a,则a=( B )
解析 由题意可知x=2+4+5+6+85=5,y=3+4.5+6.5+7.5+95=6.1,则6.1=1.05×5+a,所以a=6.1-1.05×5=0.85,故选B.
5.[多选/2024九江模拟]根据最小二乘法,由一组样本点(xi,yi)(其中i=1,2,…,300)求得的经验回归方程是y=b^x+a,则下列说法正确的是( BD )
A.至少有一个样本点落在经验回归直线y=b^x+a上
B.若所有样本点都在经验回归直线y=b^x+a上,则变量间的相关系数为±1
C.对所有的解释变量xi(i=1,2,…,300),b^xi+a的值一定与yi有误差
D.若经验回归直线y=b^x+a的斜率b^>0,则变量x与y正相关
解析 经验回归直线必过样本点的中心,但样本点可能都不在经验回归直线上,故A错误;若所有样本点都在经验回归直线y=b^x+a上,则变量间的相关系数为±1,故B正确;若所有的样本点都在经验回归直线y=b^x+a上,则b^xi+a的值与yi相等,故C错误;相关系数r与b^符号相同,若经验回归直线y=b^x+a的斜率b^>0,则r>0,样本点散布在从左下角到右上角的区域,则变量x与y正相关,故D正确.故选BD.
6.[多选/2024贵州统考]某学校高三年级甲、乙两班共105人进行了一次数学测试.按照成绩大于或等于120分(满分150分)的同学评价为“优秀生”,其他分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,“优秀生”的概率为27,根据表(2)的数据,可断定下列说法正确的是( BC )
表(1)单位:人
表(2)
A.列联表中c的值为30,b的值为35
B.列联表中c的值为20,b的值为45
C.根据列联表中的数据,有95%的把握认为成绩与班级有关
D.根据列联表中的数据,没有95%的把握认为成绩与班级有关
解析 因为在这105人中随机抽取1人,“优秀生”的概率为27,所以“优秀生”的人数为105×27=30,“潜力生”的人数为105-30=75,所以c=30-10=20,b=75-30=45,故A错B对;
因为χ2=105×(10×30-20×45)230×75×50×55≈6.109>3.841,所以有95%的把握认为成绩与班级有关,故C对D错.故选BC.
7.[多选/2024云南师大附中月考]已知变量x,y之间的经验回归方程为y=10.3-0.7x,且变量x,y的数据如表所示,则下列说法正确的是( BC )
A.变量x与y正相关
B.实数m的值为5
C.该经验回归直线必过点(9,4)
D.相应于(10,3)的残差为0.3
解析 由表格数据得,x=6+8+10+124=9,y=6+m+3+24=11+m4,将点(9,11+m4)代入经验回归方程y=10.3-0.7x得,11+m4=10.3-0.7×9,解得m=5,所以选项B正确;
11+m4=4,即样本点的中心为(9,4),所以选项C正确;
当变量x增加时,变量y相应值减少,两个变量负相关,所以选项A错误;
由残差的定义知,观测值减去预测值为残差,由经验回归方程y=10.3-0.7x,令x=10,得预测值y=3.3,则相应于(10,3)的残差为3-3.3=-0.3,所以选项D错误.故选BC.
8.[2024海南月考]某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
单位:人
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为?2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为 5 %.
附:
解析 因为?2>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,认为主修统计专业与性别有关,出错的可能性最大为5%.
9.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内、国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高堆积条形图.根据等高图,依据小概率值α=0.005的独立性检验, 能 (填“能”或“不能”)认为持乐观态度和国内外差异有关.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
解析 零假设为H0:持乐观态度和国内外差异无关.由题填写2×2列联表如下,
单位:名
根据列联表得?2=200×(60×60-40×40)2100×100×100×100=8>7.879=x0.005,
所以依据小概率值α=0.005的独立性检验,我们推断H0不成立,即能认为持乐观态度和国内外差异有关.
10.[2024武汉部分学校调考]某校为考查学生对紧急避险知识的掌握情况,从全校学生中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成绩(单位:分)都在区间[50,100]内,由测试成绩数据作出如图所示的频率分布直方图.
(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中m的值;
(2)规定测试成绩不低于80分为优秀,已知共有45名男生测试成绩优秀,完成下面的列联表,并根据小概率值α=0.05的独立性检验,能否推断男生和女生的测试成绩优秀率有差异?
单位:人
参考公式与数据:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
解析 (1)由题意,第一组的频率/组距为110-m-0.04-0.025-0.01=0.025-m.
样本平均数的估计值为10×[(0.025-m)×55+m×65+0.04×75+0.025×85+0.01×95]=74.5+100m.
样本中位数的估计值为70+10×0.05-(110-0.01-0.025-0.04)0.04=76.25.
所以74.5+100m=76.25,解得m=0.017 5.
(2)零假设H0:男生和女生的测试成绩优秀率没有差异.
测试成绩优秀的总人数为200×10×(0.025+0.01)=70.
得到列联表:
单位:人
χ2=200×(45×65-25×65)2110×90×70×130=2600693≈3.75<3.841=x0.05.
所以根据小概率值α=0.05的独立性检验,不能推断男生和女生的测试成绩优秀率有差异.
11.[全国卷Ⅱ]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120xi=60,∑i=120yi=1 200,∑i=120(xi-x)2=80,∑i=120(yi-y)2=9 000,∑i=120(xi-x)·(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数).
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01).
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,2≈1.414.
解析 (1)由已知得样本平均数y=120∑i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r=∑i=120(xi-x)(yi-y)∑i=120(xi-x)2∑i=120(yi-y)2=80080×9000=223≈0.94.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:由(2)知,各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
12.[2024内江模拟]某网络直播平台调研“大学生是否喜欢观看体育比赛直播与性别有关”,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5≤m≤15,m∈N).
通过计算,有95%以上的把握认为大学生喜欢观看体育比赛直播与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为( C )
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
A.55B.57C.58D.60
解析 因为χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200[(80-m)(50-m)-(20+m)(50+m)]2100×100×130×70=8(15-m)291≥3.841,所以(15-m)2≥43.69,又5≤m≤15,m∈N,所以15-m≥7,解得m≤8,故在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为58.故选C.
13.[多选/2023长沙市适应性考试]自然环境中,大气压强受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压强发生相应的变化,其中以海拔的影响最为显著.如图是根据一组观测数据得到的海拔6 km~15 km的大气压强(单位:kPa)散点图,根据一元线性回归模型得到经验回归方程为y1=-4.0x+68.5,决定系数为R12=0.99;根据非线性回归模型得到非线性经验回归方程为y2=132.9e-0.163x,决定系数为R22=0.99,则下列说法正确的是( ACD )
A.由散点图可知,大气压强与海拔负相关
B.由方程y1=-4.0x+68.5可知,海拔每升高1 km,大气压强必定降低4.0 kPa
C.由方程y1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,方程y2=132.9e-0.163x的预报效果更好
解析 观察题中散点图,可知大气压强与海拔负相关,即A正确;通过经验回归方程y1=-4.0x+68.5,可知海拔每升高1 km,大气压强大约降低4.0 kPa,即B错误;当x=11时,代入方程y1=-4.0x+68.5计算可得预测值y1=24.5,则残差为22.6-24.5=-1.9,即C正确;随着海拔的增加,大气压强越来越小,但不可能为负数,因此,方程y2=132.9e-0.163x的预报效果更好,即D正确.故选ACD.
14.[2024庆阳检测]已知某池塘中水生植物的覆盖水塘面积x(单位:dm2)与水生植物的株数y(单位:株)的关系可以用模型y=cekx(c>0)去拟合,设z=lny,x与z的数据如表格所示:
由上表可得x与z的经验回归方程z=1.2x+a,则c= e-2 .
解析 由已知可得,x=3+4+6+74=5,z=2+2.5+4.5+74=4,所以4=1.2×5+a,解得a=2,所以z=1.2x-2,由z=lny,得lny=1.2x-2,所以y=e1.2x-2=e-2·e1.2x,则c=e-2.
15.[2024云南模拟]某新能源汽车公司从2018年到2022年汽车年销售量y(单位:万辆)的散点图如下:
记年份代码为x(x=1,2,3,4,5).
(1)根据散点图判断,模型①y=a+bx与模型②y=c+dx2,哪一个更适宜作为年销售量y关于年份代码x的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的经验回归方程.
(3)预测2024年该公司新能源汽车销售量.
参考数据:
参考公式:经验回归直线y^=a^+b^x的斜率和截距的最小二乘估计公式分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx·y∑i=1nxi2-nx2,a^=y-b^x.
解析 (1)由散点图知,模型②更适宜作为年销售量y关于年份代码x的经验回归方程.(若线性相关,则可以看出各散点大概排列在一条直线附近)
(2)设t=x2,
由已知得t=∑i=15xi25=11,y=34,
∑i=15tiyi=∑i=15xi2yi=2 805,∑i=15ti2=∑i=15xi4=979,
所以d^=∑i=15tiyi-5t·y∑i=15ti2-5t2=2805-5×11×34979-5×112=2805-1870979-605=935374=2.5,
c^=34-2.5×11=6.5,
所以y关于t的经验回归方程为y^=6.5+2.5t,
即y关于x的经验回归方程为y^=6.5+2.5x2.
(3)2024年对应的年份代码为x=7,(一定要弄清年份代码)
得y^=6.5+2.5×72=129,
所以预测2024年该公司新能源汽车销售量为129万辆.
16.[2024浙江名校联考]某科研所研究表明,绝大部分抗抑郁、抗焦虑的药物都有一个奇特的功效,就是刺激人体大脑多巴胺(Dpamine)的分泌,所以又叫“快乐药”.其实科学、合理、适量的有氧运动就会增加人体大脑多巴胺的分泌,从而缓解抑郁、焦虑的情绪.定义运动后一天内多巴胺含量超过400μg是明显有效运动,否则是不明显有效运动.树人中学为了了解学生明显有效运动是否与性别有关,对运动后的60名学生进行检测,其中女生与男生的人数之比为1∶2,女生中明显有效运动的人数占12,男生中明显有效运动的人数占34.
(1)根据所给的数据完成下表,并依据小概率值α=0.100的独立性检验,判断明显有效运动是否与性别有关,并说明理由.
单位:人
(2)若从树人中学所有学生中抽取11人,用样本的频率估计概率,则11人中不明显有效运动的人数最有可能是多少?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
参考数据:
解析 (1)对60名学生明显有效运动是否与性别有关进行检测,其中女生与男生的人数之比为1∶2,女生中明显有效运动的人数占12,男生中明显有效运动的人数占34,所以得到下面的列联表:
单位:人
零假设为H0:明显有效运动与性别没有关系.
因为χ2=60×(10×10-30×10)240×20×20×40=3.750>2.706=x0.100,
所以根据小概率值α=0.100的独立性检验,有充分的证据推断H0不成立,因此认为明显有效运动与性别有关.
(2)由样本数据可知,不明显有效运动的频率为13,用样本的频率估计概率,所以不明显有效运动的概率为13.
设11人中不明显有效运动的人数为X,则X~B(11,13),
所以P(X=k)=C11k(13)k(1-13)11-k(k=0,1,2,…,11).
假设11人中不明显有效运动的人数最有可能是k,
则C11k(13)k(1-13)11-k≥C11k+1(13)k+1(1-13)10-k,C11k(13)k(1-13)11-k≥C11k-1(13)k-1(1-13)12-k,
解得k=3或4,所以11人中不明显有效运动的人数最有可能是3或4.x
2
4
5
6
8
y
3
4.5
6.5
7.5
9
班级
成绩
合计
优秀生
潜力生
甲班
10
b
乙班
c
30
合计
105
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
x
6
8
10
12
y
6
m
3
2
性别
专业
合计
非统计专业
统计专业
男
13
10
23
女
7
20
27
合计
20
30
50
α
0.10
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
α
0.01
0.005
0.001
xα
6.635
7.879
10.828
潜在客户
态度
合计
乐观
不乐观
国内代表
60
40
100
国外代表
40
60
100
合计
100
100
200
性别
测试成绩
合计
优秀
不优秀
男生
45
女生
合计
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
性别
测试成绩
合计
优秀
不优秀
男生
45
65
110
女生
25
65
90
合计
70
130
200
喜欢观看
不喜欢观看
男生
80-m
20+m
女生
50+m
50-m
α
0.15
0.10
0.05
0.010
0.001
xα
2.072
2.706
3.841
6.635
10.828
x
3
4
6
7
z
2
2.5
4.5
7
y
∑i=15xi2
∑i=15xi4
∑i=15xiyi
∑i=15xi2yi
34
55
979
657
2 805
运动
性别
合计
女生
男生
明显有效运动
不明显有效运动
合计
α
0.150
0.100
0.050
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
运动
性别
合计
女生
男生
明显有效运动
10
30
40
不明显有效运动
10
10
20
合计
20
40
60
相关试卷
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第1讲随机抽样统计图表,共6页。试卷主要包含了16+0,81,30等内容,欢迎下载使用。
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第2讲用样本估计总体,共7页。试卷主要包含了7,D错误,5D等内容,欢迎下载使用。
这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。
![文档详情页底部广告位](http://img.51jiaoxi.com/images/3f869e97b8ba893a2f5801e8386ea128.jpg)