2023年高考指导数学(人教A文一轮)单元质检卷十 算法初步、统计与统计案例
展开单元质检卷十 算法初步、统计与统计案例
(时间:60分钟 满分:80分)
一、选择题:本题共6小题,每小题5分,共30分.在每小题给出的四个选项中,只有一项符合题目要求.
1.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是( )
A.112 B.53 C.38 D.9
2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
3.下列说法错误的是( )
A.相关系数r的绝对值越接近1,两个变量的线性相关性越强
B.在回归分析中,残差平方和越大,模型的拟合效果越好
C.相关指数R2=0.64,表示解释变量对于预报变量变化的贡献率为64%
D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
4.某产品生产厂家的市场部在对4家商场进行调研时,获得该产品的售价x(单位:元)和销售量y(单位:百个)之间的四组数据如表:
售价x/元 | 4 | a | 5.5 | 6 |
销售量y/百个 | 12 | 11 | 10 | 9 |
用最小二乘法求得销售量y与售价x之间的线性回归方程=-1.4x+17.5,那么表中实数a的值为( )
A.4 B.4.7 C.4.6 D.4.5
5.运行如图所示的算法框图,当输出的y值为4时,输入的x的值为( )
A.3 B.-1或3 C.2或3 D.-1或2或3
6.某公司计划招聘一批新员工,现有100名应届毕业生应聘,通过考试成绩择优录取,这100人考试成绩的频率分布直方图如图所示.若该公司计划招聘60名新员工,则估计新员工的最低录取成绩为( )
A.75分 B.78分 C.80分 D.85分
二、填空题:本题共3小题,每小题5分,共15分.
7.某公司对一批产品的质量进行检测,现采用系统抽样的方法从100件产品中抽取5件进行检测,对这100件产品随机编号后分成5组,第一组1~20号,第二组21~40号……第五组81~100号,若在第二组中抽取的编号为24,则在第四组中抽取的编号为 .
8.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
9.执行如图所示的程序框图,则输出S的值为 .
三、解答题:共35分.解答应写出文字说明、证明过程或演算步骤.
10.(11分)为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3∶1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.
年龄段 | 电子阅读 | 纸质阅读 | 合计 |
青少年 |
|
|
|
中老年 |
|
|
|
合计 |
|
|
|
(1)求a的值及通过电子阅读的居民的平均年龄(同一组中数据用该组区间中点值作代表);
(2)把年龄在[15,45)的居民称为青少年组,年龄在第[45,65]组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成上面2×2列联表,问是否有97.5%的把握认为阅读方式与年龄有关?
K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
11.(12分)某生物研究小组准备探究某种蜻蜓的翼长分布规律,随机捕捉20只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶图和一部分频率分布直方图,其中茎叶图中有一处数字看不清(用a表示),但已知茎叶图中每一行的数据都按照从小到大的顺序排列且无相同数据,频率分布直方图每个分组含左端点不含右端点.
(1)求a的值;
(2)根据茎叶图将频率分布直方图补充完整;
(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以更准确地反映蜻蜓翼长的总体情况.
12.(12分)文旅部门统计了某景点在2022年3月至7月的旅游收入y(单位:万元),得到以下数据:
月份x | 3 | 4 | 5 | 6 | 7 |
旅游收入y | 10 | 12 | 11 | 12 | 20 |
(1)根据表中所给数据,用相关系数r判断,是否可用线性回归模型拟合y与x的关系(若|r|∈[0.75,1],则线性相关程度很强,可用线性回归模型拟合)?如果可以,求出y关于x的线性回归方程;如果不可以,请说明理由.
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的2×2列联表,能否在犯错误的概率不超过0.001的前提下认为“游客是否喜欢该景点与性别有关联”.
性别 | 喜欢 | 不喜欢 | 总计 |
男 |
|
| 100 |
女 |
| 60 |
|
总计 | 110 |
|
|
参考公式:相关系数r=,参考数据:≈3.162.线性回归方程:x+,其中,K2=.
临界值表:
P(K2≥k0) | 0.010 | 0.005 | 0.001 |
k0 | 6.635 | 7.879 | 10.828 |
参考答案
单元质检卷十 算法初步、
统计与统计案例
1.A 解析 由题意得组距为=15,设第一组抽取编号为k,则第n组抽取的编号为15(n-1)+k,
样本中含有编号67的商品,即15×(5-1)+k=67,可得k=7,
因为15×7+7=112,即第8组中抽取商品的编号为112.故选A.
2.A 解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.
∵加入一个新数据4,∴=4.
又这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2=<2.故选A.
3.B 解析相关系数r的绝对值越接近1,两个变量的线性相关性越强,故A正确;在回归分析中,残差平方和越小,模型的拟合效果越好,故B错误;相关指数R2=0.64,表示解释变量对于预报变量变化的贡献率为64%,故C正确;在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,故D正确.故选B.
4.D 解析 由表中数据可知,×(4+a+5.5+6)=×(12+11+10+9)=10.5,
∵线性回归方程=-1.4x+17.5恒过样本中心点(),
∴10.5=-1.4×+17.5,解得a=4.5.故选D.
5.A 解析由程序框图可知y=所以当y=4时,x=3,故选A.
6.A 解析因为(0.01+0.03)×10=0.4<0.6,(0.01+0.03+0.04)×10=0.8>0.6,故录取成绩在[70,80)内,设最低录取成绩为x分,则(80-x)×0.04=0.2,解得x=75.故选A.
7.64 解析 设在第一组中抽取的号码为a1,则在各组中抽取的号码构成首项为a1,公差为20的等差数列,即an=a1+(n-1)×20,又在第二组中抽取的号码为24,即a1+20=24,所以a1=4,所以在第四组中抽取的号码为4+(4-1)×20=64.
8.0.98 解析 由题意,得经停该高铁站的列车的正点数约为10×0.97+20×0.98+10×0.99=39.2,总车次数为10+20+10=40,所以经停该站高铁列车所有车次的平均正点率的估计值为=0.98.
9.169 解析根据程序框图,S=1,i=1<6,执行第1次循环:i=1+2=3,S=1+23=9;
3<6,执行第2次循环:i=3+2=5,S=9+25=41;
5<6,执行第3次循环:i=5+2=7,S=41+27=169;
7>6,结束循环,输出S=169.
10.解 (1)由频率分布直方图可得,10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,故通过电子阅读的居民的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5.
(2)由题意200人中通过电子阅读与纸质阅读的人数之比为3∶1,可得纸质阅读的人数为200×=50,其中中老年有30人,则纸质阅读的青少年有20人.电子阅读的总人数为150,其中青少年人数为150×(0.1+0.15+0.35)=90,则中老年有60人.得2×2列联表,
年龄段 | 电子阅读 | 纸质阅读 | 总计 |
青少年 | 90 | 20 | 110 |
中老年 | 60 | 30 | 90 |
总计 | 150 | 50 | 200 |
经计算k=≈6.061>5.024,所以有97.5%的把握认为阅读方式与年龄有关.
11.解 (1)[40,45)区间对应的个体个数为0.03×5×20=3,对应的三个数据分别为41,42,43,因此a必须要大于4且小于6,从而a=5.
(2)区间[35,40),[45,50),[50,55),[55,60),[60,65)对应的纵坐标分别为=0.03,=0.04,=0.05,=0.03,=0.02.
所以频率分布直方图如下:
(3)根据茎叶图,中位数为=49.5.
在频率分布直方图中,区间[35,50)的频率为(0.03+0.03+0.04)×5=0.5,因此中位数为50.
利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据的分组对数字特征的估计结果也有影响;茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况.
12.解(1)由已知得=5,=13,(xi-)2=10,(yi-)2=64,(xi-)(yi-)=20,
∴r=≈0.79,因为|r|≈0.79∈[0.75,1],
说明y与x的线性相关关系很强,可用线性回归模型拟合y与x的关系,
∴=2,=13-10=3,
则y关于x的线性回归方程为=2x+3.
(2)2×2列联表如下所示:
性别 | 喜欢 | 不喜欢 | 总计 |
男 | 70 | 30 | 100 |
女 | 40 | 60 | 100 |
总计 | 110 | 90 | 200 |
根据列联表中数据,k=≈18.182>10.828,
因此,在犯错误的概率不超过0.001的前提下认为游客是否喜欢该网红景点与性别有关联.
2023年高考数学一轮复习单元质检卷十算法初步统计与统计案例含解析北师大版文: 这是一份2023年高考数学一轮复习单元质检卷十算法初步统计与统计案例含解析北师大版文,共9页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版理: 这是一份高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版理,共10页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版文: 这是一份高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版文,共9页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。