(山东专用)2021版高考数学一轮复习考案10第十章统计、统计案例综合过关规范限时检测(含解析)
展开[考案10]第十章 综合过关规范限时检测
(时间:120分钟 满分150分)
一、单选题(本大题共8个小题,每小题5分,共40分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.(2019·贵州黔东南州模拟)某市教体局将从甲、乙、丙、丁四人中选一人参加全省100米仰泳比赛,现将他们最近集训的10次成绩(单位:秒)的平均数与方差制成如下表格:
| 甲 | 乙 | 丙 | 丁 |
平均数 | 59 | 57 | 59 | 57 |
方差 | 12 | 12 | 10 | 10 |
根据表中的数据,应选哪位选手参加全省的比赛( D )
A.甲 B.乙
C.丙 D.丁
[解析] 100米仰泳比赛的成绩是时间越短越好的,方差越小发挥水平越稳定,故丁是最佳人选,故答案为D.
2.(2019·课标Ⅱ,5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( A )
A.中位数 B.平均数
C.方差 D.极差
[解析] 根据中位数特征可知,去掉最高分和最低分后,只有中位数一定不会变化.故选A.
3.(2020·江西省赣州市期末)下图是相关变量x、y的散点图,现对这两个变量进行线性相关分析,
方案一:根据图中所有数据,得到线性回归方程:=b1x+a1,相关系数为r1;
方案二:剔除点(10,32),根据剩下数据,得到线性回归方程:=b2x+a2,相关系数为r2;则( A )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
4.(2019·甘肃天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为甲,乙,标准差分别为σ甲,σ乙,则( C )
A.甲<乙,σ甲<σ乙 B.甲<乙,σ甲>σ乙
C.甲>乙,σ甲<σ乙 D.甲>乙,σ甲>σ乙
[解析] 由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙,图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.
5.(2019·贵州凯里一中期末)利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽的产品的最大编号为( B )
A.73 B.78
C.77 D.76
[解析] 样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.
6.(2020·河南安阳调研)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是( D )
A.甲所得分数的极差为22
B.乙所得分数的中位数为18
C.两人所得分数的众数相等
D.甲所得分数的平均数低于乙所得分数的平均数
[解析] 甲的最高分为33,最低分为11,极差为22,A正确;乙所得分数的中位数为18,B正确;甲、乙所得分数的众数都为22,C正确;故选D.
7.(2020·安徽省合肥市质检)某企业的一种商品的产量与单位成本数据如下表:
产量x(万件) | 14 | 16 | 18 | 20 | 22 |
单位成本y(元/件) | 12 | 10 | 7 | a | 3 |
若根据表中提供的数据,求出y关于x的线性回归方程为=-1.15x+28.1,则a的值等于( B )
A.4.5 B.5
C.5.5 D.6
[解析] ==18.
==,
∵(,)在线性回归方程=-1.15x+28.1上,
则=7.4,解得a=5,故选B.
8.(2020·山东德州期末改编)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男、女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人.( C )
附表:
P(K2≥k0) | 0.050 | 0.010 |
k | 3.841 | 6.635 |
附:K2=
A.25 B.35
C.45 D.70
[解析] 设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下表所示:
| 男生 | 女生 | 合计 |
喜欢抖音 | 4n | 3n | 7n |
不喜欢抖音 | n | 2n | 3n |
合计 | 5n | 5n | 10n |
则K2==,
由于有95%的把握认为是否喜欢抖音和性别有关,
则3.841≤K2<6.632,
即3.841≤<6.632,得8.0661≤n<13.927 2,
∵n∈N*,则n的可能取值有9、10、11、12,
因此,调查人数中男生人数的可能值为45或60.故选C.
二、多选题(本大题共4个小题,每小题5分,共20分,在每小题给出的四个选项中,有多项符合题目要求全部选对的得5分,部分选对的得3分,有选错的得0分)
9.下列说法正确的是( CD )
A.从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样
B.某地气象局预报:5月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学
C.在回归分析模型中,残差平方和越小,说明模型的拟合效果越好
D.在回归直线方程=0.1x+10中,当解释变量x每增加1个单位时,预报变量增加0.1个单位
[解析] 对于选项A,从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故A不正确;对于选项B,降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故B不正确;对于选项C,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,正确;对于选项D,在回归直线方程=0.1x+10中,回归系数为0.1,当解释变量x每增加一个单位时,预报变量增加0.1个单位,故D正确.故选CD.
10.(2020·湖北武汉综合测试改编)下列命题中正确的是( ABC )
A.若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变.
B.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高.
C.设随机变量ξ服从正态分布N(0,1),若P(ξ>2)=p,则P(-2<ξ<0)=-p.
D.对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越大.
[解析] A若将一组样本数据中的每个数据都加上同一个常数后,由方差的计算公式可得样本的方差不变,故A正确;B在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,故B正确;C设随机变量ξ服从正态分布N(0,1),若P(ξ>2)=p,则P(ξ<-2)=p,P(-2<ξ<0)=-p,故C正确;D对分类变量X与Y的随机变量K2的观测值k来说,k越大,判断“X与Y有关系”的把握越大,故D错误.故选ABC.
11.(原创)在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如下图所示的频率分布直方图.则下列结论正确的有( ABCD )
A.成绩在[80,90)中的学生有40名
B.a=0.02
C.成绩的中位数约为74
D.成绩的众数约为75
[解析] 由题知,成绩在[80,90)内的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名,A正确;由(0.01+0.025+0.045+a)×10=1得a=0.02,B正确;由(0.005+0.025)×10+0.045×(x-70)=,得x=74,C正确;D显然正确.
12.(2020·山东济南期末)习总书记讲到:“广大人民群众坚持爱国奉献,无怨无悔,让我感到千千万万普通人最伟大,同时让我感到幸福都是奋斗出来的”.某企业2019年12个月的收入与支出数据的折线图如下:
已知:利润=收入-支出,根据该折线图,下列说法正确的是( AC )
A.该企业2019年1月至6月的总利润低于2019年7月至12月的总利润
B.该企业2019年第一季度的利润约是60万元
C.该企业2019年4月至7月的月利润持续增长
D.该企业2019年11月份的月利润最大
[解析] 由图易知
月份 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
收入 | 30 | 40 | 35 | 30 | 50 | 60 | 80 | 75 | 75 | 80 | 90 | 80 |
支出 | 20 | 25 | 10 | 20 | 22 | 30 | 28 | 24 | 30 | 40 | 45 | 50 |
利润 | 10 | 15 | 25 | 10 | 28 | 30 | 52 | 51 | 45 | 40 | 45 | 30 |
显然AC正确,该企业2019年第一季度的利润约是50万元,故B错;7月份利润最大,故D错.故选AC.
三、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
13.(2019·福建厦门湖滨中学阶段测试)已知x,y的取值如下表所示:
x | 0 | 1 | 3 | 4 |
y | 2.2 | 4.3 | 4.8 | 6.7 |
从散点图分析,y与x线性相关,且=0.95x+a,由此预测当x=1.5时,=__4.025__.
[解析] =2,=4.5,∴a=4.5-2×0.95=2.6,
∴=0.95×1.5+2.6=4.025.
14.(2019·广东惠州模拟)已知某地区中小学生的人数和近视率情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则抽取的高中生中近视的人数为__20__.
[解析] 分层抽样抽取的比例为2%,高中生抽取的学生数为40,抽取的高中生近视人数为40×50%=20,故填20.
15.某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2 000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图,已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为__600__.
[解析] 由题意可知(0.006+0.002+3b)×50=1,
∴50b=0.2,∴(b+0.002)×50×2 000=600(人).
16.某单位员工按年龄分为A,B,C三组,其人数之比为5︰4︰1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是,则C组员工数为__10__;该单位员工总数为__100__.(第一空3分,第二空2分)
[解析] ∵员工按年龄分为A,B,C三组,其人数之比为5︰4︰1,∴从中抽取一个容量为20的样本,则抽取的C组人数为×20=×20=2,设C组员工总数为m,则甲、乙二人均被抽到的概率为==,即m(m-1)=90,解得m=10.设员工总数为x,则由==,可得x=100.
四、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)(2019·高考全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组 | [-0.20,0) | [0,0.20) | [0.20,0.40) | [0.40,0.60) | [0.60,0.80) |
企业数 | 2 | 24 | 53 | 14 | 7 |
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
[解析] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.0296,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
18.(本小题满分12分)(2019·北京模拟)第23届冬季奥林匹克运动会于2018年2月9日~25日在韩国平昌郡举行,简称“平昌冬奥会”.某媒体随机采访了某市20名关心“平昌冬奥会”的市民,其年龄数据可绘制成如图所示的茎叶图,由于其中部分数据缺失,故打算根据频率分布直方图中的数据估计被采访的市民的平均年龄.
(1)完成频率分布直方图;
(2)根据(1)中的频率分布直方图估计被采访的市民的平均年龄x(同一组中的数据用该组区间的中点值作代表);
(3)根据茎叶图计算出被采访的市民的平均年龄为y,并假设a∈{n∈Z|0≤n≤9},且a取得每一个可能值的机会相等,在(2)的条件下,求P(y>x).
[解析] (1)频率分布直方图如图:
(2)x=25×0.1+35×0.15+45×0.3+55×0.25+65×0.2=48,即估计被采访的市民的平均年龄为48岁.
(3)y==,
故P(y>x)=P(>48)=P(a>2)=0.7.
19.(本小题满分12分)(2020·安徽1号卷A10联盟联考)国家统计局北京调查总队3月5日发布《2018年北京市居民时间利用调查报告》,北京市居民平均每天使用互联网的时间为3小时6分钟.某大学为了掌握学生每天使用手机上网情况,随机抽取了100名学生对其进行调查.下面是根据调查结果绘制的时间(单位:分钟)的频率分布直方图,且将日均上网时间不低于200分钟的学生称为“手机控”,低于200分钟的学生称为“非手机控”.
(1)根据已知条件完成下而2×2列联表,并据此判断是否有97.5%的把握认为“手机控”与性别有关?
| 非手机控 | 手机控 | 合计 |
男 |
|
| 50 |
女 |
| 14 |
|
合计 |
|
|
|
(2)将频率视为概率,从该校学生中用随机抽样的方法抽取4人,记被抽取的4人中“手机控”的人数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期E(X).
附:K2=
(n=a+b+c+d)
P(K2≥k) | 0.10 | 0.050 | 0.025 | 0.010 | 0.001 |
k | 2.706 | 3.841 | 5.024 | 6.635 | 10.828 |
[解析] (1)由题意得,2×2列联表如下:
| 非手机控 | 手机控 | 合计 |
男 | 24 | 26 | 50 |
女 | 36 | 14 | 50 |
合计 | 60 | 40 | 100 |
∴K2==6>5.024,
∴有97.5%的把握认为“手机控”与性别有关.
(2)由频率分布直方图知从该校学生中任意抽取1名学生恰为“手机控”的概率为,
由题意知X~B(4,),X的所有可能取值为0,1,2,3,4,
∴P(X=0)=C()4=,
P(X=1)=C()()3=,
P(X=2)=C()2()2=,
P(X=3)=C()3()=,
P(X=4)=C()4=,
∴X的分布列为
X | 0 | 1 | 2 | 3 | 4 |
P |
∴E(X)=4×=.
20.(本小题满分12分)(2020·安徽“皖南八校”摸底)影响消费水平的原因很多,其中重要的一项是工资收入.研究这两个变量的关系的一个方法是通过随机抽样的方法,在一定范围内收集被调查者的工资收入和他们的消费状况,下面的数据是某机构收集的某一年内上海、江苏、浙江、安徽、福建五个地区的职工平均工资与城镇居民消费水平(单位:万元).
地区 | 上海 | 江苏 | 浙江 | 安徽 | 福建 |
职工平均工资x | 9.8 | 6.9 | 6.4 | 6.2 | 5.6 |
城镇居民消费水平y | 6.6 | 4.6 | 4.4 | 3.9 | 3.8 |
(1)利用江苏、浙江、安徽三个地区的职工平均工资和他们的消费水平,求出线性回归方程=x+,其中==,=- ;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1万,则认为得到的线性回归方程是可靠的,试问所得的线性回归方程是否可靠?(的结果保留两位小数)
(参考数据:6.9×4.6+6.4×4.4+6.2×3.9=84.08,
6.92+6.42+6.22=127.01)
[解析] (1)==6.5,
==4.3.
==≈0.88,
=4.3-0.88×6.52=-1.42,
∴所求线性回归方程为=0.88x-1.42.
(2)当x=9.8时,=0.88×9.8-1.42=7.204,
7.204-6.6=0.604<1,
当x=5.6时,=0.88×5.6-1.42=3.508,
3.8-3.508=0.292<1,
所以得到的线性回归方程是可靠的.
21.(2020·河北唐山期末)河北省高考综合改革从2018年秋季入学的高一年级学生开始实施,新高考将实行“3+1+2”模式,其中3表示语文、数学、外语三科必选,1表示从物理、历史两科中选择一科,2表示从化学、生物、政治、地理四科中选择两科.某校2018级入学的高一学生选科情况如下表:
选科 组合 | 物 化 生 | 物 化 政 | 物 化 地 | 物 生 政 | 物 生 地 | 物 政 地 | 史 政 地 | 史 政 化 | 史 生 政 | 史 地 化 | 史 地 生 | 史 化 生 | 合 计 |
男 | 130 | 45 | 55 | 30 | 25 | 15 | 30 | 10 | 40 | 10 | 15 | 20 | 425 |
女 | 100 | 45 | 50 | 35 | 35 | 35 | 40 | 20 | 55 | 15 | 25 | 20 | 475 |
合计 | 230 | 90 | 105 | 65 | 60 | 50 | 70 | 30 | 95 | 25 | 40 | 40 | 900 |
(1)完成下面的2×2列联表,并判断是否在犯错误概率不超过0.01的前提下,认为“选择物理与学生的性别有关”?
(2)以频率估计概率,从该校2018级高一学生中随机抽取3名同学,记这三名同学中选择物理的人数为X,求X的分布列和数学期望.
| 选择物理 | 不选择物理 | 合计 |
男 |
|
| 425 |
女 |
|
| 475 |
合计 |
|
| 900 |
附表及公式:K2=
P(K2≥k0) | 0.150 | 0.100 | 0.050 | 0.010 |
k0 | 2.072 | 2.706 | 3.841 | 6.635 |
[解析] (1)依题意可得列联表
| 选择物理 | 不选择物理 | 合计 |
男 | 300 | 125 | 425 |
女 | 300 | 175 | 475 |
合计 | 600 | 300 | 900 |
将列联表中的数据代入公式计算得
K2=
=≈5.573<6.635,
所以,不能在犯错误概率不超过0.01的前提下认为“选择物理与学生的性别有关”.
(2)由(1)可知,从该校2018级高一学生中任取一名同学,该同学选择物理的概率P==,
X可取0,1,2,3.
P(X=0)=C×(1-)3=,
P(X=1)=C××(1-)2=,
P(X=2)=C×()2×(1-)=,
P(X=3)=C×()3=.
X的分布列为:
X | 0 | 1 | 2 | 3 |
P |
∴E(X)=0×+1×+2×+3×=2.
22.(2020·湖南湘潭模拟)为了解贵州省某州2020届高三理科生的化学成绩的情况,该州教育局组织高三理科生进行了摸底考试,现从参加考试的学生中随机抽取了100名理科生,将他们的化学成绩(满分为100分)分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组,得到如图所示的频率分布直方图.
(1)求a的值;
(2)记A表示事件“从参加考试的所有理科生中随机抽取一名学生,该学生的化学成绩不低于70分”,试估计事件A发生的概率;
(3)在抽取的100名理科生中,采用分层抽样的方法从成绩在[60,80)内的学生中抽取10名,再从这10名学生中随机抽取4名,记这4名理科生成绩在[60,70)内的人数为X,求X的分布列与数学期望.
[解析] (1)∵(0.005+0.010+0.020+0.030+a+0.010)×10=1,
∴a=0.025.
(2)∵成绩不低于70分的频率为
(0.030+0.025+0.010)×10=0.65,
∴事件A发生的概率约为0.65.
(3)抽取的100名理科生中,成绩在[60,70)内的有100×0.020×10=20人,
成绩在[70,80)内的有100×0.030×10=30人,
故采用分层抽样的10名理科生中,
成绩在[60,70)内的有4人,在[70,80)内的有6人,由题可知,X的可能取值为0,1,2,3,4,
P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===,
P(X=4)==.
∴X的分布列为
X | 0 | 1 | 2 | 3 | 4 |
P |
∴E(X)=0×+1×+2×+3×+4×=.