所属成套资源:2024版新教材高考数学复习特训卷考点过关检测(19份)
2024版新教材高考数学复习特训卷考点过关检测17统计与成对数据的统计分析
展开这是一份2024版新教材高考数学复习特训卷考点过关检测17统计与成对数据的统计分析,共9页。试卷主要包含了单项选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
1.一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为177.5 cm,抽出的女运动员平均身高为168.4 cm,估计该田径队运动员的平均身高是( )
A.172.95 cm B.173.6 cm
C.172.3 cm D.176 cm
2.[2022·全国甲卷]某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
3.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组得到如下频率分布直方图,则直方图中x的值为( )
A.0.007 B.0.007 5
C.0.008 D.0.008 5
4.[2023·河北保定模拟]某研究机构为了了解初中生语文成绩的平均分y(单位:分)与每周课外阅读时间x(单位:分钟)是否存在线性关系,搜集了100组数据( eq \(∑,\s\up10(100),\s\d10(i=1))xi=3 000, eq \(∑,\s\up10(100),\s\d10(i=1))yi=7 900),并据此求得y关于x的经验回归方程为y=0.3x+a.若一位初中生的每周课外阅读时间为2个小时,则可估计她的语文成绩的平均分为( )
A.70.6 B.100
C.106 D.110
5.某国有企业响应国家关于进一步深化改革,加强内循环的号召,不断自主创新提升产业技术水平,同时积极调整企业旗下的甲、乙、丙、丁、戊等5种系列产品的结构比例,近年来取得了显著效果.据悉该企业2021年5种系列产品年总收入是2020年的2倍,其中5种系列产品的年收入构成比例如下图所示.则以下说法错误的是( )
A.2021年甲系列产品收入和2020年的一样多
B.2021年乙和丙系列产品收入之和比2020年的企业年总收入还多
C.2021年丁系列产品收入是2020年丁系列产品收入的 eq \f(1,3)
D.2021年戊系列产品收入是2020年戊系列产品收入的2倍还多
6.[2023·江苏扬州模拟]甲、乙、丙、丁四人各掷骰子5次(骰子出现的点数可能为1,2,3,4,5,6),并分别记录自己每次出现的点数,四人根据统计结果对自己的试验数据分别做了如下描述,可以判断一定出现6点的描述是( )
A.中位数为4,众数为4
B.中位数为3,极差为4
C.平均数为3,方差为2
D.平均数为4,第25百分位数为2
二、多项选择题
7.[2021·新高考Ⅰ卷]有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
8.[2021·新高考Ⅱ卷]下列统计量中,能度量样本x1,x2,…,xn的离散程度的是( )
A.样本x1,x2,…,xn的标准差
B.样本x1,x2,…,xn的中位数
C.样本x1,x2,…,xn的极差
D.样本x1,x2,…,xn的平均数
9.[2023·山东菏泽模拟]某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:
根据上表,可得y关于x的经验回归方程为 eq \(y,\s\up6(^)) =0.24x+ eq \(a,\s\up6(^)) ,下列结论正确的有( )
A. eq \(a,\s\up6(^)) =4.68
B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7
C.y与x的线性相关系数r>0
D.2023年的借阅量一定不少于6.12万册
10.[2023·广东韶关模拟]某电视传媒机构为了解某地区电视观众对某类体育节目的收视情况,随机抽取了200名观众进行调查,其中女性占40%.根据调查结果分别绘制出男、女观众两周时间收看该类体育节目时长的频率分布直方图,则( )
A.m=0.08
B.女观众收看节目时长的中位数为6.5小时
C.女观众收看节目的平均时长小于男观众的平均时长
D.收看节目不少于9小时观众中的女观众人数是男观众人数的 eq \f(1,3)
[答题区]
三、填空题
11.[2023·山东聊城模拟]如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为________.
12.一组数据3,6,8,x的中位数是x,且x是满足不等式组 eq \b\lc\{(\a\vs4\al\c1(x-3≥0,5-x<0)) 的整数,则这组数据的平均数是________.
13.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的第30百分位数和乙组数据的中位数相等,则a-b=________.
14.为了解某种作物的生长情况,抽取该作物植株高度(单位:cm)的一个随机样本,整理得到样本频率分布直方图如图所示.由此样本估计,该作物植株高度的80%分位数约为________ cm.
四、解答题
15.[2022·全国乙卷]某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
并计算得 eq \i\su(i=1,10,x) eq \\al(\s\up1(2),\s\d1(i)) =0.038, eq \i\su(i=1,10,y) eq \\al(\s\up1(2),\s\d1(i)) =1.615 8, eq \i\su(i=1,10,x)iyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数
16.[2023·山东济南历城二中模拟]2022年我国举办了第24届冬季奥林匹克运动会,为调查某城市居民对冰雪运动的了解情况,随机抽取了该市120名市民进行统计,得到如下2×2列联表:
已知从参与调查的男性中随机选取1名,抽到“了解冰雪运动”的概率为 eq \f(2,3) .
(1)直接写出m,n,p,q的值;
(2)能否在犯错误概率不超过0.1的前提下认为该市居民了解冰雪运动与性别有关?请说明理由.
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,其中n=a+b+c+d.
考点过关检测17 统计与成对数据的统计分析
1.答案:B
解析:依题意,该田径队运动员的平均身高为177.5× eq \f(4,7)+168.4× eq \f(3,7)=173.6 cm.故选B.
2.答案:B
解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为 eq \f(70%+75%,2)=72.5%>70%,A错误.对于B项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为 eq \f(1,10)×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B正确.对于C项,讲座后这10位社区居民问卷答题的正确率的方差s eq \\al(\s\up1(2),\s\d1(后)) = eq \f(1,10)×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]= eq \f(42.25,10 000),所以标准差s后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为 eq \f(1,10)×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s eq \\al(\s\up1(2),\s\d1(前)) = eq \f(1,10)×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]= eq \f(142.25,10 000),所以标准差s前≈11.93%.所以s前>s后,C错误.对于D项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D错误.故选B.
3.答案:B
解析:在频率分布直方图中,各小矩形面积和为1,即20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.故选B.
4.答案:C
解析:因为 eq \(∑,\s\up12(100),\s\d12(i=1))xi=3 000, eq \(∑,\s\up12(100),\s\d12(i=1))yi=7 900,所以 eq \(x,\s\up6(-)) = eq \f(3 000,100) =30, eq \(y,\s\up6(-)) = eq \f(7 900,100) =79,所以79=0.3×30+a,则a=70.当x=2×60=120时,y=0.3×120+70=106.故选C.
5.答案:C
解析:设2020年5种系列产品年总收入为m,则2021年5种系列产品年总收入为2m,2020年甲系列产品收入为0.4m,2021年甲系列产品收入为0.4m,A正确;2021年乙和丙系列产品收入之和为1.1m,B正确;2020年丁系列产品收入为0.15m,2021年丁系列产品收入为0.1m,是2020年丁系列产品收入的 eq \f(2,3) ,C不正确;2020年戊系列产品收入为0.15m,2021年戊系列产品收入为0.4m,比2020年戊系列产品收入的2倍还多,D正确.故选C.
6.答案:D
解析:对于A,中位数为4,众数为4,则这5个数可以为4,4,4,4,4,故A不符题意;对于B,中位数为3,极差为4,则这5个数可以是1,1,3,4,5,故B不符题意;对于C,平均数为3,方差为2,设这5个数分别为x1,x2,x3,x4,x5,则x1+x2+x3+x4+x5=15, eq \f(1,5) [(x1-3)2+(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2]=2,若取x1=6,则x2+x3+x4+x5=9,则(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2=1,所以(x2-3)2≤1,(x3-3)2≤1,(x4-3)2≤1,(x5-3)2≤1,所以x2,x3,x4,x5这四个数可以为4,3,3,3与2,3,3,3,这与x2+x3+x4+x5=9矛盾,所以6不存在,故C不符题意;对于D,按从小到大的顺序设这5个数为a,b,c,d,e,因为5×25%=1.25,所以第25百分位数为5个数中从小到大排列的第二个数,又第25百分位数为2,所以a=1,b=2,因为平均数为4,所以a+b+c+d+e=20,则c+d+e=17,若c,d,e三个数都不是6,则c+d+e≤15,这与c+d+e=17矛盾,故c,d,e三个数一定会出现6,故D符合题意.故选D.
7.答案:CD
解析:A:E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;
B:若第一组中位数为xi,则第二组的中位数为yi=xi+c,显然不相同,错误;
C:D(y)=D(x)+D(c)=D(x),故方差相同,正确.
D:由极差的定义知:若第一组的极差为xmax-xmin,则第二组的极差为ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故极差相同,正确.
故选CD.
8.答案:AC
解析:由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势.
9.答案:ABC
解析:因为 eq \(x,\s\up6(-)) = eq \f(1,5) ×(1+2+3+4+5)=3, eq \(y,\s\up6(-)) = eq \f(1,5) ×(4.9+5.1+5.5+5.7+5.8)=5.4,所以5.4=0.24×3+ eq \(a,\s\up6(^)) ,得 eq \(a,\s\up6(^)) =4.68,所以A正确,因为5×75%=3.75,所以借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7,所以B正确,因为0.24>0,所以y与x的线性相关系数r>0,所以C正确,由选项A可知经验回归方程为 eq \(y,\s\up6(^)) =0.24x+4.68,当x=6时, eq \(y,\s\up6(^)) =0.24×6+4.68=6.12,所以2023年的借阅量约为6.12万册,所以D错误.故选ABC.
10.答案:BC
解析:由(0.05+0.075+0.075+m+0.200)×2=1,解得m=0.1,故A错误;由频率分布直方图可知,女观众收看时长在[3,5)的频率为0.1×2=0.2,在[5,7)的频率为0.2×2=0.4,所以女观众收看时长的中位数落在[5,7)中,不妨设为x,则0.2+0.2×(x-5)=0.5,解得x=6.5,则女观众收看时长的中位数为5+ eq \f(3,4) ×2=6.5,故B正确;男性观众收看节目的平均时长为0.1×4+0.15×6+0.4×8+0.2×10+12×0.15=8.3小时,女性观众收看节目的平均时长为0.2×4+0.4×6+0.3×8+0.1×10=6.6小时,故C正确;由频率直方图可知,男性观众收看达到9小时人数为200×60%×(0.2+0.15)=42人,女性观众收看达到9小时人数为200×40%×0.1=8人,故D错误.故选BC.
11.答案:15
解析:根据等高条形图可知: 喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为 eq \f(300,460) ×23=15人.
12.答案:5.75
解析:解不等式组 eq \b\lc\{(\a\vs4\al\c1(x-3≥0,5-x<0)) 得x>5,因为x是整数,数据3,6,8,x的中位数是x,所以x=6.这组数据的平均数是 eq \f(1,4) (3+6+6+8)=5.75.
13.答案:8
解析:因为10×30%=3,甲组数据的第30百分位数为第三个数和第四个数的平均数,乙组数据的中位数为第四个和第五个数的平均数,根据题意可得 eq \f(37+a,2) = eq \f(b+45,2) ,解得a-b=8.
14.答案:78
解析:由图可知,从左到右矩形的面积为0.2,0.4,0.25,因为0.2+0.4+0.25=0.85>0.8,所以80%分位数位于第3个矩形,设80%分位数为x,所以x=80- eq \f(0.05,0.025) =78.
15.解析:(1)该林区这种树木平均一棵的根部横截面积 eq \(x,\s\up6(-)) = eq \f(0.6,10) =0.06(m2),
平均一棵的材积量 eq \(y,\s\up6(-)) = eq \f(3.9,10) =0.39(m3).
(2)由题意,得 eq \(∑,\s\up6(10),\s\d6(i=1)) (xi- eq \(x,\s\up6(-)) )2= eq \(∑,\s\up6(10),\s\d6(i=1))x eq \\al(\s\up1(2),\s\d1(i)) -10 eq \(x,\s\up6(-)) 2=0.038-10×0.062=0.002,
eq \(∑,\s\up6(10),\s\d6(i=1))(yi- eq \(y,\s\up6(-)) )2= eq \(∑,\s\up6(10),\s\d6(i=1))y eq \\al(\s\up1(2),\s\d1(i)) -10 eq \(y,\s\up6(-)) 2=1.615 8-10×0.392=0.094 8,
eq \(∑,\s\up6(10),\s\d6(i=1))(xi- eq \(x,\s\up6(-)) )(yi- eq \(y,\s\up6(-)) )= eq \(∑,\s\up6(10),\s\d6(i=1))xiyi-10 eq \(x,\s\up6(-)) eq \(y,\s\up6(-)) =0.247 4-10×0.06×0.39=0.013 4,
所以相关系数r= eq \f(0.013 4,\r(0.002×0.094 8)) = eq \f(0.013 4,\r(1.896×0.000 1)) ≈ eq \f(0.013 4,0.013 77) ≈0.97.
(3)因为树木的材积量与其根部横截面积近似成正比,所以比例系数k= eq \f(\(y,\s\up6(-)),\(x,\s\up6(-))) = eq \f(0.39,0.06) =6.5,
所以该林区这种树木的总材积量的估计值为186×6.5=1 209(m3).
16.解析:
(1)因为从参与调查的男性中随机选取1名,抽到“了解冰雪运动”的概率为 eq \f(2,3) ,
所以m=60× eq \f(2,3) =40,所以n=20,p=30,q=30.
(2)能;理由如下:
由题意知,χ2= eq \f(120×(40×30-20×30)2,60×60×70×50) = eq \f(24,7) ≈3.429>2.706,所以能在犯错误概率不超过0.1的前提下认为该市居民了解冰雪运动与性别有关.年份
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
年借阅量y(万册)
4.9
5.1
5.5
5.7
5.8
题号
1
2
3
4
5
6
7
8
9
10
答案
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
男
女
合计
了解冰雪运动
m
p
70
不了解冰雪运动
n
q
50
合计
60
60
120
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
相关试卷
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。
这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。