所属成套资源:44个高考必考微专题-2024年高考数学二轮微专题系列
微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题
展开
这是一份微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题,共34页。试卷主要包含了5%,所以A错误;,9,10)=0,635,,5万元的农户比率估计为6%,2,,484>6,9-7等内容,欢迎下载使用。
1.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案 B
解析 对于A,讲座前问卷答题的正确率的中位数是eq \f(70%+75%,2)=72.5%,所以A错误;
对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;
对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;
对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
2.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
并计算得eq \(∑,\s\up6(10),\s\d4(i=1))xeq \\al(2,i)=0.038,eq \(∑,\s\up6(10),\s\d4(i=1))yeq \\al(2,i)=1.615 8,
eq \(∑,\s\up6(10),\s\d4(i=1))xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),eq \r(1.896)≈1.377.
解 (1)样本中10棵这种树木的根部横截面积的平均值eq \(x,\s\up6(-))=eq \f(0.6,10)=0.06(m2),
样本中10棵这种树木的材积量的平均值
eq \(y,\s\up6(-))=eq \f(3.9,10)=0.39(m3),
据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2)r=eq \f(\(∑,\s\up6(10),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(10),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(10),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(\(∑,\s\up6(10),\s\d4(i=1))xiyi-10\(x,\s\up6(-))\(y,\s\up6(-)),\r((\(∑,\s\up6(10),\s\d4(i=1))xeq \\al(2,i)-10\(x,\s\up6(-))2)(\(∑,\s\up6(10),\s\d4(i=1))yeq \\al(2,i)-10\(y,\s\up6(-))2)))=
eq \f(0.247 4-10×0.06×0.39,\r((0.038-10×0.062)(1.615 8-10×0.392)))=eq \f(0.013 4,\r(0.000 189 6))≈eq \f(0.013 4,0.013 77)≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,
又已知树木的材积量与其根部横截面积近似成正比,
可得eq \f(0.06,0.39)=eq \f(186,Y),
解得Y=1 209(m3).
则该林区这种树木的总材积量估计为1 209 m3.
3.(2022·新高考Ⅰ卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,eq \f(P(B|A),P(\(B,\s\up6(-))|A))与eq \f(P(B|\(A,\s\up6(-))),P(\(B,\s\up6(-))|\(A,\s\up6(-))))的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-))));
②利用该调查数据,给出P(A|B),P(A|eq \(B,\s\up6(-)))的估计值,并利用①的结果给出R的估计值.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
(1)解 χ2=eq \f(200×(40×90-60×10)2,50×150×100×100)=24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明 R==eq \f(P(B|A)·P(\(B,\s\up6(-))|\(A,\s\up6(-))),P(\(B,\s\up6(-))|A)·P(B|\(A,\s\up6(-)))),
由题意知,只需证明eq \f(P(B|A)·P(\(B,\s\up6(-))|\(A,\s\up6(-))),P(\(B,\s\up6(-))|A)·P(B|\(A,\s\up6(-))))=eq \f(P(A|B)·P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(\(A,\s\up6(-))|B)·P(A|\(B,\s\up6(-))))即可,
上式左边=eq \f(\f(P(AB),P(A))·\f(P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(A,\s\up6(-)))),\f(P(A\(B,\s\up6(-))),P(A))·\f(P(\(A,\s\up6(-))B),P(\(A,\s\up6(-)))))=eq \f(P(AB)·P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(A\(B,\s\up6(-)))·P(\(A,\s\up6(-))B)),
右边=eq \f(\f(P(AB),P(B))·\f(P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(B,\s\up6(-)))),\f(P(\(A,\s\up6(-))B),P(B))·\f(P(A\(B,\s\up6(-))),P(\(B,\s\up6(-)))))=eq \f(P(AB)·P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(A,\s\up6(-))B)·P(A\(B,\s\up6(-)))).
左边=右边,故R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-)))).
②解 由调查数据可知
P(A|B)=eq \f(40,100)=eq \f(2,5),P(A|eq \(B,\s\up6(-)))=eq \f(10,100)=eq \f(1,10),
且P(eq \(A,\s\up6(-))|B)=1-P(A|B)=eq \f(3,5),
P(eq \(A,\s\up6(-))|eq \(B,\s\up6(-)))=1-P(A|eq \(B,\s\up6(-)))=eq \f(9,10),
所以R=eq \f(\f(2,5),\f(3,5))×eq \f(\f(9,10),\f(1,10))=6.
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
考向1 统计图表与数字特征的应用
例1 (1)(2022·西安模拟)某市中小学生人数和近视情况分别如图甲和图乙所示,为了解该地区中小学生近视形成的原因,现用分层随机抽样的方法抽取5%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.750,100 B.1 500,100
C.1 500,120 D.750,120
(2)(多选)(2022·福州三模)空气质量指数(简称AQI)是能够对空气质量进行定量描述的数据,AQI越小代表空气质量越好.甲、乙两地在9次空气质量监测中的AQI数据如图所示,则下列说法正确的是( )
A.甲地的AQI的平均值大于乙地
B.甲地的AQI的方差小于乙地
C.甲地的AQI的中位数大于乙地
D.甲地的空气质量好于乙地
答案 (1)B (2)ABC
解析 (1)由题意,样本容量为(18 500+7 500+4 000)×5%=1 500,
抽取的高中生近视人数为4 000×5%×0.5=100,故选B.
(2)由AQI数据图知,甲地9次监测数据有7次均在50以上,只有两次在50以下,并且与50相差较小,乙地9次监测数据有7次均在50以下,有两次在50附近,并且与50相差很小,甲地的AQI的平均值大于50,乙地的AQI的平均值小于50,甲地的AQI的平均值大于乙地,A正确;
甲地9次监测数据的折线图比较平滑,波动较小,乙地9次监测数据波动较大,即甲地的AQI的方差小于乙地,B正确;
甲地9次监测数据的中位数大于50,乙地9次监测数据的中位数小于50,甲地的AQI的中位数大于乙地,C正确;
甲地9次监测数据中有8个都高于乙地对应监测数据,再结合平均值、中位数看,乙地的空气质量要好于甲地,D不正确.
考向2 用样本的频率分布估计总体分布
例2 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解 (1)由已知得0.70=a+0.20+0.15,
故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
规律方法 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.
2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
训练1 (1)(多选)(2022·济南质检)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
答案 ABD
解析 对于A,根据频率分布直方图可知,该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;
对于B,根据频率分布直方图可知,该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;
对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;
对于D,根据频率分布直方图可知,该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.
(2)某工厂A,B两条生产线生产同款产品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元,现从A,B生产线生产的产品中各随机抽取100件进行检测,结果统计如图:
①分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定;
②估计该厂产品产量为2 000件时的利润以及一等级产品的利润.
解 ①从A生产线随机抽取的100件产品获利的平均数eq \(x,\s\up6(-))1=eq \f(1,100)×(10×20+8×60+6×20)=8(元),
方差为seq \\al(2,1)=eq \f(1,100)×[(10-8)2×20+(8-8)2×60+(6-8)2×20]=1.6,
从B生产线随机抽取的100件产品获利的平均数为eq \(x,\s\up6(-))2=eq \f(1,100)×(10×35+8×40+6×25)=8.2(元),
方差为seq \\al(2,2)=eq \f(1,100)×[(10-8.2)2×35+(8-8.2)2×40+(6-8.2)2×25]=2.36.
所以seq \\al(2,1)6.635=x0.01.
根据小概率值α=0.01的χ2独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关,此推断犯错误的概率不超过0.01.
易错提醒 1.χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
2.在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
训练3 (1)某校团委对“学生性别和喜欢某视频APP是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP的人数占男生人数的eq \f(1,6),女生喜欢某视频APP的人数占女生人数的eq \f(2,3),若依据小概率值α=0.050的独立性检验,认为喜欢某视频APP和性别有关,则男生至少有( )
A.12人 B.6人
C.10人 D.18人
附:
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
(2)(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如表所示的列联表,经计算χ2≈4.762,则下列结论正确的是( )
A.该校男生对食堂服务满意的概率的估计值为eq \f(3,5)
B.调研结果显示,该校男生比女生对食堂服务更满意
C.依据小概率值α=0.050的独立性检验,可以认为男、女生对该食堂服务的评价有差异
D.依据小概率值α=0.010的独立性检验,可以认为男、女生对该食堂服务的评价有差异
答案 (1)A (2)AC
解析 (1)设被调查的男生人数为x,则被调查的女生人数为eq \f(x,2),则2×2列联表为
零假设为H0:喜欢某视频APP和性别无关,
根据小概率值α=0.050的独立性检验,认为喜欢某视频APP和性别有关,
则χ2≥3.841,即χ2=eq \f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\c1(\f(x,6)·\f(x,6)-\f(5x,6)·\f(x,3)))\s\up12(2),x·\f(x,2)·\f(x,2)·x)=eq \f(3x,8)≥3.841=x0.050,
则x≥eq \f(3.841×8,3)≈10.243,
又eq \f(x,2),eq \f(x,3),eq \f(x,6)均为整数,
所以男生至少有12人.
(2)对于A,该校男生对食堂服务满意的概率的估计值为eq \f(30,30+20)=eq \f(3,5),故A正确;
对于B,该校女生对食堂服务满意的概率的估计值为eq \f(40,40+10)=eq \f(4,5)>eq \f(3,5),故B错误;
因为χ2≈4.762>3.841=x0.050,
所以根据小概率值α=0.050的独立性检验,可以认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
一、基本技能练
1.乡村旅游是以旅游度假为宗旨,以村庄野外为空间,以人文无干扰、生态无破坏为特色的村野旅游形式.某机构随机调查了某地区喜欢乡村旅游的1 000名游客,这些游客都是在A,B,C,D,E这5个平台中的一个预订出游的(每名游客只选择1个平台),得到一个不完整的统计图,如图所示.已知在E平台预订出游的人数是在B平台预订出游的人数的1.75倍,则估计1 000名游客中在B平台预订出游的人数为( )
A.100 B.120
C.210 D.300
答案 B
解析 设在B平台预订出游的人数与在E平台预订出游的人数分别为x,y,
则y=1.75x,且eq \f(x+y,1 000)=1-20%-17%-30%=33%,
所以x+y=330,所以x=120.
2.(2022·厦门模拟)厦门中学生助手通过统计已知某校有教职工560人,其中女职工240人,现按性别用分层随机抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是( )
A.2 B.4
C.6 D.8
答案 B
解析 某校有教职工560人,其中女职工240人,则男职工320人,
故男女职工人数之比为eq \f(320,240)=eq \f(4,3),
现按性别用分层随机抽样方法从该校教职工中抽取28人,
则抽取的男职工人数与抽取的女职工人数之比为eq \f(4,3),
则抽取的男职工人数为28×eq \f(4,7)=16,
抽取的女职工人数为28×eq \f(3,7)=12,
故抽取的男职工人数与抽取的女职工人数之差是16-12=4.
故选B.
3.(2022·福州模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:
则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11 600
B.这一星期内乙的日步数的30%分位数是7 030
C.这一星期内甲的日步数的平均值大于乙
D.这一星期内甲的日步数的方差大于乙
答案 B
解析 对于A,甲的日步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800.
中位数是11 600.故A正确;
对于B,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10 060.故B不正确;
对于C,eq \(x,\s\up6(-))甲=eq \f(1,7)(16 000+7 965+12 700+2 435+16 800+9 500+11 600)=11 000,
eq \(x,\s\up6(-))乙=eq \f(1,7)(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=10 500.
所以eq \(x,\s\up6(-))甲>eq \(x,\s\up6(-))乙.故C正确;
对于D,甲的极端值,对方差的影响大,所以甲日步数的方差大于乙.故D正确.
4.(多选)为学习贯彻党的十九届六中全会精神,某单位组织“筑梦新时代”主题演讲活动.9位评委对某位选手的具体评分如下:7.8,8.4,8.5,8.6,8.8,8.9,9.5,9.7,9.9,则下列说法正确的是( )
A.9位评委的评分的极差是2.1
B.9位评委的评分的中位数是8.8
C.9位评委的评分的平均分是8.8
D.9位评委的评分的方差是eq \f(31,75)
答案 ABD
解析 9位评委的评分的极差是9.9-7.8=2.1,故A正确;
9位评委的评分的中位数是8.8,故B正确;
9位评委的评分的平均分是
eq \f(7.8+8.4+8.5+8.6+8.8+8.9+9.5+9.7+9.9,9)=eq \f(80.1,9)=8.9,故C错误;
9位评委的评分的方差为s2=eq \f(1,9)×[(7.8-8.9)2+(8.4-8.9)2+(8.5-8.9)2+(8.6-8.9)2+(8.8-8.9)2+(8.9-8.9)2+(9.5-8.9)2+(9.7-8.9)2+(9.9-8.9)2]=eq \f(3.72,9)=eq \f(31,75),故D正确.故选ABD.
5.(多选)下列说法正确的是( )
A.将一组数据中的每一个数据都加上同一个常数后,方差不变
B.设具有线性相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强
C.在一个2×2列联表中,由计算得χ2的值,则χ2的值越小,判断两个变量有关的把握越大
D.若X~N(1,σ2),P(X>2)=0.2,则P(0<X<1)=0.3
答案 AD
解析 对于A,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故A正确;
对于B,具有线性相关关系的两个变量x,y的相关系数为r,则|r|越接近于1,x和y之间的线性相关程度越强,故B错误;
对于C,在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量有关的把握越大,故C错误;
对于D,∵X~N(1,σ2),
∴P(0<X<1)=P(1<X<2)=P(X>1)-P(X>2)=0.5-0.2=0.3,故D正确.
故选AD.
6.(多选)(2022·济南模拟)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,[15.5,16]分成9组,制成了如图所示的频率分布直方图.
由直方图推断,下列选项正确的是( )
A.直方图中a的值为0.38
B.由直方图估计本校高三男生100米体能测试成绩的众数为13.75秒
C.由直方图估计本校高三男生100米体能测试成绩不大于13秒的人数为54
D.由直方图估计本校高三男生100米体能测试成绩的中位数为13.7秒
答案 BC
解析 对A,由于(0.08+0.16+0.3+a+0.52+0.3+0.12+0.08+0.04)×0.5=1,所以a=0.4,所以选项A错误;
对B,由频率分布直方图可知,[13.5,14)这一组对应的小长方形最高,所以估计众数为eq \f(13.5+14,2)=13.75(秒),所以选项B正确;
对C,由频率分布直方图知不大于13秒为前三组,前三组的人数为(0.08+0.16+0.3)×0.5×200=54,所以选项C正确;
对D,由选项A可知,a=0.4,所以前四组的频率为(0.08+0.16+0.3+0.4)×0.5=0.47,前五组的频率为(0.08+0.16+0.3+0.4+0.52)×0.5=0.73,所以中位数在[13.5,14)这一组,设中位数为x秒,则(x-13.5)×0.52=0.5-0.47,解得x≈13.56,所以选项D错误.综上,选BC.
7.某校高二年级共有学生1 000人,其中男生480人,按性别进行分层,用分层随机抽样的方法从高二全体学生中抽出一个容量为100的样本,若样本按比例分配,则女生应抽取的人数为________.
答案 52
解析 某校高二年级有学生1 000人,男生480人,则女生520人,
设女生应抽取x人,则eq \f(x,520)=eq \f(100,1 000),
∴x=52.
故女生应抽取52人.
8.某设备的使用年限与所支出的维修费用的统计数据如下表:
根据上表可得经验回归方程为eq \(y,\s\up6(^))=1.3x+eq \(a,\s\up6(^)),据此模型预测,若使用年限为14年,估计维修费约为________万元.
答案 18
解析 eq \(x,\s\up6(-))=eq \f(2+3+4+5+6,5)=4,
eq \(y,\s\up6(-))=eq \f(1.5+4.5+5.5+6.5+7.0,5)=5,
则样本点中心为(4,5),代入经验回归方程可得eq \(a,\s\up6(^))=5-1.3×4=-0.2,eq \(y,\s\up6(^))=1.3x-0.2,
当x=14时,eq \(y,\s\up6(^))=1.3×14-0.2=18(万元),即估计使用14年时,维修费用是18万元.
9.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的50名学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
答案 0.025
解析 零假设为H0:能否一次考试通过与是否集中培训无关.
由题意,得到列联表如下:
χ2=eq \f(105×(45×20-10×30)2,55×50×75×30)≈6.109>5.024=x0.025.
根据小概率值α=0.025的独立性检验推断H0不成立,
即认为“能否一次考试通过与是否集中培训有关”,此推断犯错的概率不超过0.025.
10.中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”已从愿景变为现实,中国各地滑雪场的数量也由2015年的1 255家增加到2021年的3 100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,下列说法中正确的序号是________.
①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高
②2016年至2021年中国滑雪场数量逐年上升
③2016年至2021年中国滑雪场新增数量逐年增加
④2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多
答案 ①②④
解析 由扇形统计图可知,2021年中国滑雪场中大众娱乐型滑雪场占比最高,故①正确;
由柱状图可知,2016年至2021年中国滑雪场数量逐年上升,故②正确;
由柱状图可知,2020年比2019年下降了,故③不正确;
2021年,业余玩家型滑雪场的数量为3 100×38%=1 178(家),2020年,大众娱乐型滑雪场的数量为(3 100-385)×40%=1 086(家),故④正确.
11.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)根据小概率值α=0.01的独立性检验,分析甲机床生产的产品质量与乙机床生产的产品质量有无差异.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
解 (1)因为甲机床生产的200件产品中有150件一级品,
所以甲机床生产的产品中一级品的频率为eq \f(150,200)=eq \f(3,4),
因为乙机床生产的200件产品中有120件一级品,
所以乙机床生产的产品中一级品的频率为eq \f(120,200)=eq \f(3,5).
(2)零假设为H0:
甲机床的产品质量与乙机床的产品质量没有差异.
根据2×2列联表中的数据,
得χ2=eq \f(400×(150×80-120×50)2,270×130×200×200)=eq \f(400,39)≈10.256,
因为10.256>6.635=x0.01,
所以推断H0不成立,
即认为甲机床的产品质量与乙机床的产品质量有差异.
12.2022年新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.
(1)该校教职工有410人,高二学生有620人,高三学生有610人,
①用分层随机抽样的方法,求高一学生每天抽检人数;
②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.
你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:
①计算变量x和y的相关系数r(精确到0.01),并说明两变量线性相关的强弱;
②根据①中的计算结果,判定变量x和y是正相关,还是负相关,并给出可能的原因.
参考数据和公式:eq \r(10)≈3.16,相关系数r=eq \f(\(∑,\s\up13(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up13(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up13(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)).
解 (1)①高一学生每天抽检人数为eq \f(450×5-410-620-610,5)=122(人);
②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作.
(2)①eq \(x,\s\up6(-))=eq \f(1,5)(1+2+3+4+5)=3,eq \(y,\s\up6(-))=eq \f(1,5)(1.2+1.2+1.1+1+1)=1.1,
所以eq \(∑,\s\up13(5),\s\d10(i=1)) (xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=-2×0.1+(-1)×0.1+1×(-0.1)+2×(-0.1)=-0.6,
eq \(∑,\s\up13(5),\s\d10(i=1)) (xi-eq \(x,\s\up6(-)))2=4+1+1+4=10,eq \(∑,\s\up13(5),\s\d10(i=1)) (yi-eq \(y,\s\up6(-)))2=0.01+0.01+0.01+0.01=0.04.
变量x和y的相关系数为r=
eq \f(\(∑,\s\up13(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up13(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up13(5),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(-0.6,\r(10)×\r(0.04))=eq \f(-3,\r(10))≈-0.95,
因为|r|>0.75,可知两变量线性相关性很强;
②由r<0可知变量x和y是负相关,可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短.
二、创新拓展练
13.(多选)下表是某生活超市2022年第四季度各区域营业收入占比和净利润占比统计表:
该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),则( )
A.本季度此生活超市营业收入最低的是熟食区
B.本季度此生活超市的营业净利润超过一半来自生鲜区
C.本季度此生活超市营业利润率最高的是日用品区
D.本季度此生活超市生鲜区的营业利润率超过50%
答案 BC
解析 对于A,由图表可知,此生活超市营业收入最低的是其它区,故选项A错误;
对于B,因为生鲜区的净利润占比65.8%>50%,则本季度此生活超市的营业净利润超过一半来自生鲜区,故选项B正确;
对于C,生活超市生鲜区的营业利润率为32.5%×eq \f(65.8%,48.6%)≈44%,
生活超市熟食区的营业利润率为32.5%×eq \f(-4.3%,15.8%)≈-8.8%,
生活超市乳制品区的营业利润率为32.5%×eq \f(16.5%,20.1%)≈26.7%,
生活超市日用品区的营业利润率为32.5%×eq \f(20.2%,10.8%)≈60.8%,
生活超市其它区的营业利润率为32.5%×eq \f(1.8%,4.7%)≈12.4%,
所以本季度此生活超市营业利润率最高的是日用品区,故选项C正确;
对于D,由上面计算可知,生活超市生鲜区的营业利润率为32.5%×eq \f(65.8%,48.6%)≈44%<50%,故选项D错误.
故选BC.
14.(多选)某校计划在课外活动中新增攀岩项目,为了了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制了等高条形图,如图,则( )
参考数据:
A.参加调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参加调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参加调查的男、女生人数均为100,则能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关
D.无论参加调查的男、女生人数为多少,都能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关
答案 AC
解析 因为参加调查的男、女生人数相同,
且男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,
所以参加调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,故A正确;
参加调查的女生中喜欢攀岩的人数占30%,所以不喜欢攀岩的人数占70%,
所以参加调查的女生中不喜欢攀岩的人数比喜欢攀岩的人数多,故B不正确;
若参加调查的男、女生人数都为100,则可得2×2列联表:
所以χ2=eq \f(200×(80×70-20×30)2,100×100×110×90)=eq \f(5 000,99)≈50.505>6.635=x0.01,
所以能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关,故C正确;
若不确定参加调查的男、女生人数,则无法确定能否根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关,故D不正确.
15.(多选)为了了解市民对各种垃圾进行分类的情况,加强垃圾分类宣传,指导市民尽快掌握垃圾分类的方法,某市垃圾处理厂连续8周对有害垃圾错误分类情况进行了调查.经整理绘制了有害垃圾错误分类重量累积统计图,如图所示,图中横轴表示时间(单位:周),纵轴表示有害垃圾错误分类的累积重量(单位:吨).根据统计图分析,则下列说法正确的是( )
A.当x∈[0,2)时有害垃圾错误分类的重量加速增长
B.当x∈[2,4)时有害垃圾错误分类的重量匀速增长
C.当x∈[4,6)时有害垃圾错误分类的重量相对于当x∈[2,4)时增长了30%
D.当x∈[6,8]时有害垃圾错误分类的重量相对于当x∈[0,2)时减少了1.2吨
答案 AB
解析 由统计图可知,第2周增长数量比第1周增长数量明显要多,所以是加速增长,所以A正确;
当x∈[2,4)时图象是线段,所以是匀速增长,所以B正确;
当x∈[4,6)时增长数量比当x∈[2,4)时增长数量要少,所以是减少,所以C错误;
当x∈[0,2)时共增长2.4吨,当x∈[6,8]时共增长0.6吨,所以减少了1.8吨,所以D错误.
16.(2022·成都诊断)2020年1月15日教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),《意见》宣布:2020年起不再组织开展高校自主招生工作,改为实行“强基计划”,“强基计划”主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,据悉“强基计划”的校考由试点高校自主命题,校考中通过笔试后才能进入面试环节.
(1)为了更好地服务高三学生,某研究机构对随机抽取的5名高三学生的记忆力x和判断力y进行统计分析,得到下表:
请用相关系数说明该组数据中y与x之间的关系可以用线性回归模型进行拟合,并求出y关于x的经验回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x.
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目,且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为eq \f(2,5),该考生报考乙大学,每门笔试科目通过的概率依次为m,eq \f(1,4),eq \f(2,3),其中0<m<1,根据规定每名考生只能报考“强基计划”的一所试点高校,若以笔试过程中通过科目数的数学期望为依据作出决策,求该考生更希望通过乙大学笔试时m的取值范围.
参考公式:
①线性相关系数
r=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\r(\b\lc\(\rc\)(\a\vs4\al\c1(\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2))\b\lc\(\rc\)(\a\vs4\al\c1(\(∑,\s\up10(n),\s\d13(i=1))yeq \\al(2,i)-n\(y,\s\up6(-))2)))),一般地,相关系数r的绝对值在0.95以上(含0.95)认为线性相关性较强;否则,线性相关性较弱.
②对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计公式分别为eq \(b,\s\up6(^))=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
解 (1)根据表格中的数据,
可得eq \(x,\s\up6(-))=eq \f(6+8+9+10+12,5)=9,
eq \(y,\s\up6(-))=eq \f(2+3+4+5+6,5)=4,
eq \(∑,\s\up13(5),\s\d10(i=1))xiyi=12+24+36+50+72=194,
eq \(∑,\s\up13(5),\s\d10(i=1))xeq \\al(2,i)=36+64+81+100+144=425,
eq \(∑,\s\up13(5),\s\d10(i=1))yeq \\al(2,i)=4+9+16+25+36=90,
可得相关系数r=eq \f(194-5×9×4,\r((425-5×81)×(90-5×16)))=eq \f(14,10\r(2))≈0.99>0.95,
故y与x之间的关系可用线性回归模型进行拟合.
由eq \(b,\s\up6(^))=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2)=eq \f(194-5×9×4,425-5×81)=0.7,
可得eq \(a,\s\up6(^))=4-9×0.7=-2.3.
所以经验回归方程为eq \(y,\s\up6(^))=-2.3+0.7x.
(2)通过甲大学的考试科目数X~Beq \b\lc\(\rc\)(\a\vs4\al\c1(3,\f(2,5))),
则E(X)=3×eq \f(2,5)=eq \f(6,5),
设通过乙大学的考试科目数为Y,
则Y可能的取值为0,1,2,3,
则P(Y=0)=(1-m)eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))=eq \f(1,4)(1-m),
P(Y=1)=meq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+(1-m)×eq \f(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+(1-m)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))×eq \f(2,3)=eq \f(7,12)-eq \f(1,3)m,
P(Y=2)=m×eq \f(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+m×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))×eq \f(2,3)+(1-m)×eq \f(1,4)×eq \f(2,3)=eq \f(1,6)+eq \f(5,12)m,
P(Y=3)=m×eq \f(1,4)×eq \f(2,3)=eq \f(1,6)m,
所以E(Y)=eq \f(7,12)-eq \f(1,3)m+2eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,6)+\f(5,12)m))+3×eq \f(1,6)m=eq \f(11,12)+m,
因为该考生更希望通过乙大学的笔试,
所以E(Y)>E(X),
即eq \f(11,12)+m>eq \f(6,5),
又由0<m<1,解得eq \f(17,60)<m<1,
即该考生更希望通过乙大学的笔试时m的取值范围为eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(17,60),1)).样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截
面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
不够良好
良好
病例组
40
60
对照组
10
90
年份
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
年借阅量y(万册)
4.9
5.1
5.5
5.7
5.8
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
PM2.5浓度
SO2浓度
合计
[0,150]
(150,475]
[0,75]
(75,115]
合计
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
PM2.5
浓度
SO2浓度
合计
[0,150]
(150,475]
[0,75]
64
16
80
(75,115]
10
10
20
合计
74
26
100
α
0.050
0.010
xα
3.841
6.635
性别
对食堂服务的满意度
满意
不满意
男
30
20
女
40
10
α
0.100
0.050
0.010
xα
2.706
3.841
6.635
性别
对某视频APP的态度
合计
喜欢
不喜欢
男生
eq \f(x,6)
eq \f(5x,6)
x
女生
eq \f(x,3)
eq \f(x,6)
eq \f(x,2)
合计
eq \f(x,2)
x
eq \f(3x,2)
使用年限x(单位:年)
2
3
4
5
6
维修费用y(单位:万元)
1.5
4.5
5.5
6.5
7.0
α
0.05
0.025
0.010
0.001
xα
3.841
5.024
6.635
10.828
培训方式
合计
集中
分散
一次考过
45
30
75
一次未考过
10
20
30
合计
55
50
105
机床
等级
产口质量
合计
一级品
二级品
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
第x天
1
2
3
4
5
用时y(小时)
1.2
1.2
1.1
1.0
1.0
生鲜区
熟食区
乳制品区
日用品区
其它区
营业收入占比
48.6%
15.8%
20.1%
10.8%
4.7%
净利润占比
65.8%
-4.3%
16.5%
20.2%
1.8%
α
0.025
0.010
0.005
xα
5.024
6.635
7.879
性别
对攀岩的态度
合计
喜欢
不喜欢
男
80
20
100
女
30
70
100
合计
110
90
200
x
6
8
9
10
12
y
2
3
4
5
6
相关试卷
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
这是一份微专题18 统计与成对数据的统计分析,共12页。
这是一份微专题18 统计与成对数据的统计分析,共10页。试卷主要包含了基本技能练,创新拓展练等内容,欢迎下载使用。