新高考数学一轮复习专题九计数原理、概率与统计9-5统计与成对数据的统计分析练习含答案
展开高考新风向
1.(2024新课标Ⅱ,4,5分,易)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
根据表中数据,下列结论中正确的是( C )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
2.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
(1)填写如下列联表:
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5.设p为升级改造后抽取的n件产品的优级品率,如果p>p+1.65p(1−p)n,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(150≈12.247)
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
.
解析 (1)列联表如下:
K2=150×(26×30−24×70)296×54×100×50=4.687 5,
∵3.841<4.687 5<6.635,
∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题知p=96150=0.64,
∵p=0.5,∴p+1.65p(1−p)n=0.5+1.65×0.5×(1−0.5)150
=0.5+1.65×0.5150≈0.5+1.65×≈0.567,
∵p>p+1.65p(1−p)n,∴可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
考点1 抽样方法与总体分布的估计
1.(2022全国甲,文2,理2,5分,易)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( B )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
2.(2021全国甲,文2,理2,5分,易)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( C )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
3.(多选)(2021新高考Ⅰ,9,5分,易)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( CD )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
4.(多选)(2021新高考Ⅱ,9,5分,易)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有( AC )
A.x1,x2,…,xn的标准差
B.x1,x2,…,xn的中位数
C.x1,x2,…,xn的极差
D.x1,x2,…,xn的平均数
5.(多选)(2023新课标Ⅰ,9,5分,中)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
6.(2021全国乙,文17,理17,12分,中)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为 x和y,样本方差分别记为s12和s22.
(1)求x,y,s12,s22;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高如果y-x≥2s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高.
解析 (1)x=110(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.0.
y=110(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3.
s12=110[(9.8-10.0)2+(10.3-10.0)2+(10.0-10.0)2+(10.2-10.0)2+(9.9-10.0)2+(9.8-10.0)2+(10.0-10.0)2+(10.1-10.0)2+(10.2-10.0)2+(9.7-10.0)2]=0.036.
s22=110[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.
(2)由(1)得y-x=0.3,s12+s22=0.076,
从而(y-x)2=0.09,2s12+s22102=25(s12+s22)=0.030 4.
所以(y-x)2>2s12+s22102,又y>x,故y-x>2s12+s2210,
因此新设备生产产品的该项指标的均值较旧设备有显著提高.
7.(2023新课标Ⅱ,19,12分,中)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
解析 (1)由题意知(c-95)×0.002=0.5%,(1分)
得c=97.5,(2分)
q(c)=0.01×2.5+5×0.002=0.035=3.5%.(4分)
(2)当c∈[95,100]时,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02.(7分)
当c∈(100,105]时,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02.
∴f(c)=−0.008c+0.82,95≤c≤100,0.01c−0.98,100
∴f(c)min=f(100)=0.02.(12分)
考点2 变量间的相关关系
1.(2023天津,7,5分,易)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为y^=0.750 1x+0.610 5.根据以上信息,如下判断正确的为( C )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
2.(2020课标Ⅱ,文18,理18,12分,中)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=
9 000,i=120(xi-x)(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2ri=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2=,2≈1.414.
解析 (1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
i=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2=ri=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2==80080×9000=223≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考点3 独立性检验
1.(2020新高考Ⅰ,19,12分,易)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
.
解析 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(4分)
根据抽查数据,可得2×2列联表:
(8分)
(3)根据(2)的列联表得
K2=100×(64×10−16×10)280×20×74×26≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.(12分)
2.(2020课标Ⅲ,文18,理18,12分,中)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
.
解析 (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
(2)一天中到该公园锻炼的平均人次的估计值为1100×(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表:
根据列联表得K2=100×(33×8−22×37)255×45×70×30≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
三年模拟
练速度
1.(2024河南郑州二模,2)数据6.0,7.4,8.0,8.4,8.6,8.7,8.9,9.1的第75百分位数为 ( D )
A.8.5 B.8.6 C.8.7 D.8.8
2.(2024江西重点中学盟校联考,3)下图是我国2018—2023年纯电动汽车销量统计情况,下列说法中错误的是( D )
A.我国纯电动汽车销量呈现逐年增长趋势
B.这六年销量的第60百分位数为536.5万辆
C.这六年增长率最大的为2019年至2020年
D.2020年销量高于这六年销量的平均值
3.(2024湖南长沙雅礼中学月考,4)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数、标准差分别为( C )
A.2,12 B.2,1
C.4,322 D.4,92
4.(2024福建适应性训练,4)某单位共有A、B两部门,1月份进行服务满意度问卷调查,得到两部门服务满意度得分的频率分布条形图如图.设A、B两部门的服务满意度得分的第75百分位数分别为n1,n2,方差分别为s12,s22,则( C )
A.n1>n2,s12>s22 B.n1>n2,s12
5.(2024福建宁德质检,5)2024海峡两岸各民族欢度“三月三”暨福籽同心爱中华·福建省第十一届“三月三”畲族文化节活动在宁德福安隆重开幕.海峡两岸各民族同胞齐聚于此,与当地群众共同欢庆“三月三”,畅叙两岸情.在活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,之后每过一个小时反馈一次.指挥中心统计了前5次的数据(i,yi),其中i=1,2,3,4,5,yi为第i次入口人流量数据(单位:百人),由此得到y关于i的回归方程y^=b^lg2(i+1)+5.已知y=9,根据回归方程(参考数据:lg23≈1.6,lg25≈2.3),可预测下午4点时入口游客的人流量为( B )
A.9.6 B.11.0 C.11.4 D.12.0
6.(2024广东揭阳二模,8)在研究变量x与y之间的关系时,进行试验后得到了一组样本数据(x1,y1),(x2,y2),…,(x5,y5),(6,28),(0,28).利用此样本数据求得的经验回归方程为y^=107x+1667,现发现数据(6,28)和(0,28)误差较大,剔除这两对数据后,求得的经验回归方程为y^=4x+m,且i=15yi=140,则m=( C )
A.8 B.12 C.16 D.20
7.(多选)(2024山东潍坊一模,9)某科技攻关青年团队有6人,他们年龄分布的茎叶图如图所示,已知这6人年龄的极差为14,则( ACD )
A.a=8
B.6人年龄的平均数为35
C.6人年龄的75%分位数为36
D.6人年龄的方差为643
8.(多选)(2024湘豫名校第二次模拟,9)人均可支配收入和人均消费支出是两个非常重要的经济和民生指标,常被用于衡量一个地区经济发展水平和群众生活水平.2018—2023年前三季度全国城镇居民人均可支配收入及人均消费支出统计图如图,据此进行分析,则( ACD )
A.2018—2023年前三季度全国城镇居民人均可支配收入逐年递增
B.2018—2023年前三季度全国城镇居民人均消费支出逐年递增
C.2018—2023年前三季度全国城镇居民人均可支配收入的极差比人均消费支出的极差大
D.2018—2023年前三季度全国城镇居民人均消费支出的中位数为21 180元
9.(多选)(2024山东省实验中学一模,9)下列命题正确的是( ABD )
A.若样本数据x1,x2,…,x6的方差为2,则数据2x1-1,2x2-1,…,2x6-1的方差为8
B.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,则剩下28个数据的20%分位数不等于原样本数据的20%分位数
C.若A,B两组成对数据的样本相关系数分别为rA=0.97,rB=-0.99,则A组数据比B组数据的线性相关程度更强
D.若决定系数R2的值越接近于1,则表示回归模型的拟合效果越好
10.(2024江苏苏锡常镇调研,12)已知变量x,y的统计数据如下表,对表中数据作分析,发现y与x之间具有线性相关关系,利用最小二乘法,计算得到经验回归直线方程为y^=0.8x+a^,据此模型预测当x=10时y^的值为 7.4 .
练思维
1.(2024浙江全国名校协作体二模,4)为了解某中学学生假期中每天自主学习的时间,采用样本量按比例分配的分层随机抽样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计该校学生每天学习时间的方差为( B )
A.1.4 C.1.5
2.(2024河北石家庄一模,6)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重,制作成表格.
由表格制作成如图所示的散点图,
由最小二乘法计算得到经验回归直线l1的方程为y^=b^1x+a^1,其相关系数为r1;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线l2的方程为y^=b^2x+a^2,相关系数为r2.则下列选项正确的是( A )
A.b^1a^2,r1
C.b^1>b^2,a^1r2 D.b^1>b^2,a^1>a^2,r1
A.若删去3,则aB.若删去9,则x
D.若x=x',则s2
A.甲、乙两地区这10天检查所得共20个数据的平均数是75
B.甲、乙两地区这10天检查所得共20个数据的方差是65
C.甲地区环境治理达标
D.乙地区环境治理达标
5.(多选)(2024浙江杭州学军中学适应性考试,10)在对具有相关关系的两个变量进行回归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,引入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.下列选项为四个同学根据自己所得数据的散点图建立的非线性模型,且散点图样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有( ABD )
A.y=c1x2+c2x B.y=x+c1x+c2
C.y=c1ex+c2 D.y=c1+ln(x+c2)
6.(2024广东广州一模,14)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi, fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得x=8,y=5,i=18yi2=214.由最小二乘法得经验回归方程为y^=b^x+7.4,则k的值为 -0.3 ;为判断拟合效果,通过经验回归方程求得预测值y^i(i=1,2,…,8),若残差平方和i=18(yi−y^i)2≈0.28,则决定系数R2≈ 0.98 .
参考公式:决定系数R2=1-i=1n(yi−y^i)2i=1n(yi−y)2
7.(2024福建厦门教学质量检测四,16)某地区为了解居民体育锻炼达标情况与性别之间的关系,随机调查了600位居民,得到如下数据:
(1)完成2×2列联表,根据小概率值α=0.01的独立性检验,能否认为体育锻炼达标与性别有关联?
(2)若体育锻炼达标的居民体能测试合格的概率为45,体育锻炼未达标的居民体能测试合格的概率为25,用上表中居民体育锻炼达标的频率估计该地区居民体育锻炼达标的概率,从该地区居民中随机抽取3人参加体能测试,求3人中合格的人数X的分布列及期望.(xα对应值见下表. χ2=n(ad−bc)2(a+b)(a+c)(c+d)(b+d),n=a+b+c+d)
解析 (1)补全2×2列联表如下:
零假设为H0:体育锻炼达标与性别独立,即体育锻炼达标与性别无关.
χ2=600×(50×200−250×100)2300×300×150×450=2009≈22.222>6.635.
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为体育锻炼达标与性别有关联,该推断犯错误的概率不超过0.01.
(2)设事件A=“随机抽取一人体育锻炼达标”,事件B=“随机抽取一人体能测试合格”,
则P(A)=34,P(A)=14,P(B|A)=45,P(B|A)=25.
所以P(B)=P(A)P(B|A)+P(A)P(B|A)=710,
X的可能取值为0,1,2,3,
P(X=0)=3103=271000,
P(X=1)=C313102710=1891000,
P(X=2)=C323107102=4411000,
P(X=3)=7103=3431000.
所以X的分布列为
所以E(X)=0×271000+1×1891000+2×4411000+3×3431000=2.1.
8.(2024黑龙江哈尔滨六中四模,18)2024年初,冰城哈尔滨充分利用得天独厚的冰雪资源,成为2024年第一个“火出圈”的网红城市,冰城通过创新营销展示了丰富的文化活动,成功提升了吸引力和知名度,为其他旅游城市提供了宝贵经验,从2024年1月1日至5日,哈尔滨太平国际机场接待外地游客数量如下:
(1)计算x,y的相关系数r(计算结果精确到0.01),并判断是否可以认为日期与游客人数的相关性很强;
(2)请根据表中提供的数据,用最小二乘法求出y关于x的经验回归方程;
(3)为了吸引游客,在冰雪大世界售票处针对各个旅游团进行了现场抽奖的活动,具体抽奖规则为从该旅游团中随机同时抽取两名游客,两名游客性别不同,则为中奖.已知某个旅游团中有5个男游客和k(k≥5)个女游客,设重复进行三次抽奖中恰有一次中奖的概率为p,当k取多少时,p最大?
参考公式:b^=i=1n(xi−x)(yi−y)i=1n(xi−x)2=i=1nxiyi−nxyi=1nxi2−nx2,a^=y-b^x,r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,参考数据:3≈1.732.
解析 (1)因为x=1+2+3+4+55=3,y=45+50+60+65+805=60,
所以i=15(xi-x)(yi-y)=85,i=15(xi−x)2=10,
i=15(yi−y)2=750,
所以i=15(xi−x)2i=15(yi−y)2=7 500,所以r=i=15(xi−x)(yi−y)i=15(xi−x)2i=15(yi−y)2=85503≈8550×1.732=8586.6≈0.98,
由此可以认为日期与游客人数的相关性很强.
(2)由(1)知i=15(xi-x)(yi-y)=85,i=15(xi−x)2=10,
所以b^=i=15(xi−x)(yi−y)i=15(xi−x)2=8510=8.5,
因为a^=y-b^x=60-8.5×3=34.5,
所以回归方程为y=8.5x+34.5.
(3)记p(k)=t=C51·Ck1Ck+52=10k(k+5)(k+4)(k≥5,k∈N),
∵p(k+1)-p(k)=10(k+1)(k+6)(k+5)-10k(k+5)(k+4)=10(4−k)(k+4)(k+5)(k+6)<0,
∴0
p(t)=C31·t·(1-t)2=3t3-6t2+3t,
p'(t)=9t2-12t+3=3(3t-1)(t-1),
∴p(t)在0,13上单调递增,在13,59上单调递减,
∴当t=13时,p(t)取得最大值,
由t=10k(k+5)(k+4)=13,解得k=20或k=1(舍去),
∴当k=20时,恰有一次中奖的概率最大.
9.(2024广东广州三模,17)在第二十五届中国国际高新技术成果交易会上,中国科学院的科研团队带来了可以在零下70摄氏度到零上80摄氏度范围内正常使用的宽温域锂电池,为新能源汽车在冬季等极端温度下的使用提供了技术支撑.中国新能源汽车也在科研团队的努力下,在世界舞台上扮演着越来越重要的角色,已知某锂电池生产商对一批锂电池最低正常使用零下温度(单位:℃)进行了检测,得到如下频率分布直方图.
(1)求最低正常使用零下温度的第60百分位数.
(2)以抽样检测的频率作为实际情况的概率.
①若随机抽取3块电池,设抽到锂电池最低正常使用零下温度在[20,50]的数量为X,求X的分布列;
②若锂电池最低正常使用零下温度在[30,50]之间,则为A类锂电池.若以抽样检测的频率作为实际情况的概率,从这批锂电池中随机抽取10块,抽到k块为“A类锂电池”的可能性最大,试求k的值.
解析 (1)设最低正常使用零下温度的第60百分位数为a,
由直方图可知最低正常使用零下温度在[0,20)的频率为0.4,
在[0,30)的频率为0.65,因此最低正常使用零下温度的第60百分位数a一定在[20,30)内,
则有0.01×10+0.03×10+0.025×(a-20)=0.6,解得a=28,
所以最低正常使用零下温度的第60百分位数为28 ℃.
(2)①由题意可知X的可能值是0,1,2,3,X~B(3,0.6),
P(X=0)=C300.60×0.43=0.064;
P(X=1)=C310.61×0.42=0.288;
P(X=2)=C320.62×0.41=0.432;
P(X=3)=C330.63×0.40=0.216,
所以X的分布列为
②设抽到A类锂电池的数量为Y,则Y~B(10,0.35),
若抽到k块的可能性最大,
则P(Y=k)=C10k0.35k(1-0.35)10-k,k=0,1,…,10,
P(Y=k)≥P(Y=k−1),P(Y=k)≥P(Y=k+1),
即−k≥C10k−10.35k−10.6511−k,−k≥C10k+10.35k+10.659−k,
即7(11−k)≥13k,13(k+1)≥7(10−k),解得2.85≤k≤3.85,
由于k∈N*,故k=3.
练风向
(概念深度理解)(2024安徽合肥二模,17)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表:
在按比例分配分层随机抽样中,已知总体划分为2层,把第一层样本记为x1,x2,x3,…,xn,其平均数记为x,方差记为s12;把第二层样本记为y1,y2,y3,…,ym,其平均数记为y,方差记为s22;把总样本数据的平均数记为z,方差记为s2.
(1)证明:s2=1m+n{n[s12+(x-z)2]+m[s22+(y-z)2]};
(2)求该班参加考试学生成绩的平均数和标准差(精确到1);
(3)假设全年级学生的考试成绩服从正态分布N(μ,σ2),以该班参加考试学生成绩的平均数和标准差分别作为μ和σ的估计值.如果按照16%,34%,34%,16%的比例将考试成绩从高分到低分依次划分为A,B,C,D四个等级,试确定各等级的分数线(精确到1).
附:P(μ-σ≤X≤μ+σ)≈0.68,302≈17,322≈18,352≈19.
解析 (1)证明:s2=1m+n[i=1n(xi-z)2+i=1m(yi-z)2]=1m+n[i=1n(xi-x+x-z)2+i=1m(yi-y+y-z)2]=1m+n{i=1n[(xi-x)2+(x-z)2+2(xi-x)(x-z)]+i=1m[(yi-y)2+(y-z)2+2(yi-y)(y-z)]},
因为i=1n[2(xi-x)(x-z)]=2(x-z)i=1n(xi-x)=2(x-z)(x1+x2+x3+…+xn-nx)=0,
同理i=1m[2(yi-y)(y-z)]=0,
所以s2=1m+n{n[s12+(x-z)2]+m[s22+(y-z)2]}.
(2)该班参加考试学生成绩的平均数为z,方差为s2,
则z=150×(30×100+20×90)=96,
所以s2=30×[256+(100−96)2]+20×[361+(90−96)2]50=322,
又322≈18,所以s≈18.
即该班参加考试学生成绩的平均数为96分,标准差约为18分.
(3)由(2)知μ=96,σ=18,所以全年级学生的考试成绩X服从正态分布N(96,182),
所以P(96-18≤X≤96+18)≈0.68,P(X≥96)=0.5.
P(78≤X<96)=P(96≤X<114)≈0.34,P(X≥114)=P(X<78)≈0.16.
故可将X≥114定为A等级,96≤X<114定为B等级,78≤X<96定为C等级,X<78定为D等级.亩产量
[900,
950)
[950,
1 000)
[1 000,
1 050)
[1 050,
1 100)
[1 100,
1 150)
[1 150,
1 200)
频数
6
12
18
30
24
10
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
优级品
非优级品
甲车间
乙车间
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
优级品
非优级品
甲车间
26
24
乙车间
70
30
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
SO2
PM2.5
[0,150]
(150,475]
[0,75]
64
16
(75,115]
10
10
锻炼人次
空气质量等级
[0,200]
(200,
400]
(400,
600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
人次≤400
人次>400
空气质量好
空气质量不好
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
空气质量等级
1
2
3
4
概率的估计值
0.43
0.27
0.21
0.09
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
x
5
6
7
8
9
y
3.5
4
5
6
6.5
身高x(单位:cm)
167
173
175
177
178
180
181
体重y(单位:kg)
90
54
59
64
67
72
76
不达标
达标
合计
男
300
女
100
300
合计
450
600
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
不达标
达标
合计
男
50
250
300
女
100
200
300
合计
150
450
600
X
0
1
2
3
P
271000
1891000
4411000
3431000
x(日)
1
2
3
4
5
y(万人)
45
50
60
65
80
X
0
1
2
3
P
0.064
0.288
0.432
0.216
性别
参加考试人数
平均成绩
标准差
男
30
100
16
女
20
90
19
2025高考数学一轮知识必备练习第九章概率与统计9.2成对数据的统计分析: 这是一份2025高考数学一轮知识必备练习第九章概率与统计9.2成对数据的统计分析,共5页。试卷主要包含了通过实例,理解列联表的统计意义,1B,879等内容,欢迎下载使用。
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练,共14页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。
高考数学专题练 专题五概率与统计 微专题33 统计与成对数据的统计分析(含答案): 这是一份高考数学专题练 专题五概率与统计 微专题33 统计与成对数据的统计分析(含答案),共28页。