统考版2024高考数学二轮专题复习专题四统计与概率第1讲统计统计案例理
展开1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例 1 (1)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号001、002、…、699、700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第5个样本编号是( )
3321183429 7864560732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073285 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.607 B.328
C.253 D.007
(2)[2023·江苏海安高三期末]某校高三年级的700名学生中,男生有385名,女生有315名.从中抽取一个容量为60的样本,则抽取男生和女生的人数分别为( )
A.31 29 B.32 28
C.33 27 D.34 26
归纳总结
系统抽样和分层抽样中的计算方法
(1)系统抽样
①总体容量为N,样本容量为n,则要将总体均分为n段,每段个个体(有“零头”时要先去掉).
②若第一段抽取编号为k的个体,则以后各段中抽取的个体编号依次为k+,…,k+(n-1).
(2)分层抽样
①适用于总体由差异明显的几部分组成的情况.
②当总体容量为N,样本容量为n时,有下列关系式:=.
提醒 无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.
对点训练
1.[2023·贵州省六校联盟高三联考]从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第3个同学的编号为( )
(注:表中的数据为随机数表第一行和第二行)
A.36 B.42 C.57 D.46
2.某社区卫生室为了了解该社区居民的身体健康状况,对该社区1 100名男性居民和900名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容量为100的样本,则应从男性居民中抽取的人数为( )
A.45 B.50 C.55 D.60
考点二 用样本估计总体——读懂图表,明确数字
1.频率分布直方图的两个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
2.统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即
=________________.
(4)方差与标准差
方差:s2=_____________________________________________________,
标准差:s=____________________________________________________.
角度1统计图表的应用——读图、识图、整合信息
例 2[2023·四川省泸县第一中学模拟]如图所示是世界人口变化情况的三幅统计图:
下列结论中错误的是( )
A.从折线图能看出世界人口的总量随着年份的增加而增加
B.2050年亚洲人口比其他各洲人口的总和还要多
C.2050年南美洲及大洋洲人口之和与欧洲人口基本持平
D.1957年到2050年各洲中北美洲人口增长速度最慢
归纳总结
从图表中挖掘信息
(1)折线图,条形图
破解此类题的关键:一是从总体上看折线的变化是总体升高还是下降,或是趋于平稳.二是看相邻点的变化:是陡还是缓,是升还是降.三是看最高点和最低点.
(2)表格
破解此类题只需过“双关”:一是看表关,即会观察频数分布表,读出相关的数据信息;二是定义关,即会利用众数、中位数的定义,求出样本中的众数、中位数,从而估计出总体中的相关数据.
(3)“饼形图”
将整体分成若干区域来表示所占的比例:即其圆心角的大小与360°的比值.
角度2用样本的数字特征估计总体的数字特征——平均数、方差、准确计算
例 3[2021·全国乙卷]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
归纳总结
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
对点训练
1.[2022·全国乙卷(文)]分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
2.[2023·四川省成都市石室中学模拟]某市2022年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前、后的年经济收入构成比例,得到如下扇形图.下列结论正确的是( )
A.招商引资后,工资净收入较前一年减少
B.招商引资后,转移净收入是前一年的1.25倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
考点三 回归分析的实际应用——准确计算,数据分析
线性回归方程
方程=x+称为线性回归方程,其中==;()称为样本中心点.
例 4[2023·四川省成都市石室中学模拟]某企业为了了解年广告费x(单位:万元)对年销售额y(单位:万元)的影响,统计了近7年的年广告费xi和年销售额yi(i=1,2,3,4,5,6,7)的数据,得到下面的表格:
由表中数据,可判定变量x,y的线性相关关系较强.
(1)建立y关于x的线性回归方程;
(2)已知该企业的年利润z与x,y的关系为z=2 eq \r(y) -x,根据(1)的结果,年广告费x约为何值时(小数点后保留一位),年利润的预报值最大?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 的斜率和截距的最小二乘估计分别为 eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n, )(xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\i\su(i=1,n,)(xi-\(x,\s\up6(-)))2)= eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up6(-))\(y,\s\up6(-)),\i\su(i=1,n,x) eq \\al(\s\up1(2),\s\d1(i)) -n\(x,\s\up6(-))2), eq \(a,\s\up6(^)) = eq \(y,\s\up6(-)) - eq \(b,\s\up6(^)) eq \(x,\s\up6(-)) ;参考数据: eq \i\su(i=1,7,)yi=405, eq \i\su(i=1,7,)xiyi=2 305.
归纳总结
求线性回归方程的方法
(1)若所求的线性回归方程是在选择题中,常利用回归直线=x+必经过样本点的中心()快速选择.
(2)若所求的线性回归方程是在解答题中,则求线性回归方程的一般步骤为:
对点训练
[2023·江西省鹰潭市高三一模]数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018~2022年中国车载音乐市场规模(单位:十亿元),其中年份2018~2022对应的代码分别为1~5.
(1)由上表数据知,可用指数函数模型y=a·bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);
(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.
参考数据:
其中vi=ln yi, eq \(v,\s\up6(-)) = eq \f(1,5) eq \i\su(i=1,5,)vi.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 eq \(v,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(β,\s\up6(^)) u的斜率和截距的最小二乘法估计公式分别为 eq \(β,\s\up6(^)) = eq \f(\i\su(i=1,n,u)ivi-n\(u,\s\up6(-))\(v,\s\up6(-)),\i\su(i=1,n,u) eq \\al(\s\up1(2),\s\d1(i)) -n\(u,\s\up6(-))2), eq \(a,\s\up6(^)) = eq \(v,\s\up6(-)) - eq \(β,\s\up6(^)) eq \(u,\s\up6(-)) .
考点四 独立性检验的实际应用——阅读理解,统计推断
随机变量
K2=,
若K2>3.841,则有95%的把握说两个事件有关;
若K2>6.635,则有99%的把握说两个事件有关.
例 5[2022·全国甲卷]甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:K2=,
归纳总结
独立性检验的解题步骤
(1)根据样本数据列出2×2列联表.
(2)计算K2的观测值k,查下表确定临界值k0.
(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
对点训练
[2021·全国甲卷]甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=,
第1讲 统计、统计案例
考点一
[例1] 解析:(1)从表中第5行第6列开始向右读取数据,得到的数据中有两个超出范围,一个重复,抽取的5个样本编号分别是:253,313,457,007,328,所以得到的第5个样本编号是328.选B.
(2)设样本中的男生和女生的人数分别为m、n,由分层抽样可得 eq \f(m,385))= eq \f(n,315)= eq \f(60,700),解得 eq \b\lc\{(\a\vs4\al\c1(m=33,n=27)).故选C.
答案:(1)B (2)C
对点训练
1.解析:从随机数表第一行第7列和第8列数字开始往右依次选:36、47、46、24,选出的第3个同学的编号为46,故选D.
答案:D
2.解析:应从男性居民中抽取的人数为100× eq \f(1 100,1 100+900)=55.故选C.
答案:C
考点二
2.(3) eq \f(1,n)(x1+x2+…+xn)
(4) eq \f(1,n)[(x1- eq \(x,\s\up6(-)))2+(x2- eq \(x,\s\up6(-)))2+…+(xn- eq \(x,\s\up6(-)))2]
eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2])
[例2] 解析:对于A,从折线图能看出世界人口的总量随着年份的增加而增加,故A正确;对于B,从扇形图中能够明显地看出2050年亚洲人口比其他各洲人口的总和还要多,故B正确;对于C,从条形图中能够明显地看出2050年南美洲及大洋洲人口之和与欧洲人口基本持平,故C正确;对于D,由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D错误.故选D.
答案:D
[例3] 解析:(1)由题中数据可得:
x= eq \f(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7,10)=10.0,
y= eq \f(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5,10)=10.3,
s eq \\al(\s\up1(2),\s\d1(1)) = eq \f(1,10)[(9.8-10.0)2+(10.3-10.0)2+(10.0-10.0)2+(10.2-10.0)2+(9.9-10.0)2+(9.8-10.0)2+(10.0-10.0)2+(10.1-10.0)2+(10.2-10.0)2+(9.7-10.0)2]=0.036,
s eq \\al(\s\up1(2),\s\d1(2)) = eq \f(1,10)[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.
(2)由(1)知y-x=10.3-10.0=0.3,而2 eq \r(\f(s eq \\al(\s\up1(2),\s\d1(1)) +s eq \\al(\s\up1(2),\s\d1(2)) ,10))=2 eq \r(\f(0.036+0.04,10))=2 eq \r(0.007 6),
则0.3= eq \r(0.09)>2 eq \r(0.007 6)= eq \r(0.030 4),
所以可判断新设备生产产品的该项指标的均值较旧设备有显著提高.
对点训练
1.解析:对于A选项,将甲同学周课外体育运动时长的样本从小到大排列,其样本容量为16,中间两个样本为7.3和7.5,所以中位数为 eq \f(7.3+7.5,2)=7.4,所以A不符合题意.对于B选项,(方法一)乙同学周课外体育运动时长的样本平均数为 eq \f(1,16)×(6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1)≈8.5,所以B不符合题意.(方法二)由乙的样本可知,小于8的样本有6.3,7.4,7.6,其他样本均大于8.又因为 eq \f(10.1+6.3,2)>8, eq \f(9.8+7.4,2)>8, eq \f(9.3+7.6,2)>8,所以乙同学周课外体育运动时长的样本平均数大于8,所以B不符合题意.对于C选项,甲同学周课外体育运动时长大于8的样本有8.1,8.2,8.4,8.6,9.2,9.4,共6个,则甲同学周课外运动时长大于8的概率的估计值为 eq \f(6,16)= eq \f(3,8)<0.4,所以C符合题意.对于D选项,乙同学周课外体育运动时长大于8的样本有13个,则乙同学周课外运动时长大于8的概率的估计值为 eq \f(13,16)>0.6,所以D不符合题意.故选C.
答案:C
2.解析:设招商引资前经济收入为M,则招商引资后经济收入为2M.对于A,招商引资前工资净收入为M×60%=0.6M,招商引资后的工资净收入为2M×37%=0.74M,所以招商引资后,工资净收入增加了,故A错误;对于B,招商引资前转移净收入为M×4%=0.04M,招商引资后转移净收入为2M×5%=0.1M,所以招商引资后,转移净收入是前一年的2.5倍,故B错误;对于C,招商引资后,转移净收入与财产净收入的总和为0.1M+2M×28%=0.66M< eq \f(2,5)×2M=0.8M,所以招商引资后,转移净收入与财产净收入的总和低于该年经济收入的 eq \f(2,5),故C错误;对于D,招商引资前经营净收入为M×30%=0.3M,招商引资后经营净收入为2M×30%=0.6M,所以招商引资后,经营净收入较前一年增加了一倍,故D正确.故选D.
答案:D
考点三
[例4] 解析:(1)由表格数据,得 eq \(x,\s\up6(-))= eq \f(2+3+4+5+6+7+8,7)=5, eq \(y,\s\up6(-))= eq \f(1,7) eq \i\su(i=1,7,)yi= eq \f(405,7) , eq \i\su(i=1,7,)(xi- eq \(x,\s\up6(-)) )2=(-3)2+(-2)2+(-1)2+02+12+22+32=28.
由公式,得 eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,7,x)iyi-7\(x,\s\up6(-))\(y,\s\up6(-)),\i\su(i=1,7,x) eq \\al(\s\up1(2),\s\d1(i)) -7\(x,\s\up6(-))2)= eq \f(2 305-7×5×\f(405,7),28) =10, eq \(a,\s\up6(^)) = eq \(y,\s\up6(-)) - eq \(b,\s\up6(^)) eq \(x,\s\up6(-)) = eq \f(405,7) -10×5= eq \f(55,7) ,故y关于x的线性回归方程为 eq \(y,\s\up6(^)) =10x+ eq \f(55,7) .
(2)由(1)可得,z=2 eq \r(10x+\f(55,7)) -x.
设 eq \r(10x+\f(55,7)) =t,则x= eq \f(1,10) t2- eq \f(11,14) ,
所以z=2t-( eq \f(1,10) t2- eq \f(11,14) )=- eq \f(1,10) t2+2t+ eq \f(11,14) ,
故当t=10时,z取得最大值,此时x=10- eq \f(11,14) ≈9.2,
即年广告费x约为9.2万元时,年利润的预报值最大.
对点训练
解析:(1)因为y=a·bx,
所以两边同时取常用对数,得ln y=ln a+x ln b,
设v=ln y,
所以v=ln a+x ln b,设α=ln a,β=ln b,
因为 eq \(x,\s\up6(-)) =3, eq \(v,\s\up6(-)) =1.94,
所以 eq \(β,\s\up6(^)) = eq \f(\i\su(i=1,5,x)ivi-5\(x,\s\up6(-))\(v,\s\up6(-)),\i\su(i=1,5,x) eq \\al(\s\up1(2),\s\d1(i)) -5\(x,\s\up6(-))2)= eq \f(33.82-5×3×1.94,55-5×32) =0.472,
eq \(α,\s\up6(^)) = eq \(v,\s\up6(-)) - eq \(β,\s\up6(^)) eq \(x,\s\up6(-)) =1.94-0.472×3=0.524,
所以ln eq \(a,\s\up6(^)) =0.524,ln eq \(b,\s\up6(^)) =0.472,
所以 eq \(a,\s\up6(^)) =e0.524=1.7, eq \(b,\s\up6(^)) =e0.472=1.6,
所以 eq \(y,\s\up6(^)) =1.7×1.6x.
(2)由(1)知2023年与2024年这两年的年平均增长率1.6-1.3=0.3,
2022年中国车载音乐市场规模为17,
故预测2024年的中国车载音乐市场规模17(1+0.3)2=28.73(十亿元).
考点四
[例5] 解析:(1)A公司一共调查了260个班次,其中有240个班次准点,故A公司甲、乙两城之间的长途客车准点的概率是 eq \f(240,260) = eq \f(12,13) .
B公司一共调查了240个班次,其中有210个班次准点,故B公司甲、乙两城之间的长途客车准点的概率是 eq \f(210,240) = eq \f(7,8) .
(2)因为K2= eq \f(500×(240×30-20×210)2,260×240×450×50) = eq \f(125,39) ≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
对点训练
解析:(1)根据题表中数据知,甲机床生产的产品中一级品的频率是 eq \f(150,200) =0.75,乙机床生产的产品中一级品的频率是 eq \f(120,200) =0.6.
(2)根据题表中的数据可得
K2= eq \f(400×(150×80-120×50)2,200×200×270×130) = eq \f(400,39) ≈10.256.
因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
年广告费x
2
3
4
5
6
7
8
年销售额y
25
41
50
58
64
78
89
年份代码x
1
2
3
4
5
车载音乐市场规模y
2.8
3.9
7.3
12.0
17.0
eq \(v,\s\up6(-))
eq \i\su(i=1,5,)xivi
e0.524
e0.472
1.94
33.82
1.7
1.6
准点班次数
未准点班次数
A
240
20
B
210
30
P(K2≥k)
0.100 0.050 0.010
k
2.706 3.841 6.635
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
P(K2≥k)
0.050 0.010 0.001
k
3.841 6.635 10.828
统考版2024高考数学二轮专题复习第三篇关键能力为重专题四统计与概率第2讲概率与统计文: 这是一份统考版2024高考数学二轮专题复习第三篇关键能力为重专题四统计与概率第2讲概率与统计文,共10页。试卷主要包含了古典概型的概率公式,几何概型的概率公式,841,635,879等内容,欢迎下载使用。
统考版2024高考数学二轮专题复习第三篇关键能力为重专题四统计与概率第1讲统计统计案例文: 这是一份统考版2024高考数学二轮专题复习第三篇关键能力为重专题四统计与概率第1讲统计统计案例文,共11页。试卷主要包含了选B,8+10等内容,欢迎下载使用。
高考数学二轮复习核心专题讲练:统计与概率第1讲 统计和统计案例(含解析): 这是一份高考数学二轮复习核心专题讲练:统计与概率第1讲 统计和统计案例(含解析),共67页。试卷主要包含了总体平均数与样本平均数,分层随机抽样的步骤,总体集中趋势的估计,总体离散程度的估计,相关关系的强弱等内容,欢迎下载使用。