备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第1讲随机抽样统计图表
展开(1)分类:放回简单随机抽样和不放回简单随机抽样.除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.
(2)常用方法:① 抽签法 和② 随机数法 .
辨析比较
1.抽签法和随机数法的异同:(1)都是逐个、不放回抽样;(2)总体中个体数不多时选择抽签法,总体量较大,样本量较小时选择随机数法.
2.能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.
2.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为③ 分层随机抽样 ,每一个子总体称为④ 层 .在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为⑤ 比例分配 .
辨析比较
简单随机抽样与分层随机抽样的辨析
3.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频率分布表、频率分布直方图等.
(2)频率分布直方图的制作步骤
a.求极差.极差为一组数据中最大值与最小值的⑥ 差 .
b.决定组距与组数.当样本量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
c.将数据分组.使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.
d.列频率分布表.计算各小组的频率,作出频率分布表.
e.画频率分布直方图.在频率分布直方图中,纵轴表示⑦ 频率组距 .
1.下列说法正确的是( D )
A.从无限多个个体中抽取100个个体作为样本是简单随机抽样
B.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛是简单随机抽样
C.从某厂生产的5 000件产品中抽取600件进行质量检验,可用抽签法
D.某校有2 000名学生,其中高一年级700人,高二年级600人,高三年级700人,现从中抽取20人了解学生在校学习压力的情况,可用分层随机抽样的方法抽取
解析 A选项,不是简单随机抽样,因为题中被抽取的总体中的个体数是无限的,而不是有限的;B选项,不是简单随机抽样,个子最高的5名同学是确定的,不是等可能抽样;C选项是简单随机抽样,但总体中的个体数太多,不宜采用抽签法;D选项,三个年级的学生个体差异比较明显,所以适用分层随机抽样.
2.某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆.为检验该公司这三种型号轿车的质量,公司质检部要抽取57辆进行检验,则下列说法错误的是( B )
A.应采用分层随机抽样的方法抽取
B.应采用简单随机抽样抽取
C.三种型号的轿车依次应抽取9辆,36辆,12辆
D.这三种型号的轿车,每一辆被抽到的可能性相等
解析 由题知,该公司质检部要对三种型号的轿车抽取57辆进行检验,所以该检验应采用分层随机抽样的方法,故选项A正确,选项B错误.对于选项C,1 500+6 000+2 000=9 500(辆),所以三种型号的轿车依次应抽取57×15009500=9(辆),57×60009500=36(辆),57×20009500=12(辆),故选项C正确.对于选项D,分层随机抽样中每一辆轿车被抽到的可能性相等,故选项D正确.故选B.
3.中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按11∶7∶2的比例录取,若某年会试录取人数为100,则中卷录取人数为( A )
A.10B.35C.55D.75
解析 由题意知,会试录取人数为100,则中卷录取人数为100×211+7+2=10.
4.[教材改编]某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a= 0.030 .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 3 .
解析 因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(求频率之和时,切勿忘记乘以组距)
由频率分布直方图可知,身高在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10.
所以从身高在[140,150]内的学生中选取的人数应为1060×18=3.(抽样比=身高在[140,150]内的人数身高在[120,130),[130,140),[140,150]三组内的总人数)
研透高考 明确方向
命题点1 随机抽样
角度1 简单随机抽样
例1 (1)下列抽取样本的方式属于简单随机抽样的是( B )
A.从平面直角坐标系中抽取5个点作为样本
B.盒子里共有80个零件,从中抽取5个零件进行质量检验.在抽样时,从中任意拿出一个零件进行质量检验后不再把它放回盒子里
C.从20件玩具中一次性抽取3件进行质量检验
D.某班有50名学生,指定数学成绩排名前三的3名学生参加学校组织的数学竞赛
解析 A不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的.B是简单随机抽样.C不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取.D不是简单随机抽样,因为不是等可能抽样.
(2)设某总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从下面随机数表第1行第5列的数字开始,从左到右依次选取两个数字,则选出来的第5个个体编号为 03 .
解析 由题意得,选出来的这5个个体的编号依次是07,17,16,19,03,所以选出来的第5个个体编号为03.
方法技巧
(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③等可能抽取.
(2)用随机数法选取样本时,要剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要个数.
角度2 分层随机抽样
例2 (1)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层随机抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于( D )
A.12B.18C.24D.36
解析 根据分层随机抽样方法知n960+480=24960,解得n=36.
(2)某口罩厂的三个车间在一个小时内共生产3 600个口罩,在出厂前要检查这批口罩的质量,现决定采用分层随机抽样的方法进行抽取,若从第一、二、三车间抽取的口罩个数分别为a,b,c,且a,b,c成等差数列,则第二车间生产的口罩个数为( C )
A.800 B.1 000C.1 200 D.1 500
解析 因为a,b,c成等差数列,所以a+c=2b,则第二车间生产的口罩个数为3 600×ba+b+c=3 600×b3b=1 200,故选C.
方法技巧
(1)在比例分配的分层随机抽样中,抽样比=样本容量总体容量=各层样本容量各层个体总量.
(2)总体中各层的个体数之比等于样本中相应的各层抽取的样本量之比.
训练1 (1)“夸父一号”的成功发射,实现了我国天基太阳探测卫星跨越式突破,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学按01,02,…,30进行编号,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列的数字开始,由左到右依次选取两个数字,则选取的第5位同学的编号为( C )
45 67 32 12 12 31 07 01 08 52 13 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.23B.20C.13D.12
解析 依次从随机数表中选取的有效编号为12,07,01,08,13,故选取的第5位同学的编号为13.故选C.
(2)[多选]已知某地区有小学生120 000人,初中生75 000人,高中生55 000人,当地教育部门为了解本地区中小学生的近视率,按小学生、初中生、高中生进行分层随机抽样,抽取一个容量为2 000的样本,得到小学生、初中生、高中生的近视率分别为30%,70%,80%.下列说法中正确的有( ABD )
A.从高中生中抽取了440人
B.每名学生被抽到的概率为1125
C.估计该地区中小学生总体的平均近视率为60%
D.估计高中生的近视人数为44 000
解析 由题意,得每名学生被抽到的概率为2000120000+75000+55000=1125,故B正确;从高中生中抽取了55 000×1125=440(人),故A正确;估计高中生的近视人数为55 000×80%=44 000,故D正确;学生总人数为250 000人,小学生占比为120000250000=48%,同理,初中生、高中生占比分别为30%,22%,在容量为2 000的样本中,小学生、初中生和高中生分别有960人、600人和440人,则近视人数为960×30%+600×70%+440×80%=1 060,所以估计该地区中小学生总体的平均近视率为10602000=53%,故C错误.
命题点2 统计图表
角度1 条形图、扇形(饼)图、折线图
例3 (1)[2023四川南充模拟]下图是甲、乙两人高考前10次数学模拟成绩的折线图,则下列说法错误的是( C )
A.甲的数学成绩最后3次逐渐升高
B.甲的数学成绩在130分及以上的次数多于乙的数学成绩在130分及以上的次数
C.甲有5次考试成绩比乙高
D.甲数学成绩的极差小于乙数学成绩的极差
解析 对于A,由题图可知甲的最后三次数学成绩逐渐升高,故A说法正确.对于B,甲的数学成绩在130分及以上的次数为6,乙的数学成绩在130分及以上的次数为5,故B说法正确.对于C,甲有7次考试成绩比乙高,故C说法错误.对于D,由题图可知,甲、乙两人的数学成绩的最高成绩相同,甲的最低成绩为120分,乙的最低成绩为110分,因此甲的数学成绩的极差小于乙的数学成绩的极差,D说法正确.故选C.
(2)[多选/2023济南市模拟]某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知参加无人机社团和参加数学建模社团的学生人数相等,下列说法正确的是( AC )
A.高一年级学生人数为120
B.参加无人机社团的学生人数为17
C.若按比例分层随机抽样从各社团抽取20人,则从无人机社团抽取的学生人数为3
D.若甲、乙、丙三人报名参加社团,则共有60种不同的报名方法
解析 由题中统计图可知,参加民族舞社团的学生人数为12,占高一年级学生人数的10%,所以高一年级学生人数为12÷10%=120,所以参加英文剧场社团的学生人数为120×35%=42,又参加辩论社团的学生人数为30,所以参加无人机社团的学生人数等于参加数学建模社团的学生人数等于(120-42-30-12)÷2=18,故A正确,B不正确.若按分层随机抽样从各社团抽取20人,则从无人机社团抽取的学生人数为20×18120=3,C正确.若甲、乙、丙三人报名参加社团,则每人有5种选法,共有53=125(种)不同的报名方法,故D不正确.综上所述,选AC.
方法技巧
统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和频率分布直方图:直观描述不同类别或分组数据的频数和频率.
角度2 频率分布直方图
例4 [2023长沙雅礼中学模拟]某学校为了调查学生一周在生活方面的支出(单位:元)情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法不正确的是( A )
A.样本中支出在[50,60]内的频率为0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则约有600人支出在[50,60]内
解析 设[50,60]对应小长方形的高为x,则(0.01+0.024+0.036+x)×10=1,解得x=0.03,所以样本中支出在[50,60]内的频率为0.03×10=0.3,A选项错误.n=600.3=200,C选项正确.
样本中支出不少于40元的人数为200×(0.036+0.03)×10=132,B选项正确.该校有2 000名学生,则约有2 000×0.3=600(人)支出在[50,60]内,D选项正确.故选A.
方法技巧
与频率分布直方图相关的结论
(1)频率分布直方图中各小长方形的面积之和为1.
(2)频率分布直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即该组小长方形的面积.
(3)频率分布直方图中每组样本的频数为频率×总数.
训练2 (1)[2023陕西省宝鸡市质检]某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了1 000名学生,他们的身高都在A,B,C,D,E五个层次内,分男、女生统计得到如下图所示的样本分布统计图,则( B )
A.样本中A层次的女生比相应层次的男生人数多
B.估计样本中男生身高的中位数比女生身高的中位数大
C.D层次的女生和E层次的男生在整个样本中的频率相等
D.样本中B层次的学生人数和C层次的学生人数一样多
解析 设样本中女生有y人,则男生有(1 000-y)人,设女生身高频率分布直方图中的组距为t,由(a+1.5a+2a+2.5a+3a)t=1,所以at=0.1,所以女生身高频率分布直方图中A层次频率为0.2,B层次频率为0.3,C层次频率为0.25,D层次频率为0.15,E层次频率为0.1,所以样本中A层次的女生人数为0.2y,男生人数为0.1(1 000-y),由于y的取值未知,所以无法比较A层次中男、女生人数,A错误;
D层次女生在女生样本中频率为0.15,所以在整个样本中频率为0.15y1000,E层次男生在男生样本中频率为0.15,所以在整个样本中频率为0.15(1000-y)1000,由于y的取值未知,所以无法比较D层次的女生和E层次的男生在整个样本中的频率,C错误;
样本中B层次的学生数为0.3y+0.25(1 000-y)=250+0.05y,
样本中C层次的学生数为0.25y+0.3(1 000-y)=300-0.05y,
由于y的取值未知,所以250+0.05y与300-0.05y可能不相等,D错误;
女生中A,B两个层次的频率之和为0.5,所以女生的样本身高中位数为B,C层次的分界点,而男生A,B两个层次的频率之和为0.35,A,B,C三个层次的频率之和为0.65,显然中位数落在C层次内,所以样本中男生身高的中位数比女生身高的中位数大,B正确.故选B.
(2)[多选/2023南京市、盐城市二模]新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.图1,图2分别是2017年至2022年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则( BCD )
图1
图2
A.2017—2022年我国新能源汽车年产量逐年增加
B.2017—2022年我国新能源汽车年产量的极差为626.4万辆
C.2022年我国汽车年总产量超过2 700万辆
D.2019年我国汽车年总产量低于2018年我国汽车年总产量
解析 对于选项A,题图1中2019年新能源汽车年产量低于2018年新能源汽车年产量,A错误;对于选项B,极差为705.8-79.4=626.4(万辆),B正确;对于选项C,2022年我国汽车年总产量为705.8÷25.6%≈2 757(万辆),C正确;对于选项D,2019年我国汽车年总产量为124.2÷4.8%≈2 588(万辆),2018年我国汽车年总产量为127÷4.5%≈2 822(万辆),D正确.故选BCD.课标要求
命题点
五年考情
命题分析预测
1.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法与随机数法.会计算样本均值和样本方差,了解样本与总体的关系.
2.了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.掌握分层随机抽样的样本均值和样本方差.
3.能根据实际问题的特点,设计恰当的抽样方法解决问题.
4.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
随机抽样
2023新高考卷ⅡT3;2020全国卷ⅡT18
本讲为高考的命题热点,主要考查:(1)分层随机抽样,题型以选择题和填空题为主,属于中低档题;(2)统计图表的应用,着重考查频率分布表、频率分布直方图、条形图、折线图等,单独命题时以小题形式出现,与其他知识综合命题时常作为问题情境出现在解答题中.预计2025年高考命题趋势变化不大,重点在情境的创新.
统计图表
2023新高考卷ⅡT19;2022新高考卷ⅡT19;2020新高考卷ⅡT9;2019全国卷ⅢT17
抽样方法
共同点
各自特点
相互联系
适用范围
简单随机抽样
(1)抽样过程中每个个体被抽到的机会均等;
(2)都是不放回抽样.
从总体中逐个抽取.
分层随机抽样在各层抽样时可采用简单随机抽样.
样本容量较小.
分层随机抽样
将总体分成互不交叉的层,分层进行抽取.
总体可以分层,层与层之间有明显区别,而层内个体间差异较小.
1818
0792
4544
1716
5807
7983
8619
6216
7650
0310
5523
6405
0526
6238
2024年高考数学重难点突破讲义:学案 第1讲 数据分析——成对数据的统计分析: 这是一份2024年高考数学重难点突破讲义:学案 第1讲 数据分析——成对数据的统计分析,共12页。
备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共11页。
备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第2讲用样本估计总体: 这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第2讲用样本估计总体,共10页。