2025届高考数学一轮总复习第十章统计与成对数据的统计分析第一节统计课件
展开知识梳理1.简单随机抽样(1)定义:一般地,设一个总体含有 个体,从中 抽取n(1≤n
2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个 ,每个个体属于且 一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的 合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为 .
分成的各层互 不重叠
微思考简单随机抽样与分层随机抽样有什么共同点和联系?
提示 两种抽样方法的共同点、联系及适用范围
3.频率分布直方图为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,应以横轴表示分组、纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.
每个小长方形的面积表示样本落在该组内的频率
微点拨1.极差为一组数据中最大值与最小值的差.2.所有小长方形的面积和等于1.
4.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中 的数据小于或等于这个值,且至少有 的数据大于或等于这个值. (2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
微点拨1.第0百分位数为数据中的最小数,第100百分位数为数据中的最大数;2.一组数据的百分位数既可能是这组数据中的数,也可能不是这组数据中的数;3.一组数据的某些百分位数可能是同一个数.
5.样本的数字特征(1)众数一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
不一定唯一,一定是这组数据中的数
(2)中位数一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
唯一,不一定是这组数据中的数
(3)平均数一组数据的和与这组数据的个数的商称为这组数据的平均数.数据x1,x2,…,xn的平均数为
(4)方差与标准差如果有n个数据x1,x2,…,xn,那么
微思考平均数、标准差与方差反映了数据的哪些特征?
提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据的离散程度或波动幅度,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
常用结论1.在频率分布直方图中:(1)最高的小矩形底边中点的横坐标即是众数;(2)中位数左边和右边的所有小矩形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
2.平均数、方差的推广(1)若数据x1,x2,…,xn的平均数为 ,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m +a.(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
对点演练1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.( ) (2)在分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( )(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
2.(多选)某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成扇形图.现从这些同学中抽出100人进一步调查,已知小张为理学专业,小李为工学专业,则下列说法正确的是( )
A.若按专业类型进行分层随机抽样,则小张被抽到的可能性比小李大B.若按专业类型进行分层随机抽样,则理学专业和工学专业应分别抽取30人和20人C.采用分层随机抽样比简单随机抽样更合理D.该问题中的样本容量为100
3.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示,则这次测试数学成绩的众数为 ,这次测试数学成绩的中位数为 (精确到0.1),这次测试数学成绩的平均数为 .
答案 75 73.3 72
例1.(1)(多选)(2023山西临汾一模)某学生社团有男生32名,女生24名,从中随机抽取一个容量为7的样本,某次抽样结果为:抽到3名男生和4名女生,则下列说法正确的是( )A.这次抽样可能采用的是抽签法B.这次抽样不可能是按性别分层随机抽样C.这次抽样中,每个男生被抽到的概率一定小于每个女生被抽到的概率D.这次抽样中,每个男生被抽到的概率不可能等于每个女生被抽到的概率
(2)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )A.10D.20
(3)某单位有青年职工160人,中年职工人数是老年职工人数的3倍,老年、中年、青年职工共有440人,为了解职工身体状况,现采用分层随机抽样的方法进行调查,在抽取的样本中有青年职工64人,则该样本中的老年职工的人数为 .
答案 (1) AB (2)B (3)28
(2)从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09.故选B.
解析(1)根据抽样结果,此次抽样可能采用的是抽签法,A正确;若按分层随机抽样,则抽得男生4人,女生3人,所以这次抽样不可能是按性别分层随机抽样,B正确;在随机抽样中,每个男生和每个女生被抽到的概率是相等的,C,D错误.故选AB.
(3)设该单位老年职工的人数为x,则中年职工的人数为3x,则160+x+3x=440,解得x=70,则该单位老年职工的人数为70,中年职工的人数为210,青年职工的人数为160,则按照分层随机抽样的方法,抽取青年职工64人,则抽到的老
名师点析1.应用随机数法的两个关键点:
2.进行分层随机抽样的相关计算时,常用到的两个关系:
对点训练1(1)某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39.现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为( )90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 1805 98 90 07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32A.07B.40C.35D.23
(2)(2023广西玉林二模)某市市场监督管理局组织开展市级食品安全监督抽检,涉及粮食加工品(252批次)、食用油(240批次)、调味品(180批次)、乳制品(198批次)等20类食品(共2 712批次),要从这2 712批次食品中按照品类分层抽检452批次样品,则乳制品类要被抽检 批次样品.
答案 (1)D (2) 33
解析 (1)重复的号码只能算作一个,抽取样本号码是24,36,38,07,35,23,18,05,20,15,所以抽取样本的第6个号码为23.
考向1.频率分布直方图典例突破例2.某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
方法总结频率分布直方图的两个关系式
对点训练2某公司计划招收500名新员工,共报名了2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用简单随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如下:则录取分数线可估计为( )A.70.5D.77.5
考向2.扇形图典例突破例3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的扇形图:
则下面结论不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A 解析 (方法1)设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由扇形图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.(方法2)因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
名师点析扇形图可以很清楚地表示出各部分数量同总数之间的关系.
对点训练3(多选)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2 000名同学,每名同学依据自己兴趣爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则( )A.这五个社团的总人数为100B.脱口秀社团的人数占五个社团总人数的20%C.这五个社团总人数占该校学生人数的4%D.从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为40%
解析 参加朗诵社团的同学有8名,该社团人数占比为10%,故社团总人数为80,故A错误;合唱团人数为80×30%=24,舞蹈社团人数为80×25%=20,故脱口秀社团的人数为80-24-12-20-8=16,故脱口秀社团的人数占五个社团
人数占五个社团总人数的25%,因此这两个社团人数占五个社团总人数的45%,故从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为45%,D错误.故选BC.
考向3.条形图与折线图典例突破例4.人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.截至目前,我国共进行了七次人口普查,下图是这七次普查的全国人口及年均增长率情况,下列说法正确的是( )
A.年均增长率逐次减小B.年均增长率的极差是1.08%C.这七次普查的人口数逐次增加,且第四次增幅最小D.第七次普查的人口数最多,且第三次增幅最大
答案 D 解析 对于A,由图可知第三次增幅最大,之后增幅减小,所以年增长率是先增后减的,故A错误;对于B,极差为2.09%-0.53%=1.56%,故B错误;对于C,第七次增幅最小,故C错误;对于D,第七次普查的人口数最多,且第三次增幅最大,故D正确.故选D.
名师点析折线图反映了事件的发展趋势,条形图反映了样本的数量分配.注意两种图形的转化.
对点训练4电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位.目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电, 2020年各电力子行业发电量及增幅的统计图如图所示,下列说法错误的是( )
2020年各电力子行业发电量及增幅
A.火电发电量大约占全行业发电量的71%B.在火电、水电、风电、核电、太阳能发电中,比上一年增幅最大的是风电C.火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D.以上可再生能源发电量的增幅均大于全行业整体增幅
对于B,由题图可知风电增幅10.50%,是最大增幅,故B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.28-0.14=5.14,故C错误;对于D,全行业整体发电量增幅为2.7%,而可再生能源发电量的增幅中,增幅最低的水电发电量为5.30%,即可再生能源发电量的增幅均大于全行业整体增幅,故D正确.故选C.
例5.(1)(多选)(2023新高考Ⅰ,9)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
(2)(2023全国乙,理17)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为 ,样本方差为s2.
解析对于选项A,如1,2,2,2,2,5的平均数不等于2,2,2,2的平均数,故A错误;对于选项B,不妨设x2≤x3≤x4≤x5,x2,x3,x4,x5的中位数为 ,x1,x2,…,x6的中位数为 ,故B正确;对于选项C,因为x1是最小值,x6是最大值,所以x1,x2,…,x6的数据波动更大,故C错误;对于选项D,不妨设x2≤x3≤x4≤x5,则x1≤x2≤x3≤x4≤x5≤x6,所以x5-x2≤x6-x1,故D正确.故选BD.
(2)解①∵zi=xi-yi,∴z1=9,z2=6,z3=8,z4=-8,z5=15,z6=11,z7=19,z8=18,z9=20,z10=12,
方法总结频率分布直方图中第p百分位数的计算步骤
对点训练5(1)高一某班30名学生的一次数学考试成绩按从小到大排序结果如下:51 54 59 60 64 68 68 70 71 7272 74 75 76 79 80 80 81 82 8385 87 88 90 91 92 93 95 98 100则估计这次数学考试成绩的第75百分位数为( )A.87B.88C.90D.87.5
(2)某校组织学生参与航天知识竞答活动,某班8名同学成绩如下: 7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是 (写出一个满足条件的m值即可).
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。
适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第3节成对数据的统计分析课件新人教A版: 这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第3节成对数据的统计分析课件新人教A版,共52页。PPT课件主要包含了强基础固本增分,研考点精准突破,目录索引,样本相关系数,正相关,负相关,2经验回归方程,2独立性检验,参考数据等内容,欢迎下载使用。
高考数学一轮总复习课件第8章统计与统计分析第3讲成对数据的统计分析(含解析): 这是一份高考数学一轮总复习课件第8章统计与统计分析第3讲成对数据的统计分析(含解析),共60页。PPT课件主要包含了回归分析,独立性检验,12×2列联表,2独立性检验,名师点睛,题组一,走出误区,答案1√,2√3×,题组二等内容,欢迎下载使用。