2023年高考数学人教A版(2019)大一轮复习--10.1 统计(课件)
展开知识梳理1.简单随机抽样(1)定义:一般地,设一个总体含有 个体,从中 抽取n(1≤n
2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个 ,每个个体属于且 一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的 合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为 .
分成的各层互 不重叠
微思考简单随机抽样与分层随机抽样有什么共同点和联系?
提示 两种抽样方法的共同点、联系及适用范围
3.频率分布直方图为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,应以横轴表示分组、纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.
每个小长方形的面积表示样本落在该组内的频率
微点拨1.极差为一组数据中最大值与最小值的差.2.所有小长方形的面积和等于1.
4.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中 的数据小于或等于这个值,且至少有 的数据大于或等于这个值. (2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
微点拨1.第0百分位数为数据中的最小数,第100百分位数为数据中的最大数;2.一组数据的百分位数既可能是这组数据中的数,也可能不是这组数据中的数;3.一组数据的某些百分位数可能是同一个数.
5.样本的数字特征(1)众数一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
不一定唯一,一定是这组数据中的数
(2)中位数一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
唯一,不一定是这组数据中的数
(3)平均数一组数据的和与这组数据的个数的商称为这组数据的平均数.数据x1,x2,…,xn的平均数为
(4)方差与标准差如果有n个数据x1,x2,…,xn,那么
微思考平均数、标准差与方差反映了数据的哪些特征?
提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据的离散程度或波动幅度,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
常用结论1.在频率分布直方图中:(1)最高的小矩形底边中点的横坐标即是众数;(2)中位数左边和右边的所有小矩形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
2.平均数、方差的推广(1)若数据x1,x2,…,xn的平均数为 ,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m +a.(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
对点演练1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.( ) (2)在分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( )(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
2.某学校有教师100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,从低到高各年龄段分别抽取的人数为( )A.7,5,8B.9,5,6C.6,5,9D.8,5,7
3.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示,则这次测试数学成绩的众数为 ,这次测试数学成绩的中位数为 (精确到0.1),这次测试数学成绩的平均数为 .
答案 75 73.3 72
典例突破例1.(1)现用简单随机抽样的方法检测某品牌冰淇淋是否符合食品安全标准,若从21个冰淇淋中逐个抽取,组成一个容量为3的样本,则其中某一个体A“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
(2)(2021广东惠州一模)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )A.10D.20
(3)(2021北京中关村中学)某单位有青年职工160人,中年职工人数是老年职工人数的3倍,老年、中年、青年职工共有440人,为了解职工身体状况,现采用分层随机抽样的方法进行调查,在抽取的样本中有青年职工64人,则该样本中的老年职工的人数为 .
答案 (1)B (2)B (3)28
解析 (1)在抽样过程中,个体A每一次被抽中的概率是相等的,因为总容量为21,故个体A“第一次被抽到”的可能性与“第二次被抽到”的可能性均为 .故选B.(2)从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09.故选B.
(3)设该单位老年职工的人数为x,则中年职工的人数为3x,则160+x+3x=440,解得x=70,则该单位老年职工的人数为70,中年职工的人数为210,青年职工的人数为160,则按照分层随机抽样的方法,抽取青年职工64人,则抽到的老年职工的
名师点析1.应用随机数法的两个关键点:
2.进行分层随机抽样的相关计算时,常用到的两个关系:
对点训练1(1)(2021河南安阳一模)某中学举行了演讲比赛,若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.12B.20 C.29D.23(2)(2021天津河东二模)某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层随机抽样的方法从该校这四个专业共抽取40名学生进行调查,则应在丙专业抽取的学生人数为 .
答案 (1)C (2)16
解析 (1)依次从表中读出的有效编号为12,02,01,04,15,20,29,得到选出来的第7个个体的编号为29.故选C.(2)因为高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,所以这四个专业共有学生1 000名.因为用分层随机抽样的方法从该校四个专业共抽取40名学生进行调查,所以每个个体被抽到的概率是
考向1.频率分布直方图典例突破例2.某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
方法总结频率分布直方图的两个关系式
对点训练2(2021安徽宣城模拟)某公司计划招收500名新员工,共报名了2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用简单随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如下:则录取分数线可估计为( )A.70.5D.77.5
考向2.扇形图典例突破例3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的扇形图:
则下面结论不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A 解析 (方法1)设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由扇形图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.(方法2)因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
名师点析扇形图可以很清楚地表示出各部分数量同总数之间的关系.
对点训练3如图给出的是某小区居民一段时间内访问网站的扇形图,则下列选项中不超过21%的为( )
A.网站A与网站c的访问量所占比例之和B.网站B与网站b的访问量所占比例之和C.网站D与网站f的访问量所占比例之和D.网站C与网站e的访问量所占比例之和
答案 A 解析 由访问网站的扇形图得,网站A与网站c的访问量所占比例之和为18%,不超过21%;网站B和网站b的访问量所占比例之和为23%,超过21%;网站D与网站f的访问量所占比例之和为22%,超过21%;网站C与网站e的访问量所占比例之和为22%,超过21%.故选A.
考向3.条形图与折线图典例突破例4.(2021山东烟台二中三模)人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.截至目前,我国共进行了七次人口普查,下图是这七次普查的全国人口及年均增长率情况,下列说法正确的是( )
A.年均增长率逐次减小B.年均增长率的极差是1.08%C.这七次普查的人口数逐次增加,且第四次增幅最小D.第七次普查的人口数最多,且第三次增幅最大
答案 D 解析 对于A,由图可知第三次增幅最大,之后增幅减小,所以年增长率是先增后减的,故A错误;对于B,极差为2.09%-0.53%=1.56%,故B错误;对于C,第七次增幅最小,故C错误;对于D,第七次普查的人口数最多,且第三次增幅最大,故D正确.故选D.
名师点析折线图反映了事件的发展趋势,条形图反映了样本的数量分配.注意两种图形的转化.
对点训练4(2021河南郑州模拟)电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位.目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电,如图所示的是2020年各电力子行业发电量及增幅的统计图,下列说法错误的是( )
2020年各电力子行业发电量及增幅
A.火电发电量大约占全行业发电量的71%B.在火电、水电、风电、核电、太阳能发电中,比上一年增幅最大的是风电C.火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D.以上可再生能源发电量的增幅均大于全行业整体增幅
对于B,由题图可知风电增幅10.50%,是最大增幅,故B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.28-0.14=5.14,故C错误;对于D,全行业整体发电量增幅为2.7%,而可再生能源发电量的增幅中,增幅最低的水电发电量为5.30%,即可再生能源发电量的增幅均大于全行业整体增幅,故D正确.故选C.
典例突破例5.(1)(2021北京汇文中学模拟)对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件的寿命的65%分位数约为( )
(2)(2021全国乙,理17)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
故可以估计这一批电子元件的寿命的65%分位数约为450.故选B.
方法总结频率分布直方图中第p百分位数的计算步骤
对点训练5(1)(2021河北石家庄月考)高一某班30名学生的一次数学考试成绩按从小到大排序结果如下:51 54 59 60 64 68 68 70 71 7272 74 75 76 79 80 80 81 82 8385 87 88 90 91 92 93 95 98 100则估计这次数学考试成绩的第75百分位数为( )A.87B.88C.90D.87.5(2)(2021山东淄博二模)某班40名学生,在一次考试中统计所得平均分为80分,方差为70,后来发现有两名同学的成绩有损,甲实得80分错记为60分,乙实得70分错记为90分,则更正后的方差为 .
答案 (1)B (2)60
解析 (1)由30×75%=22.5,可知样本的第75百分位数为第23项数据,据此估计这次数学考试成绩的第75百分位数为88.故选B.(2)因为甲实得80分,记为60分,少记20分,乙实得70分,记为90分,多记20分,所以总分没有变化,因此更正前后的平均分没有变化,都是80分.设甲、乙以外的其他同学的成绩分别为a3,a4,…,a40,
2023年高考数学人教A版(2019)大一轮复习--1.1 集合(课件): 这是一份2023年高考数学人教A版(2019)大一轮复习--1.1 集合(课件),共39页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,确定性,无序性,列举法,描述法,任意一个元素,A⊆B或B⊇A,A⫋B或B⫌A等内容,欢迎下载使用。
2023年高考数学人教A版(2019)大一轮复习--10.2 成对数据的统计分析(课件): 这是一份2023年高考数学人教A版(2019)大一轮复习--10.2 成对数据的统计分析(课件),共60页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,样本相关系数,2经验回归方程,2独立性检验,答案C等内容,欢迎下载使用。
2023年高考数学人教A版(2019)大一轮复习--9.5 椭圆(课件): 这是一份2023年高考数学人教A版(2019)大一轮复习--9.5 椭圆(课件),共53页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,半焦距,焦点跟着分母大的跑,-a≤x≤a,-b≤y≤b,-b≤x≤b,-a≤y≤a,坐标轴等内容,欢迎下载使用。