还剩13页未读,
继续阅读
所属成套资源:2025届高考数学一轮复习教师用书多份(Word附解析)
成套系列资料,整套一键下载
2025届高考数学一轮复习教师用书第十章第二节用样本估计总体讲义(Word附解析)
展开
第二节 用样本估计总体【必备知识·逐点夯实】【知识梳理·归纳】1.总体取值规律的估计(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.2.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.【微点拨】第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.3.总体集中趋势的估计(1)平均数、中位数和众数的应用数值型数据(如用水量、身高、收入、产量等)集中趋势多用平均数、中位数描述;分类型数据(如校服规格、性别、产品质量等级等)集中趋势多用众数描述.(2)平均数、中位数、众数的求法4.总体离散程度的估计(1)方差、标准差的定义:假设一组数据为x1,x2,…,xn,其平均数为x,则方差:s2=或;标准差:s=s2.(2)总体(样本)方差①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=.②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.【基础小题·自测】1.(多维辨析)(多选题)下列结论正确的为 ( )A.对一组数据来说,平均数和中位数总是非常接近B.方差与标准差具有相同的单位C.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变D.在频率分布直方图中,最高的小矩形底边中点的横坐标是众数【解析】选CD.因为一组数据如果出现极端值,其平均数与中位数不会接近,例如:1 000,0,0,0,0,所以选项A错误;因为标准差是方差的算术平方根,其单位不一样,所以选项B错误;因为一组数中每个数减去同一个非零常数,则这组数的平均数改变,每个数与平均数的差值不变,所以方差不变,所以选项C正确;因为在频率分布直方图中,最高的小矩形底边中点的横坐标为众数,所以选项D正确.2.(必修第二册P215练习T2)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为 ( )A.2 B.4 C.6 D.8【解析】选D.根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.3.(必修第二册P203例2)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为 ( )A.88.5 B.89 C.91 D.89.5【解析】选B.7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.4.(统计图识别错误)某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为__________. 【解析】因为初中部女教师占70%,高中部女教师占40%,所以该校女教师的人数为120×0.7+150×0.4=84+60=144.答案:144【核心考点·分类突破】考点一 统计图表的识别[例1](多选题)新式茶饮是指以上等茶叶通过萃取浓缩液,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为我国2022年消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.根据所给统计图,下列结论中正确的是 ( )A.每周都消费新式茶饮的消费者占比不到90%B.每天都消费新式茶饮的消费者占比超过20%C.月均消费新式茶饮50~200元的消费者占比超过50%D.月均消费新式茶饮超过100元的消费者占比超过60%【解析】选BC.每周都消费新式茶饮的消费者占比1-9.1%>90%,A错误;每天都消费新式茶饮的消费者占比5.4%+16.4%>20%,B正确;月均消费新式茶饮50~200元的消费者占比30.5%+25.6%>50%,C正确;月均消费新式茶饮超过100元的消费者占比1-14.5%-30.5%<60%,D错误.【解题技法】统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例;(2)折线图:描述数据随时间的变化趋势;(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.【对点训练】1.已知某地区中小学生的人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本量和该地区的高中生近视人数分别为 ( )A.200,25 B.200,2 500C.8 000,25 D.8 000,2 500【解析】选B.由扇形分布图并结合比例分配的分层随机抽样知识易知样本量为8040%=200,则样本中高中生的人数为200×25%=50,易知该地区高中生人数为501%=5 000,结合近视率条形图得该地区高中生近视的人数为5 000×50%=2 500.2.走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是 ( )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的均值大于乙C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7 030【解析】选D.对于A,这一星期内甲的日步数从小到大为2 435,7 965,9 500,11 600,12 700,16 000,16 800,所以中位数为11 600,选项A正确;对于B,计算甲的平均数为x甲=17×(2 435+7 965+9 500+11 600+12 700+16 000+16 800)=11 000,乙的平均数为x乙=17×(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=10 500,所以甲的日步数的均值大于乙,选项B正确;对于C,甲有极端值,对方差的影响大,所以甲的日步数的方差大于乙,选项C正确;对于D,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10 060,选项D错误.【加练备选】 (2023·丽水模拟)某校高一年级1 000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用比例分配的分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是 ( )A.11 B.22 C.110 D.220【解析】选B.由题图中数据可知高一年级A型血的学生人数占高一年级学生总人数的22%,所以抽取一个容量为100的样本,从A型血的学生中应抽取的人数是100×22%=22.考点二 离散型数据的数字特征[例2](多选题)为宣传杭州亚运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则 ( )A.甲社团宣传次数的众数小于乙社团宣传次数的众数B.甲社团宣传次数的极差大于乙社团宣传次数的极差C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数D.甲社团宣传次数的方差大于乙社团宣传次数的方差【解析】选ABD.观察甲、乙社团每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B正确;甲社团宣传次数的平均数x1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x2=2+2+3+4+3+3+47=3,C不正确;甲社团宣传次数的方差s12=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2]=47,D正确.【解题技法】样本数字特征的求法(1)众数是样本数据中出现次数最多的数据.(2)将样本数据按大小顺序排列,处在最中间位置的一个数据(或最中间两个数据的均值)即为中位数.(3)平均数是样本数据的算术平均数.(4)极差是样本数据中最大值与最小值的差.【对点训练】1.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为( )A.92,85 B.92,88 C.95,88 D.96,85【解析】选B.数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,10×25%=2.5,取第三个数,所以第25百分位数是88.2.(多选题)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:396 275 268 225 168 166 176 173188 168 141 157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是 ( )A.极差 B.中位数 C.众数 D.平均数【解析】选ABD.根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x,加入数据后,平均数为12x+42113>x,发生改变.【加练备选】某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为 ( )A.102 B.103 C.109.5 D.116【解析】选C.这组数据已经按照由小到大的顺序排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5.考点三 频率分布直方图的数字特征[例3](多选题)在某次单元测试中,4 000名考生的考试成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有 ( )A.成绩在[70,80)分的考生人数最多B.考生考试成绩的第80百分位数为83.3C.考生考试成绩的平均分约为70.5分D.考生考试成绩的中位数为75分【解析】选ABC.根据题图得,成绩出现在[70,80)的频率最大,故A正确;考生考试成绩的第80百分位数为80+0.050.15×10≈83.3,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85× 0.15+95×0.1=70.5,故C正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生考试成绩的中位数为70+0.5-0.450.3×10≈71.67,故D错误.【解题技法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.(4)第p百分位数: ①确定第p百分位数所在的区间[a,b],②确定小于a和小于b的数据所占的百分比fa%,fb%,则第p百分位数为a+p%-fa%fb%-fa%×(b-a).【对点训练】治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a的值及众数、中位数;(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?【解析】(1)因为(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1,所以a=0.025 0,众数为185+1952=190,设中位数为x,因为(0.001 5+0.011 0+0.022 5)×10=0.35<0.5,(0.001 5+0.011 0+0.022 5+0.030 0)×10=0.65>0.5,则1852 s12+s2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.【解题技法】计算方差、标准差的步骤(1)求出样本数据的平均数x;(2)计算每个样本数据与样本平均数的差xi-x(i=1,2,…,n),并求对应的平方值;(3)求出上述n个平方值的平均数,即为样本方差;求出上述n个平方值平均数的算术平方根,即为样本标准差.【对点训练】1.(2023·成都模拟)一次数学考试后,某班级平均分为110分,方差为s12.现发现有两名同学的成绩计算有误,甲同学成绩被误判为113分,实际得分为118分;乙同学成绩误判为120分,实际得分为115分.更正后重新计算,得到方差为s22,则s12与s22的大小关系为 ( )A.s12=s22 B.s12>s22 C.s12(118-110)2+(115-110)2,所以s12>s22.2.(多选题)(2021·新高考Ⅱ卷)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有 ( )A. x1,x2,…,xn的标准差B. x1,x2,…,xn的中位数C. x1,x2,…,xn的极差D. x1,x2,…,xn的平均数【解析】选AC.由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数无法度量数据的离散程度;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数无法度量数据的离散程度.【加练备选】1.(2023·天津模拟)已知一组样本数据x1,x2,…,xn(x1
相关资料
更多