所属成套资源:全套高考数学一轮复习课时学案
高考数学一轮复习第10章第2课时用样本估计总体学案
展开
这是一份高考数学一轮复习第10章第2课时用样本估计总体学案,共29页。
2.能用数字特征估计总体集中趋势和总体离散程度.
3.掌握分层随机抽样的样本方差.
1.总体百分位数的估计
(1)百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算i=n×p%;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
①25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
②第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.
2.总体集中趋势的估计
3.总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用x表示这组数据的平均数,称1ni=1nxi-x2
为这组数据的方差,也可以写成1ni=1nxi2-x2的形式;称1ni=1nxi-x2为这组数据的标准差.
(2)总体方差和标准差
①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=1Ni=1NYi-Y2.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=1Ni=1kfiYi-Y2.
总体标准差:S=S2.
(3)样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为y,则称s2=1ni=1nyi-y2为样本方差,s=s2为样本标准差.
(4)分层随机抽样的方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w,样本方差为s2.
以分两层抽样的情况为例,假设第一层有m个数,平均数为x,方差为s12;第二层有n个数,平均数为y,方差为s22,则总的样本均值w=mm+nx+nm+ny;总的样本方差s2=mm+n{m[s12+(x-w)2]+n[s22)+(y-w)2]}.
[常用结论]
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
一、易错易混辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)任何一组数据的第50百分位数与中位数的值是相同的.( )
[答案] (1)√ (2)× (3)√ (4)√
二、教材习题衍生
1.(人教A版必修第二册P204探究改编)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在如图两种分布形态中,a,b,c,d分别对应平均数和中位数之一,则可能的对应关系是( )
A.a为中位数,b为平均数,c为平均数,d为中位数
B.a为平均数,b为中位数,c为平均数,d为中位数
C.a为中位数,b为平均数,c为中位数,d为平均数
D.a为平均数,b为中位数,c为中位数,d为平均数
A [在频率分布直方图中,中位数两侧小矩形的面积和相等,平均数可以用每个小矩形底边中点的横坐标与小矩形的面积之和近似代替,结合两个频率分布直方图得: a为中位数,b为平均数,c为平均数,d为中位数.故选A.]
2.(人教A版必修第二册P203练习T2改编)某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是________.
13.7,14.7,15.3 [将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即13.6+13.82=13.7;
由i=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即14.6+14.82=14.7;
由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即15.2+15.42=15.3.]
3.(人教A版必修第二册P213练习T2改编)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
48 4 [设该组数据为x1,x2,…,xn,
则新数据为x1+20,x2+20,…,xn+20,记新数据的平均数为x′,
因为x=x1+x2+…+xnn=28,
所以x′=x1+20+x2+20+…+xn+20n=20+28=48.
因为s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],
所以s′2=1n{[x1+20-(x+20)]2+[x2+20-(x+20)]2+…+[xn+20-(x+20)]2}=s2=4.]
4.(人教A版必修第二册P212例6改编)为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为________,样本方差为________.
90.2 4.76 [样本均值a=12×91+8×8912+8=90.2,样本方差s2=12×3+91-90.22+8×5+89-90.2212+8=4.76.]
考点一 总体百分位数的估计
[典例1] (1)(2023·福建福州模拟)某中学高一年级10位女生的身高(单位:cm)数据为148,155,157,159,162,163,164,165,170,172,则数据的第50,75百分位数分别为( )
A.162,165 B.162.5,164.5
C.162,164.5 D.162.5,165
(2)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是________.(结果保留两位小数)
(1)D (2)124.44 [(1)由题意,该数据已经从小到大排列,10×50%=5,10×75%=7.5,∴第50百分位数为162+1632=162.5 ,第75百分位数为165.故选D.
(2)由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,
因此,80%分位数一定位于[120,130)内.
因为120+0.80-×10≈124.44,
所以此班的模拟考试成绩的80%分位数约为124.44.]
【教师备选题】
已知100个数据的第75百分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
C [因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其它选项均不正确,故选C.]
1.计算一组n个数据的第p百分位数的一般步骤
2.频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+p%-fa%f%-fa%×(b-a).
[跟进训练]
1.(1)数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.4.5,+∞ B.4.5,6.6
C.4.5,+∞ D.4.5,6.6
(2)(2023·天津南开中学模拟)为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了该地区1 000名学生每天进行体育运动的时间,按照时长(单位:分钟)分成6组:第一组30,40,第二组40,50,第三组50,60,第四组60,70,第五组70,80,第六组80,90,经整理得到如图所示的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为( )
A.42.5分钟 B.45.5分钟
C.47.5分钟 D.50分钟
(1)A (2)C [(1)因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,所以应有5个数不大于4.5,则x≥4.5.故选A.
(2)由10×0.01=0.10.25,
故第25百分位数位于40,50内,
则第25百分位数为40+0.25-×10=47.5,
可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.故选C.]
考点二 总体集中趋势的估计
[典例2] 某社区组织了垃圾分类知识竞赛活动,从所有参赛选手中随机抽取20人,将他们的得分按照[0,20],(20,40],(40,60],(60,80],(80,100]分组,绘成频率分布直方图(如图).
(1)求x的值;
(2)分别求出抽取的20人中得分落在0,20和20,40内的人数;
(3)估计所有参赛选手得分的平均数、中位数和众数.
[解] (1)由频率分布直方图的性质得:
(0.005 0+0.007 5+x+0.012 5+0.015 0)×20=1,
解得x=0.010 0.
(2)由频率分布直方图能求出:
得分落在0,20内的人数为:20×0.005 0×20=2,
得分落在20,40内的人数为:20×0.007 5×20=3.
(3)估计所有参赛选手得分的平均数为:
0.005 0×20×10+0.007 5×20×30+0.015 0×20×50+0.012 5×20×70+0.010 0×20×90=56.
设所有参赛选手得分的中位数为a,
则0.005 0×20+0.007 5×20+0.015 0×(a-40)=0.5,
解得a=1703,
所有参赛选手得分的众数估计值为40+602=50.
【教师备选题】
(1)已知样本x1,x2,…,xn的平均数为x,样本y1,y2,…,ym的平均数为y(x≠y).若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0
相关学案
这是一份2024届高考数学一轮复习第9章第2节用样本估计总体学案,共27页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动经验等内容,欢迎下载使用。
这是一份高考数学一轮复习第9章第2节用样本估计总体学案,共16页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动经验等内容,欢迎下载使用。
这是一份高考数学统考一轮复习第11章11.4用样本估计总体学案,共10页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。