所属成套资源:全套人教A版普通高中数学一轮复习课时学案
人教A版普通高中数学一轮复习第九章第二节用样本估计总体学案
展开
这是一份人教A版普通高中数学一轮复习第九章第二节用样本估计总体学案,共25页。
3.结合实例,能够利用样本的集中趋势与离散程度估计总体的集中趋势与离散程度.
自查自测
知识点一 频率分布直方图
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4B.8
C.12D.16
B 解析:设频数为n,则n32=0.25,所以n=32×0.25=8.
2.(教材改编题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为[66,70),[70,74),…,[94,98]八组,并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品的数量是( )
A.20部B.40部
C.64部D.80部
D 解析:由频率分布直方图,可知评分在区间[82,86)内的影视作品的数量为400×0.050×4=80(部).
核心回扣
1.频率分布直方图的画法
第一步:求极差;
第二步:决定组距与组数,组距= ;
第三步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第四步:登记频数,计算频率,列出频率分布表;
第五步:画频率分布直方图.
2.频率分布直方图:反映样本频率分布的直方图.
横轴表示样本数据,纵轴表示极差组数,各小长方形的频率组距表示样本落在该组内的频率.
注意点:
各个小长方形的面积之和等于面积.
自查自测,
知识点二 平均数、众数、中位数、百分位数
1.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
A 解析:因为这组数据由小到大排列为87,89,90,91,92,93,94,96,
所以中位数是91+922=91.5,
平均数x=18×(87+89+90+91+92+93+94+96)=91.5.
2.(多选题)已知某班10名男生引体向上的测试成绩统计如表所示,则下列说法正确的是( )
A.这10名男生引体向上测试成绩的平均数为8.4
B.这10 名男生引体向上测试成绩的第25百分位数为7.5
C.这10名男生引体向上测试成绩的中位数为8.5
D.这10名男生引体向上测试成绩的众数为9
ACD 解析:对于A,这10名男生引体向上测试成绩的平均数为10+4×9+3×8+2×710=8.4,所以A正确;
对于B,将这10名男生引体向上的测试成绩按从小到大的顺序排序得7,7,8,8,8,9,9,9,9,10,又10×25%=2.5,则第25百分位数是第3个数,即为8,所以B错误;
对于C,这10名男生引体向上测试成绩的中位数为9+82=8.5,所以C正确;
对于D,这10名男生引体向上测试成绩的众数为9,所以D正确.
核心回扣
1.中位数:将一组数据按大小的顺序依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
2.众数:一组数据中出现次数最多的数据称为这组数据的众数.
3.平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数 x=1n(x1+x2+…+xn).
4.百分位数
(1)第p百分位数的定义:
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
自查自测
知识点三 方差、标准差
(教材改编题)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中,可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均值
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
B 解析:因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.
核心回扣
如果有n个数据x1,x2,…,xn,那么这n个数据的平均数为 x=1n(x1+x2+…+xn),
标准差为s=
1nx1−x2+x2−x2+…+xn−x2,
方差为s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].
【常用结论】
平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx+a.
(2)若数据x1,x2,…,xn的方差为s2,则
①数据x1+a,x2+a,…,xn+a的方差也为s2.
②数据ax1,ax2,…,axn的方差为a2s2.
应用 设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01B.0.1
C.1D.10
C 解析:因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.
统计图表及其应用
1.某商场在售的三类食品共200种的分布情况如图所示,质检部门要从中抽取一个容量为40的样本进行质量检测,则抽取的植物油类食品的种数是( )
A.8B.12
C.24D.30
B 解析:由题意,利用分层随机抽样方法从中抽取容量为40的样本,可知需要抽取的植物油类食品的种数是40×30%=12.
2.(2024·德州模拟)空气质量指数是评估空气质量状况的一组数字,空气质量指数划分为[0,50),[50,100),[100,150),[150,200),[200,300)和[300,500]六档,分别对应”优””良””轻度污染””中度污染””重度污染”和”严重污染”六个等级.如图是某市2月1日至14日连续14天的空气质量指数趋势图,则下面说法中正确的是( )
A.这14天中有5天空气质量为”中度污染”
B.从2日到5日空气质量越来越好
C.这14天中空气质量指数的中位数是214
D.连续3天中空气质量指数方差最小的是5日到7日
B 解析:对于A,这14天中有4天空气质量指数在[150,200)内,则有4天为”中度污染”,A错误;
对于B,从2日到5日空气质量指数逐渐下降,即空气质量越来越好,B正确;
对于C,将14组数据从小到大排列为80,83,138,155,157,165,179,214,214,221,243,260,263,275,其中位数为12×(179+214)=196.5,C错误;
对于D,5日到7日的这3天,数据相差比较大,所以连续3天中空气质量指数方差最小的不是5日到7日,D错误.
3.(多选题)我国人口老龄化加剧,出现劳动人口不断减少,生育率降低等问题.为了缓解人口压力,我国陆续开放二孩、三孩政策.为了解户籍和性别对生育多胎(二胎或三胎)选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人.绘制不同群体中倾向选择生育多胎与倾向选择不生育多胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育多胎的对应比例,则下列叙述中正确的是( )
A.是否倾向选择生育多胎与户籍有关
B.是否倾向选择生育多胎与性别有关
C.倾向选择生育多胎的人员中,男性人数与女性人数相同
D.倾向选择不生育多胎的人员中,农村户籍人数少于城镇户籍人数
AD 解析:城镇户籍倾向选择生育多胎的比例为40%,农村户籍倾向选择生育多胎的比例为80%,差异较大,故A正确;
男性与女性倾向选择生育多胎的比例均为60%,故B错误;
男性倾向选择生育多胎的比例为60%,人数为60×60%=36,女性倾向选择生育多胎的比例为60%,人数为40×60%=24,故C错误;
倾向选择不生育多胎的人员中,农村户籍人数为50×(1-80%)=10,城镇户籍人数为50×(1-40%)=30,故D正确.
统计图表的主要应用
扇形图:直观描述各类数据占总数的比例;
折线图:描述数据随时间的变化趋势;
条形图和直方图:直观描述不同类别或分组数据的频数和频率.
频率分布直方图
【例1】某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩(单位:分),分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题.
(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;
(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分.
解:(1)设分数在[70,80)内的频率为x,
根据频率分布直方图,可得(0.010+0.015+0.020+0.025+0.005)×10+x=1,
解得x=0.25,
所以分数在[70,80)内的频率为0.25.
补全频率分布直方图,如图所示.
(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,
而0.05s
B.s′=s
C.s′s.
(2)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为x 和y ,样本方差分别记为s12和s22.
①求x ,y ,s12,s22;
②判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y -x ≥2s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
解:①由表中的数据,可得
x =110×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10,
y =110×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
s12=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,
s22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.
②由①中的数据可得y -x =10.3-10=0.3,
2s12+s2210=20.036+0.0410=20.007 6
=0.030 4.
因为0.3=0.09>0.030 4,所以y -x >2s12+s2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
1.方差的简化计算公式:s2=1n[(x12+x22+…+xn2))-nx 2]=1n(x12+x22+…+xn2))-x 2.
2.方差的运算性质:如果数据x1,x2,…,xn的方差为s2,则①新数据x1+b,x2+b,…,xn+b的方差为s2.②新数据ax1,ax2,…,axn的方差为a2s2.③新数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.标准差(或方差)用来刻画数据的离散程度,标准差(或方差)越大,数据的离散程度就越大,也就是越不稳定;标准差(或方差)越小,数据的离散程度就越小,也就是越稳定.
考向2 分层随机抽样的方差
【例5】某学校共有学生2 000人,其中高一800人,高二、高三各600人.学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天读书时间的平均数为x=3,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x1=2.7,x2=3.1,x3=3.3,且高一学生、高二学生每天读书时间的方差分别为s12=1,s22=2,则高三学生每天读书时间的方差s32= .
3 解析:由题意,可得1.966=8002 000×[1+(2.7-3)2]+6002 000×[2+(3.1-3)2]+6002 000×[s32)+(3.3-3)2],解得s32=3.
设样本中不同层的平均数分别为x1,x2,…,xn,方差分别为s12,s22,…,sn2,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=[s eq \\al(2,i)+( eq \x\t(x)i- eq \x\t(x))2],其中x为样本平均数.
1.某人5次上班途中所花的时间(单位:分)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1B.2
C.3D.4
D 解析:由题意,可知
15x+y+10+11+9=10,15x−102+y−102+1+1=2,
化简整理得x+y=20,x2+y2=208.
又(x+y)2=x2+y2+2xy,
即400=208+2xy,所以xy=96,
所以(x-y)2=x2+y2-2xy=16,
所以|x-y|=4.
2.在对某中学高一学生体重的调查中,采取按比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20,则样本的平均数为 ,方差为 .
51 41 解析:样本的平均数为3030+20×55+2030+20×45=51,样本的方差为3030+20×[15+(55-51)2]+2030+20×[20+(45-51)2]=41.
课时质量评价(五十八)
1.(多选题)(2023·新高考全国Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
BD 解析:A选项,x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;
B选项,x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;
C选项,设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差为s12=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差为s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s12>s22,所以s1>s2,C错误;
D选项,x6>x5,x2>x1,所以x6-x1>x5-x2,D正确.
2.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是( )
A.15B.25
C.50D.75
A 解析:这组数据按从小到大排列为6,7,15,36,39,40,41,42,43,47,49,共11项,由11×25%=2.75,11×50%=5.5,11×75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.
3.(2024·乌鲁木齐模拟)如图为2012年-2022年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年-2022年电子信息制造业企业利润总额逐年递增
B.2017年-2022年工业企业利润总额逐年递增
C.2012年-2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2019年-2022年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
C 解析:对于A,由题图可知,2018年电子信息制造业企业利润总额增速为负值,利润总额较上一年下降,A错误;
对于B,由题图可知,2015年工业企业利润总额增速为负值,利润总额较上一年下降,B错误;
对于C,2012年-2017年电子信息制造业企业利润总额增速均为正,利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速,C正确;
对于D,2019年-2022年中,工业企业利润总额增速都小于电子信息制造业企业利润总额增速,则这几年中工业企业利润总额增速的均值小于电子信息制造业企业利润总额增速的均值,D错误.
4.甲在某次射击训练中10次射击成绩(单位:环)如下:7,5,9,7,4,8,9,9,7,5,则下列关于这组数据说法不正确的是( )
A.众数为7和9
B.方差为3
C.平均数为7
D.第70百分位数为8
D 解析:结合数据得众数为7和9,故A正确;
平均数为7×3+9×3+5×2+4+810=7,故C正确;
方差为110×[(-3)2+(-2)2+(-2)2+12+22+22+22]=3,故B正确;
10次射击成绩从小到大排列为4,5,5,7,7,7,8,9,9,9,因为10×70%=7,
所以第70百分位数为8+92=8.5,故D错误.
5.(多选题)在某次高中学科竞赛中,4 000名考生的竞赛成绩(单位:分)统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )
A.成绩在[70,80)内的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
ABC 解析:根据频率分布直方图得成绩在[70,80)的频率最大,故A正确;不及格的考生人数为10×(0.010+0.015)×4 000=1 000,故B正确;根据频率分布直方图,估计考生竞赛成绩的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5−≈71.67(分),故D错误.
6.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .
8.6 解析:设这30个数据从小到大排列后第19个数据为x,由30×60%=18,得7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.
7.(2024·南昌模拟)如图,一组数据x1,x2,x3,…,x9,x10的平均数为5,方差为s12,去除x9,x10这两个数据后,平均数为x,方差为s22,则( )
A.x>5,s12>s22B.x
相关学案
这是一份人教A版普通高中数学一轮复习第九章第三节一元线性回归模型及其应用学案,共5页。
这是一份人教A版普通高中数学一轮复习第九章第一节随机抽样学案,共1页。
这是一份人教A版普通高中数学一轮复习第八章第二节两条直线的位置关系、距离公式学案,共22页。学案主要包含了常用结论等内容,欢迎下载使用。