人教b版高考数学一轮复习第9章统计与统计案例第2节用样本估计总体学案含解析
展开第2节 用样本估计总体
一、教材概念·结论·性质重现
1.最值、中位数、众数、平均数、百分位数、极差
(1)最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
(2)平均数
①定义:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).这一公式在数学中常简记为=i.
②如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数是a+b.
(3)中位数
①如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;
②如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
(4)百分位数
①定义:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
②计算方法:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取xi0为p%分位数;如果i是整数,取为p%分位数.
规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
(5)众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
(6)极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
2.方差与标准差
(1)如果x1,x2,…,xn的平均数为,则方差s2=(xi-)2,方差的算术平方根称为标准差.
(2)如果x1,x2,…,xn的方差为s2,且a,b为常数,则ax1+b,ax2+b,…,axn+b的方差是a2s2.
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.频率分布直方图
(1)频率分布表的画法.
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
4.频率分布折线图
频率分布折线图:用线段连接频率分布直方图中各个矩形上面一边的中点,就得到频率分布折线图.
频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
二、基本技能·思想·活动体验
1.判断下列说法的正误,对的打“√”,错的打“×”.
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )
(2)一组数据的方差越大,说明这组数据越集中.( × )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( √ )
2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4 B.8
C.12 D.16
B 解析:设频数为n,则=0.25,所以n=32×=8.
3.数据12,14,15,17,19,23,27,30的70%分位数是( )
A.14 B.17
C.19 D.23
D 解析:因为8×70%=5.6,所以70%分位数是第六项数据23.
4.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
A 解析:因为这组数据为87,89,90,91,92,93,94,96,
所以中位数是=91.5,平均数==91.5.故选A.
5.已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形.若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________.
50 解析:设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为p.由题意,得p+p=1,所以p=,则中间一个小矩形的面积为p=,200×=50,即该组的频数为50.
考点1 频率分布直方图——综合性
某市为了了解人们对“经济内循环”的认知程度,对不同年龄和不同职业的人举办了一次“经济内循环”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组.从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“经济内循环”的认知程度,并谈谈你的感想.
解:(1)根据频率分布直方图,得第一组的频率为0.01×5=0.05,所以=0.05,所以x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,解得a=≈32,则中位数为32.
(3)(ⅰ)5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,
方差为s=×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,
方差为s=×[(-1)2+42+02+12+(-4)2]=6.8.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
1.频率分布直方图的性质
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
(3)小长方形的高=,所有小长方形的高的和为.
2.理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系.
1.(多选题)(2020·嘉祥县第一中学高三模拟)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),60分以下视为不及格.若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是( )
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
ABC 解析:由频率分布直方图可得,成绩在[70,80)的频率最高,因此考生人数最多,故A正确;成绩在[40,60)的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;因为成绩在[40,70)的频率为0.45,在[70,80)的频率为0.3,所以中位数为70+10×≈71.67,故D错误.
2.(多选题)我国是世界第一产粮大国,我国粮食产量很高,按照14亿人口计算,中国人均粮食产量约为950斤,比全球人均粮食产量高了约250斤.如图是中国国家统计局网站中2010~2019年,我国粮食产量(千万吨)与年末总人口(千万人)的条形图,由此可知在2010~2019年中( )
A.我国粮食年产量与年末总人口均逐年递增
B.2011年我国粮食年产量的年增长率最大
C.2015~2019年我国粮食年产量相对稳定
D.2015年我国人均粮食年产量达到了最高峰
BCD 解析:对于A,我国粮食年产量在2010年至2015年逐年递增,在2015年至2019年基本稳定在66千万吨以上,我国年末总人口均逐年递增,故A错误;对于B,由粮食产量条形图得2011年我国粮食产量的年增长率最大,故B正确;对于C,在2015年至2019年基本稳定在66千万吨以上,故C正确;对于D,2015年我国人均粮食年产量达到了最高峰,故D正确.故选BCD.
考点2 统计图表——综合性
(多选题)(2020·临沂一模)某同学在网上查询到近十年全国高考报名人数、录取人数和山东夏季高考报名人数的折线图,其中2019年的录取人数被遮挡了.他又查询到近十年全国高考录取率的散点图,结合图表中的信息判定下列说法正确的是( )
A.全国高考报名人数逐年增加
B.2018年全国高考录取率最高
C.2019年高考录取人数约为820万
D.2019年山东高考报名人数在全国的占比最小
BCD 解析:2016年的人数少于2015年人数,A错误;2018年的录取率为81.1%,为最高,B正确;2019年高考录取人数为1 031×79.5%≈820,C正确;从2010~2019年山东高考报名人数在全国的占比分别为6.9%,6.3%,5.6%,5.5%,5.9%,7.4%,6.4%,6.2%,6.1%,5.4%,D正确.
统计图表问题的解决方法
(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等.
(2)其次要准确地用图,会根据统计图表中的数字计算样本的数字特征,会用统计图表估计总体.
1.(2020·鹤壁二模)中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的.下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是( )
A.每相邻两年相比较,2014年到2015年铁路运营里程增加最显著
B.从2014年到2018年这5年,高铁运营里程与年份正相关
C.2018年高铁运营里程比2014年高铁运营里程增长80%以上
D.从2014年到2018年这5年,高铁运营里程数依次成等差数列
D 解析:选项A,B显然正确;对于C,>0.8,选项C正确;1.6,1.9,2.2,2.5,2.9不是等差数列,故D错误.故选D.
2.甲、乙、丙三家企业产品的成本分别为10 000,12 000,15 000,其成本构成如图所示,则关于这三家企业,下列说法错误的是( )
A.成本最大的企业是丙企业
B.费用支出最高的企业是丙企业
C.支付工资最少的企业是乙企业
D.材料成本最高的企业是丙企业
C 解析:甲企业的成本为10 000;乙企业的成本为12 000;丙企业的成本为 15 000.故成本最大的是丙企业,故A正确.甲企业费用支出为10 000×5%=500;乙企业费用支出为12 000×17%=2 040;丙企业费用支出为15 000×15%=2 250.故费用支出最高的企业是丙企业,故B正确.甲企业支付工资为10 000×35%=3 500;乙企业支付工资为 12 000×30%=3 600;丙企业支付工资为 15 000×25%=3 750.故甲企业支付的工资最少,故C错误.甲企业材料成本为10 000×60%=6 000;乙企业材料成本为12 000×53%=6 360;丙企业材料成本为15 000×60%=9 000.故材料成本最高的企业是丙企业,故D正确.故选C.
考点3 样本的数字特征——综合性
(1)(2020·德州一模)某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )
A.甲得分的极差是11
B.乙得分的中位数是18.5
C.甲运动员得分有一半在区间[20,30]上
D.甲运动员得分的平均值比乙运动员得分的平均值高
D 解析:甲得分的极差是28-9=19,A错误;乙得分的中位数是=16.5,B错误;甲运动员得分在区间[20,30]上有3个,C错误;甲运动员得分的平均值为=17,乙运动员得分的平均值为=16,故D正确.
(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员 | 第1次 | 第2次 | 第3次 | 第4次 | 第5次 |
甲 | 87 | 91 | 90 | 89 | 93 |
乙 | 89 | 90 | 91 | 88 | 92 |
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
2 解析:甲=×(87+91+90+89+93)=90,乙=×(89+90+91+88+92)=90,
s甲=×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s乙=×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
因为4>2,
所以乙的成绩较为稳定,其方差为2.
1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体,就是利用样本的数字特征来描述总体的数字特征.
1.已知某7个数的平均数为4,方差为2.现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
A 解析:因为某7个数的平均数为4,所以这7个数的和为4×7=28.因为加入一个新数据4,所以==4.又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s2==<2.故选A.
2.已知甲、乙两组数据:
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的30%分位数、80%分位数分别相等,则等于( )
A. B.
C. D.
A 解析:因为30%×6=1.8,80%×6=4.8,所以30%分位数为n=28,80%分位数为m=48,所以==.
人教b版高考数学一轮复习第9章统计与统计案例新高考新题型微课堂9多选题命题热点之统计学案含解析: 这是一份人教b版高考数学一轮复习第9章统计与统计案例新高考新题型微课堂9多选题命题热点之统计学案含解析,共4页。
人教b版高考数学一轮复习第9章统计与统计案例第3节统计模型学案含解析: 这是一份人教b版高考数学一轮复习第9章统计与统计案例第3节统计模型学案含解析,共12页。学案主要包含了教材概念·结论·性质重视,基本技能·思想·活动体验等内容,欢迎下载使用。
新教材高考数学一轮复习第9章统计与统计案例第2节用样本估计总体学案含解析: 这是一份新教材高考数学一轮复习第9章统计与统计案例第2节用样本估计总体学案含解析,共9页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动体验等内容,欢迎下载使用。