还剩18页未读,
继续阅读
所属成套资源:2020高考人教A版文科数学一轮复习文档《微点教程》
成套系列资料,整套一键下载
2020版《微点教程》高考人教A版文科数学一轮复习文档:第九章第三节 用样本估计总体 学案
展开
第三节 用样本估计总体
2019考纲考题考情
1.用样本的频率分布估计总体分布
(1)作频率分布直方图的步骤。
①求极差(即一组数据中最大值与最小值的差)。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
(2)频率分布折线图和总体密度曲线。
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。
(3)茎叶图。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
2.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数。
(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:=,反映了一组数据的平均水平。
(4)标准差:是样本数据到平均数的一种平均距离,s=。
(5)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数)。
1.频率分布直方图中各小矩形的面积之和为1。
2.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数。
(2)中位数左边和右边的小长方形的面积和是相等的。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a。
(2)数据x1,x2,…,xn的方差为s2。
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2。
一、走进教材
1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。
解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。
答案 25
2.(必修3P82A组T6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲 0 1 0 2 2 0 3 1 2 4
乙 2 3 1 1 0 2 1 1 0 1
则机床性能较好的为________。
解析 因为甲=1.5,乙=1.2,s=1.65,s=0.76,所以s
答案 乙
二、走近高考
3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。
解析 由茎叶图可得分数的平均数为
=90。
答案 90
4.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3。
答案 A
三、走出误区
微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。
5.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2 B.16,2
C.16,18 D.16,9
解析 因为x1,x2,x3,…,xn的平均数为5,所以=5,所以+1=3×5+1=16,因为x1,x2,x3,…,xn的方差为2,所以3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。故选C。
答案 C
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为________。(用“<”连接)
解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;=
≈5.97。故n
答案 n
考点一 频率分布直方图
【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5。
所以总体中分数在区间[40,50)内的人数估计为400×=20。
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。
所以样本中分数不小于70的男生人数为60×=30。
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2。
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是,而不是频率。
2.与频率分布直方图计算有关的两个关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数。
【变式训练】 (2018·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20 D.25
解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。故选A。
答案 A
考点二 茎叶图
【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为( )
A. B.2
C. D.9
解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1。由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4。由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=×=≥×(5+4)=(当且仅当b=2a时取等号)。故+的最小值为。故选C。
答案 C
1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。
【变式训练】 (1)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86
C.99,86 D.95,91
(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。
解析 (1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。故选B。
(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。抽到的7人的编号为3,8,13,18,23,28,33,成绩为133,138,141,143,145,148,153,平均成绩是×(133+138+141+143+145+148+153)=143。
答案 (1)B (2)143
考点三 样本的数字特征微点小专题
方向1:样本方差的计算
【例3】 (1)(2019·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为( )
A. B.
C.6 D.30
(2)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________。
解析 (1)由茎叶图知,最低分为87分,最高分为99分。依题意得,×(87+93+90+90+x+91)=91,解得x=4。则剩余5个得分的方差s2=×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+4+1+9)=6。故选C。
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2。
答案 (1)C (2)2
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。
2.方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方。
方向2:用样本数字特征估计总体
【例4】 (2019·福州高三期末)随着“互联网+交通”模式的迅猛发展,“共享自行车”在很多城市相继出现。某“共享自行车”运营公司为了了解某地区用户对该公司所提供的服务的满意度,随机调查了40名用户,得到用户的满意度评分如下:
用系统抽样法从40名用户中抽取容量为10的样本,且在第一分段里随机抽到的评分数据为92。
(1)请你列出抽到的10个样本的评分数据;
(2)计算所抽到的10个样本的均值和方差s2;
(3)在(2)的条件下,若用户的满意度评分在(-s,+s)之间,则满意度等级为“A级”。试应用样本估计总体的思想,估计该地区满意度等级为“A级”的用户所占的百分比是多少?(精确到0.1%)
参考数据:≈5.48,≈5.74,≈5.92。
解 (1)由题意得,通过系统抽样分别抽取编号为4,8,12,16,20,24,28,32,36,40的评分数据为样本,则样本的评分数据分别为92,84,86,78,89,74,83,78,77,89。
(2)由(1)中样本的评分数据可得
=×(92+84+86+78+89+74+83+78+77+89)=83,
则有s2=×[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33。
(3)由题意知用户的满意度评分在(83-,83+),即(77.26,88.74)之间,满意度等级为“A级”,
由(1)中容量为10的样本评分在(77.26,88.74)之间的有5人,则该地区满意度等级为“A级”的用户所占的百分比约为×100%=50.0%。
解:由题意知用户的满意度评分在(83-,83+),即(77.26,88.74)之间,满意度等级为“A级”,调查的40名用户的评分数据在(77.26,88.74)之间的共有21人,则该地区满意度等级为“A级”的用户所占的百分比约为×100%=52.5%。
若给出图表,一方面可以由图表得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图表直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。
【题点对应练】
1.(方向1)一组数据1,10,5,2,x,2,且2
解析 根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为=×(1+2+2+4+5+10)=4,方差为s2=×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9。
答案 9
2.(方向1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________。
解析 依题意,x1,x2,x3,…,x10的方差s2=64。则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16。
答案 16
3.(方向2)某商家为了解“双十一”这一天网购者在其网店一次性购物的情况,从这一天交易成功的所有订单中随机抽取了100份,按购物金额(单位:元)进行统计,得到的频率分布直方图如图所示。
(1)该商家决定对这100份订单中购物金额不低于1 000元的订单按区间[1 000,1 200),[1 200,1 400]采用分层抽样的方法抽取6份,对买家进行售后回访,再从这6位买家中随机抽取2位赠送小礼品。求获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]内的概率。
(2)若该商家制订了两种不同的促销方案:
方案一:全场商品打八折;
方案二:全场商品优惠如下表。
购物
金额
[200,
400)
[400,
600)
[600,
800)
[800,
1 000)
[1000,
1 200)
[1 200,
1 400]
优惠金
额/元
30
50
140
160
280
320
利用直方图的数据,计算说明哪种方案的优惠力度更大(同一组中的数据用该组区间中点值表示)。
解 (1)在这100份订单中,购物金额位于区间[1 000,1 200)内的有100×0.000 50×200=10(份),
位于区间[1 200,1 400]内的有100×0.000 25×200=5(份),则购物金额位于区间[1 000,1 400]内的订单共有15份。
利用分层抽样抽取6份,则位于区间[1 000,1 200)内的有4份,记为X1,X2,X3,X4,位于区间[1 200,1 400]内的有2份,记为Y1,Y2。
从X1,X2,X3,X4,Y1,Y2中抽取2份,所有可能的结果有X1X2,X1X3,X1X4,X2X3,X2X4,X3X4,X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共15种。
设事件A表示“获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]内”,其所含基本事件有X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共9个,则P(A)==。
(2)由直方图知,各组的频率依次为0.1,0.2,0.25,0.3,0.1,0.05,
方案一:商家优惠金额的平均值为
(300×0.1+500×0.2+700×0.25+900×0.3+1 100×0.1+1 300×0.05)×0.2=150(元)。
方案二:商家优惠金额的平均值为
30×0.1+50×0.2+140×0.25+160×0.3+280×0.1+320×0.05=140(元)。
由于150>140,所以方案一的优惠力度更大。
1.(配合例1,例4使用)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解 (1)样本数据的频率分布直方图如图所示:
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100。
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104。
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104。
(3)质量指标值不低于95的产品所占比例的估计值为
0.38+0.22+0.08=0.68。
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定。
2.(配合例2、例3使用)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )
A.2 B.
C.10 D.
解析 甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为
=。故选B。
答案 B
2019考纲考题考情
1.用样本的频率分布估计总体分布
(1)作频率分布直方图的步骤。
①求极差(即一组数据中最大值与最小值的差)。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
(2)频率分布折线图和总体密度曲线。
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。
(3)茎叶图。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
2.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数。
(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:=,反映了一组数据的平均水平。
(4)标准差:是样本数据到平均数的一种平均距离,s=。
(5)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数)。
1.频率分布直方图中各小矩形的面积之和为1。
2.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数。
(2)中位数左边和右边的小长方形的面积和是相等的。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a。
(2)数据x1,x2,…,xn的方差为s2。
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2。
一、走进教材
1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。
解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。
答案 25
2.(必修3P82A组T6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲 0 1 0 2 2 0 3 1 2 4
乙 2 3 1 1 0 2 1 1 0 1
则机床性能较好的为________。
解析 因为甲=1.5,乙=1.2,s=1.65,s=0.76,所以s
二、走近高考
3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。
解析 由茎叶图可得分数的平均数为
=90。
答案 90
4.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3。
答案 A
三、走出误区
微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。
5.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2 B.16,2
C.16,18 D.16,9
解析 因为x1,x2,x3,…,xn的平均数为5,所以=5,所以+1=3×5+1=16,因为x1,x2,x3,…,xn的方差为2,所以3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。故选C。
答案 C
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为________。(用“<”连接)
解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;=
≈5.97。故n
考点一 频率分布直方图
【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5。
所以总体中分数在区间[40,50)内的人数估计为400×=20。
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。
所以样本中分数不小于70的男生人数为60×=30。
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2。
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是,而不是频率。
2.与频率分布直方图计算有关的两个关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数。
【变式训练】 (2018·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20 D.25
解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。故选A。
答案 A
考点二 茎叶图
【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为( )
A. B.2
C. D.9
解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1。由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4。由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=×=≥×(5+4)=(当且仅当b=2a时取等号)。故+的最小值为。故选C。
答案 C
1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。
【变式训练】 (1)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86
C.99,86 D.95,91
(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。
解析 (1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。故选B。
(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。抽到的7人的编号为3,8,13,18,23,28,33,成绩为133,138,141,143,145,148,153,平均成绩是×(133+138+141+143+145+148+153)=143。
答案 (1)B (2)143
考点三 样本的数字特征微点小专题
方向1:样本方差的计算
【例3】 (1)(2019·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为( )
A. B.
C.6 D.30
(2)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________。
解析 (1)由茎叶图知,最低分为87分,最高分为99分。依题意得,×(87+93+90+90+x+91)=91,解得x=4。则剩余5个得分的方差s2=×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+4+1+9)=6。故选C。
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2。
答案 (1)C (2)2
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。
2.方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方。
方向2:用样本数字特征估计总体
【例4】 (2019·福州高三期末)随着“互联网+交通”模式的迅猛发展,“共享自行车”在很多城市相继出现。某“共享自行车”运营公司为了了解某地区用户对该公司所提供的服务的满意度,随机调查了40名用户,得到用户的满意度评分如下:
用系统抽样法从40名用户中抽取容量为10的样本,且在第一分段里随机抽到的评分数据为92。
(1)请你列出抽到的10个样本的评分数据;
(2)计算所抽到的10个样本的均值和方差s2;
(3)在(2)的条件下,若用户的满意度评分在(-s,+s)之间,则满意度等级为“A级”。试应用样本估计总体的思想,估计该地区满意度等级为“A级”的用户所占的百分比是多少?(精确到0.1%)
参考数据:≈5.48,≈5.74,≈5.92。
解 (1)由题意得,通过系统抽样分别抽取编号为4,8,12,16,20,24,28,32,36,40的评分数据为样本,则样本的评分数据分别为92,84,86,78,89,74,83,78,77,89。
(2)由(1)中样本的评分数据可得
=×(92+84+86+78+89+74+83+78+77+89)=83,
则有s2=×[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33。
(3)由题意知用户的满意度评分在(83-,83+),即(77.26,88.74)之间,满意度等级为“A级”,
由(1)中容量为10的样本评分在(77.26,88.74)之间的有5人,则该地区满意度等级为“A级”的用户所占的百分比约为×100%=50.0%。
解:由题意知用户的满意度评分在(83-,83+),即(77.26,88.74)之间,满意度等级为“A级”,调查的40名用户的评分数据在(77.26,88.74)之间的共有21人,则该地区满意度等级为“A级”的用户所占的百分比约为×100%=52.5%。
若给出图表,一方面可以由图表得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图表直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。
【题点对应练】
1.(方向1)一组数据1,10,5,2,x,2,且2
答案 9
2.(方向1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________。
解析 依题意,x1,x2,x3,…,x10的方差s2=64。则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16。
答案 16
3.(方向2)某商家为了解“双十一”这一天网购者在其网店一次性购物的情况,从这一天交易成功的所有订单中随机抽取了100份,按购物金额(单位:元)进行统计,得到的频率分布直方图如图所示。
(1)该商家决定对这100份订单中购物金额不低于1 000元的订单按区间[1 000,1 200),[1 200,1 400]采用分层抽样的方法抽取6份,对买家进行售后回访,再从这6位买家中随机抽取2位赠送小礼品。求获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]内的概率。
(2)若该商家制订了两种不同的促销方案:
方案一:全场商品打八折;
方案二:全场商品优惠如下表。
购物
金额
[200,
400)
[400,
600)
[600,
800)
[800,
1 000)
[1000,
1 200)
[1 200,
1 400]
优惠金
额/元
30
50
140
160
280
320
利用直方图的数据,计算说明哪种方案的优惠力度更大(同一组中的数据用该组区间中点值表示)。
解 (1)在这100份订单中,购物金额位于区间[1 000,1 200)内的有100×0.000 50×200=10(份),
位于区间[1 200,1 400]内的有100×0.000 25×200=5(份),则购物金额位于区间[1 000,1 400]内的订单共有15份。
利用分层抽样抽取6份,则位于区间[1 000,1 200)内的有4份,记为X1,X2,X3,X4,位于区间[1 200,1 400]内的有2份,记为Y1,Y2。
从X1,X2,X3,X4,Y1,Y2中抽取2份,所有可能的结果有X1X2,X1X3,X1X4,X2X3,X2X4,X3X4,X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共15种。
设事件A表示“获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]内”,其所含基本事件有X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共9个,则P(A)==。
(2)由直方图知,各组的频率依次为0.1,0.2,0.25,0.3,0.1,0.05,
方案一:商家优惠金额的平均值为
(300×0.1+500×0.2+700×0.25+900×0.3+1 100×0.1+1 300×0.05)×0.2=150(元)。
方案二:商家优惠金额的平均值为
30×0.1+50×0.2+140×0.25+160×0.3+280×0.1+320×0.05=140(元)。
由于150>140,所以方案一的优惠力度更大。
1.(配合例1,例4使用)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解 (1)样本数据的频率分布直方图如图所示:
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100。
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104。
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104。
(3)质量指标值不低于95的产品所占比例的估计值为
0.38+0.22+0.08=0.68。
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定。
2.(配合例2、例3使用)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )
A.2 B.
C.10 D.
解析 甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为
=。故选B。
答案 B
相关资料
更多