还剩17页未读,
继续阅读
所属成套资源:2020高考人教A版理科数学一轮复习文档《微点教程》学案
成套系列资料,整套一键下载
2020版《微点教程》高考人教A版理科数学一轮复习文档:第九章第三节 用样本估计总体 学案
展开
第三节 用样本估计总体
2019考纲考题考情
1.用样本的频率分布估计总体分布
(1)作频率分布直方图的步骤。
①求极差(即一组数据中最大值与最小值的差)。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
(2)频率分布折线图和总体密度曲线。
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。
(3)茎叶图。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
2.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数。
(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:=,反映了一组数据的平均水平。
(4)标准差:是样本数据到平均数的一种平均距离,s=。
(5)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数)。
1.频率分布直方图中各小矩形的面积之和为1。
2.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数。
(2)中位数左边和右边的小长方形的面积和是相等的。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a。
(2)数据x1,x2,…,xn的方差为s2。
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2。
一、走进教材
1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。
解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为:0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。
答案 25
2.(必修3P82A组T6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲 0 1 0 2 2 0 3 1 2 4
乙 2 3 1 1 0 2 1 1 0 1
则机床性能较好的为________。
解析 因为甲=1.5,乙=1.2,s=1.65,s=0.76,所以s
答案 乙
二、走近高考
3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。
解析 由茎叶图可得分数的平均数为
=90。
答案 90
4.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3。
答案 A
三、走出误区
微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。
5.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2 B.16,2
C.16,18 D.16,9
解析 因为x1,x2,x3,…,xn的平均数为5,所以=5,所以+1=3×5+1=16,因为x1,x2,x3,…,xn的方差为2,所以3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。故选C。
答案 C
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为________。(用“<”连接)
解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;=
≈5.97。故n
答案 n
考点一 频率分布直方图
【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5。
所以总体中分数在区间[40,50)内的人数估计为400×=20。
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。
所以样本中分数不小于70的男生人数为60×=30。
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2。
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是,而不是频率。
2.与频率分布直方图计算有关的两个关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数。
【变式训练】 (2019·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20 D.25
解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。故选A。
答案 A
考点二 茎叶图
【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为( )
A. B.2
C. D.9
解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1。由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4。由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=×=≥×(5+4)=(当且仅当b=2a时取等号)。故+的最小值为。故选C。
答案 C
1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。
【变式训练】 (1)(2019·长春质量监测)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86
C.99,86 D.95,91
(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。
解析 (1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。故选B。
(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。抽到的7人的编号为3,8,13,18,23,28,33,成绩为133,138,141,143,145,148,153,平均成绩是×(133+138+141+143+145+148+153)=143。
答案 (1)B (2)143
考点三 样本的数字特征微点小专题
方向1:样本方差的计算
【例3】 (1)(2019·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为( )
A. B.
C.6 D.30
(2)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________。
解析 (1)由茎叶图知,最低分为87分,最高分为99分。依题意得,×(87+93+90+90+x+91)=91,解得x=4。则剩余5个得分的方差s2=×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+4+1+9)=6。故选C。
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2。
答案 (1)C (2)2
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。
2.方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方。
方向2:用样本数字特征估计总体
【例4】 (2019·贵阳摸底考试)某高校学生社团为了解“大数据时代”下毕业生对就业情况的满意度,对20名毕业生进行问卷计分调查(满分100分),得到如图所示的茎叶图:
(1)计算男生打分的平均分,观察茎叶图,评价男、女生打分的分散程度;
(2)从打分在80分以上的毕业生中随机抽取3人,求被抽到的女生人数X的分布列和数学期望。
解 (1)男生打分的平均分为
×(55+53+62+65+71+70+73+74+86+81)=69。
由茎叶图知,女生打分比较集中,男生打分比较分散。
(2)因为打分在80分以上的毕业生有3女2男,所以X的可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X
1
2
3
P
E(X)=1×+2×+3×=。
若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。
【题点对应练】
1.(方向1)一组数据1,10,5,2,x,2,且2
解析 根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为=×(1+2+2+4+5+10)=4,方差为s2=×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9。
答案 9
2.(方向1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________。
解析 依题意,x1,x2,x3,…,x10的方差s2=64。则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16。
答案 16
3.(方向2)某商家为了解“双十一”这一天网购者在其网店一次性购物的情况,从这一天交易成功的所有订单中随机抽取了100份,按购物金额(单位:元)进行统计,得到的频率分布直方图如图所示。
(1)该商家决定对这100份订单中购物金额不低于1 000元的订单按区间[1 000,1 200),[1 200,1 400]采用分层抽样的方法抽取6份,对买家进行售后回访,再从这6位买家中随机抽取3位赠送小礼品。求获赠小礼品的3位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]的概率。
(2)若该商家制订了两种不同的促销方案:
方案一:全场商品打八折;
方案二:全场购物每满200元减40元,每满600元减150元,每满1 000元减300元,以上减免只享受最高优惠。例如:购物金额为500元时,可享受最高优惠80元;购物金额为900元时,可享受最高优惠190元。
利用直方图中的数据,计算说明哪种方案的优惠力度更大(同一组中的数据用该组区间的中点值作代表)。
解 (1)在这100份订单中,购物金额位于区间[1 000,1 200)的有0.000 50×200×100=10份,位于区间[1 200,1 400]的有0.000 25×200×100=5份,则购物金额位于区间[1 000,1 400]的订单共有15份,利用分层抽样抽取6份,则位于区间[1 000,1 200)的有4份,位于区间[1 200,1 400]的有2份,设事件A表示“获赠小礼品的3位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]”,则P(A)=1-=。
(2)由直方图知,各组的频率依次为0.1,0.2,0.25,0.3,0.1,0.05。
方案一:最高优惠的平均值为
(300×0.1+500×0.2+700×0.25+900×0.3+1 100×0.1+1 300×0.05)×0.2=150(元);
方案二:最高优惠的平均值为
40×0.1+80×0.2+150×0.25+190×0.3+300×0.1+340×0.05=161.5(元),
由于150<161.5,所以方案二的优惠力度更大。
1.(配合例1、例4使用)如图为2018届淮北师范大学数学与应用数学专业N名毕业生的综合测评成绩(百分制)分布直方图,已知80~90分数段的学员数为21人。
(1)求该专业毕业总人数N和90~95分数段内的人数n;
(2)现欲将90~95分数段内的n名毕业生随机地分配到A,B,C三所学校,每所学校至少分配两名毕业生。
①若这n名毕业生中甲、乙两人必须进同一所学校,共有多少种不同的分配方法?
②若这n名毕业生中恰有两名女生,设随机变量ξ表示n名毕业生中分配到B学校的两名毕业生中女生的人数,求ξ的分布列和数学期望。
解 (1)80~90分数段的频率p1=(0.04+0.03)×5=0.35,此分数段的学员总数为21人,
所以毕业生的总人数N==60,
90~95分数段的频率p2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.1,
所以90~95分数段内的人数n=60×0.1=6。
(2)①将90~95分数段内的6名毕业生随机地分配到A,B,C三所学校,每所学校至少分配两名毕业生,且甲、乙两人必须进同一所学校,则共有·A=18种不同的分配方法。
②ξ的所有可能取值为0,1,2,
P(ξ=0)==,
P(ξ=1)==,
P(ξ=2)==,
所以ξ的分布列为
ξ
0
1
2
P
所以随机变量ξ的数学期望为E(ξ)=0×+1×+2×=。
2.(配合例2、例3使用)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )
A.2 B.
C.10 D.
解析 甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为
=。故选B。
答案 B
2019考纲考题考情
1.用样本的频率分布估计总体分布
(1)作频率分布直方图的步骤。
①求极差(即一组数据中最大值与最小值的差)。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
(2)频率分布折线图和总体密度曲线。
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。
(3)茎叶图。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
2.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数。
(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:=,反映了一组数据的平均水平。
(4)标准差:是样本数据到平均数的一种平均距离,s=。
(5)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数)。
1.频率分布直方图中各小矩形的面积之和为1。
2.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数。
(2)中位数左边和右边的小长方形的面积和是相等的。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a。
(2)数据x1,x2,…,xn的方差为s2。
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2。
一、走进教材
1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。
解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为:0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。
答案 25
2.(必修3P82A组T6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲 0 1 0 2 2 0 3 1 2 4
乙 2 3 1 1 0 2 1 1 0 1
则机床性能较好的为________。
解析 因为甲=1.5,乙=1.2,s=1.65,s=0.76,所以s
二、走近高考
3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。
解析 由茎叶图可得分数的平均数为
=90。
答案 90
4.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3。
答案 A
三、走出误区
微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。
5.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2 B.16,2
C.16,18 D.16,9
解析 因为x1,x2,x3,…,xn的平均数为5,所以=5,所以+1=3×5+1=16,因为x1,x2,x3,…,xn的方差为2,所以3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。故选C。
答案 C
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为________。(用“<”连接)
解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;=
≈5.97。故n
考点一 频率分布直方图
【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5。
所以总体中分数在区间[40,50)内的人数估计为400×=20。
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。
所以样本中分数不小于70的男生人数为60×=30。
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2。
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是,而不是频率。
2.与频率分布直方图计算有关的两个关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数。
【变式训练】 (2019·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20 D.25
解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。故选A。
答案 A
考点二 茎叶图
【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为( )
A. B.2
C. D.9
解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1。由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4。由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=×=≥×(5+4)=(当且仅当b=2a时取等号)。故+的最小值为。故选C。
答案 C
1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。
【变式训练】 (1)(2019·长春质量监测)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86
C.99,86 D.95,91
(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。
解析 (1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。故选B。
(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。抽到的7人的编号为3,8,13,18,23,28,33,成绩为133,138,141,143,145,148,153,平均成绩是×(133+138+141+143+145+148+153)=143。
答案 (1)B (2)143
考点三 样本的数字特征微点小专题
方向1:样本方差的计算
【例3】 (1)(2019·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为( )
A. B.
C.6 D.30
(2)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________。
解析 (1)由茎叶图知,最低分为87分,最高分为99分。依题意得,×(87+93+90+90+x+91)=91,解得x=4。则剩余5个得分的方差s2=×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+4+1+9)=6。故选C。
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2。
答案 (1)C (2)2
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。
2.方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方。
方向2:用样本数字特征估计总体
【例4】 (2019·贵阳摸底考试)某高校学生社团为了解“大数据时代”下毕业生对就业情况的满意度,对20名毕业生进行问卷计分调查(满分100分),得到如图所示的茎叶图:
(1)计算男生打分的平均分,观察茎叶图,评价男、女生打分的分散程度;
(2)从打分在80分以上的毕业生中随机抽取3人,求被抽到的女生人数X的分布列和数学期望。
解 (1)男生打分的平均分为
×(55+53+62+65+71+70+73+74+86+81)=69。
由茎叶图知,女生打分比较集中,男生打分比较分散。
(2)因为打分在80分以上的毕业生有3女2男,所以X的可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X
1
2
3
P
E(X)=1×+2×+3×=。
若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。
【题点对应练】
1.(方向1)一组数据1,10,5,2,x,2,且2
答案 9
2.(方向1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________。
解析 依题意,x1,x2,x3,…,x10的方差s2=64。则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16。
答案 16
3.(方向2)某商家为了解“双十一”这一天网购者在其网店一次性购物的情况,从这一天交易成功的所有订单中随机抽取了100份,按购物金额(单位:元)进行统计,得到的频率分布直方图如图所示。
(1)该商家决定对这100份订单中购物金额不低于1 000元的订单按区间[1 000,1 200),[1 200,1 400]采用分层抽样的方法抽取6份,对买家进行售后回访,再从这6位买家中随机抽取3位赠送小礼品。求获赠小礼品的3位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]的概率。
(2)若该商家制订了两种不同的促销方案:
方案一:全场商品打八折;
方案二:全场购物每满200元减40元,每满600元减150元,每满1 000元减300元,以上减免只享受最高优惠。例如:购物金额为500元时,可享受最高优惠80元;购物金额为900元时,可享受最高优惠190元。
利用直方图中的数据,计算说明哪种方案的优惠力度更大(同一组中的数据用该组区间的中点值作代表)。
解 (1)在这100份订单中,购物金额位于区间[1 000,1 200)的有0.000 50×200×100=10份,位于区间[1 200,1 400]的有0.000 25×200×100=5份,则购物金额位于区间[1 000,1 400]的订单共有15份,利用分层抽样抽取6份,则位于区间[1 000,1 200)的有4份,位于区间[1 200,1 400]的有2份,设事件A表示“获赠小礼品的3位买家中,至少有1位买家的购物金额位于区间[1 200,1 400]”,则P(A)=1-=。
(2)由直方图知,各组的频率依次为0.1,0.2,0.25,0.3,0.1,0.05。
方案一:最高优惠的平均值为
(300×0.1+500×0.2+700×0.25+900×0.3+1 100×0.1+1 300×0.05)×0.2=150(元);
方案二:最高优惠的平均值为
40×0.1+80×0.2+150×0.25+190×0.3+300×0.1+340×0.05=161.5(元),
由于150<161.5,所以方案二的优惠力度更大。
1.(配合例1、例4使用)如图为2018届淮北师范大学数学与应用数学专业N名毕业生的综合测评成绩(百分制)分布直方图,已知80~90分数段的学员数为21人。
(1)求该专业毕业总人数N和90~95分数段内的人数n;
(2)现欲将90~95分数段内的n名毕业生随机地分配到A,B,C三所学校,每所学校至少分配两名毕业生。
①若这n名毕业生中甲、乙两人必须进同一所学校,共有多少种不同的分配方法?
②若这n名毕业生中恰有两名女生,设随机变量ξ表示n名毕业生中分配到B学校的两名毕业生中女生的人数,求ξ的分布列和数学期望。
解 (1)80~90分数段的频率p1=(0.04+0.03)×5=0.35,此分数段的学员总数为21人,
所以毕业生的总人数N==60,
90~95分数段的频率p2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.1,
所以90~95分数段内的人数n=60×0.1=6。
(2)①将90~95分数段内的6名毕业生随机地分配到A,B,C三所学校,每所学校至少分配两名毕业生,且甲、乙两人必须进同一所学校,则共有·A=18种不同的分配方法。
②ξ的所有可能取值为0,1,2,
P(ξ=0)==,
P(ξ=1)==,
P(ξ=2)==,
所以ξ的分布列为
ξ
0
1
2
P
所以随机变量ξ的数学期望为E(ξ)=0×+1×+2×=。
2.(配合例2、例3使用)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )
A.2 B.
C.10 D.
解析 甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为
=。故选B。
答案 B
相关资料
更多