2012届高考数学一轮复习课件(理科)11.2 《用样本估计总体》新人教版必修3
展开
这是一份2012届高考数学一轮复习课件(理科)11.2 《用样本估计总体》新人教版必修3,共55页。
§11.2 用样本估计总体要点梳理1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种, 一种是用 .另一种 是用 . (2)在频率分布直方图中,纵轴表示 ,数据 落在各小组内的频率用 表示. 各小长方形的面积总和 .样本的频率分布估计总体的分布样本的数字特征估计总体的数字特征各小长方形的面积等于1基础知识 自主学习 (3)连结频率分布直方图中各小长方形上端的中 点,就得到频率分布折线图.随着 的增 加,作图时所分的 增加,相应的频率分布折 线图就会越来越接近于一条光滑的曲线,统计中 称之为 ,它能够更加精细的反映出 . (4)当样本数据较少时,用茎叶图表示数据的效 果较好,它不但可以 ,而且可以 ,给数据的 和 都带来方便.样本容量组数总体密度曲线各个范围内取值的百分比总体在保留所有信息随时记录记录表示2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = . 在频率分布直方图中,中位数左边和右边的直方 图的面积应该 .最多最中间中位数相等(2)样本方差、标准差标准差s=其中xn是 ,n是 , 是 . 是反映总体波动大小的特征数,样本方差是标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差.样本数据的第n项样本容量数平均标准差本容量接近总体容量平方样基础自测1.一个容量为32的样本,已知某组样本的频率为 0.375,则该组样本的频数为 ( ) A.4 B.8 C.12 D.16 解析 频率= .∴频数=频率×容量= 0.375×32=12.C2.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为 ( ) A.5,24 B.5,24 C.4,25 D.4,25 解析 ∵中位数为5,∴5= ,∴x=6. s2= [(5+1)2+(5-0)2+(5-4)2+(5-6)2+(5-7)2+(5-14)2]=24 .A3.某雷达测速区规定:凡车速大于或等于70 km/h的 汽车视为“超速”,并将受到处罚,如图是某路段 的一个检测点对200辆汽车的车速进行检测所得结 果的频率分布直方图,则从图中可以看出被处罚 的汽车大约有 ( )A.30辆 B.40辆 C.60辆 D.80辆解析 由图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被罚的汽车大约有200×0.2=40辆.答案 B4.甲、乙两位同学参加了由学校举办的篮球比赛,它 们都参加了全部的7场比赛,平均得分均为16分, 标准差分别为5.09和3.72,则甲、乙两同学在这次 篮球比赛活动中,发挥得更稳定的是( ) A.甲 B.乙 C.甲、乙相同 D.不能确定 解析 平均数相同,看谁的标准差小,标准差小的 就稳定.B5.一个容量为20的样本数据,分组后,组别与频数如下:则样本在(20,50]上的频率为 .解析 =60%.60%题型一 频率分布直方图在总体估计中的应用【例1】 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.题型分类 深度剖析 (1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 利用面积求得每组的频率→求样本容量→求频率和→求达标率解 (1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1解得 x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.34+0.3+0.18+0.06=0.88.则高一学生的达标率约为0.88×100%=88%.思维启迪 探究提高 用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距.(2)频率分布直方图中各长方形高的比也就是其频率之比.(3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.知能迁移1 有一容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16; [18.5,21.5),18;[21.5,24.5),22; [24.5,27.5),20;[27.5,30.5),10; [30.5,33.5),8. (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)估计数据小于30.5的概率.解 (1)样本的频率分布表如下: (2)频率分布直方图如下图所示.(3)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的概率约为0.92.题型二 茎叶图的应用【例2】 某班甲、乙两学生的高考备考成绩如下: 甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分. (1)将十位与百位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得出结论.思维启迪解 (1)两学生成绩的茎叶图如图所示.(2)将甲、乙两学生的成绩从小到大排列为:甲:512 522 528 534 536 538 541 549 554 556乙:515 521 527 531 532 536 543 548 558 559从以上排列可知甲学生成绩的中位数为 =537.乙学生成绩的中位数为 =534.甲学生成绩的平均数为500+ =537,乙学生成绩的平均数为 =537. (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.12+22+28+34+36+38+41+49+54+56 1015+21+27+31+32+36+43+48+58+59 10500+探究提高知能迁移2 (2008·海南,宁夏理,16)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356由以上数据设计了如下茎叶图:根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:① ;② .解析 由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在312~337之间),还可以看出乙的平均长度应大于310,而甲的平均长度要小于310等,通过分析可得到以下结论.答案 ①乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度). ②甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大). ③甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm. ④乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.题型三 用样本的数字特征估计总体的数字特征【例3】(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩 作出评价. (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解 (1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. 2分思维启迪 5分 [(10-13)2+(13-13)2+(12-13)2+(14-13) 2 +(16-13)2]=4, [(13-13)2+(14-13)2+(12-13)2+(12-13)2+ (14-13)2]=0.8. 8分 (2)由 > 可知乙的成绩较稳定. 10分 从折线图看,甲的成绩基本呈上升状态,而乙的成 绩上下波动,可知甲的成绩在不断提高,而乙的成 绩则无明显提高. 12分探究提高 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)平均数、方差的公式推广①若数据x1,x2,…,xn的平均数为 ,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m +a.②数据x1,x2,…,xn的方差为s2.a.s2=b.数据x1+a,x2+a,…,xn+a的方差也为s2;c.数据ax1,ax2,…,axn的方差为a2s2.知能迁移3 甲、乙两台机床同时加工直径为10 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解 (1) [(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]= . [(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)因为 > ,说明甲机床加工的零件波动比较大,因此乙机床加工的零件更符合要求.方法与技巧1.用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.思想方法 感悟提高 (2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了. (3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图显得不太方便了.3.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.失误与防范 不要把直方图错以为条形图,两者的区别在于条形 图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度.连续随机变量在某一点上是没有频率的.一、选择题1.在样本的频率分布直方图中,共有11个小长方形,若 中间一个小长方形的面积等于其他10个小长方形的面 积和的 ,且样本容量为160,则中间一组的频数为 ( ) A.32 B.0.2 C.40 D.0.25 解析 中间一个占总面积的 ,即A定时检测2.10名工人某天生产同一零件,生产的件数是 15,17,14,10,15,17, 17,16, 14,12,设其平均数 为a,中位数为b,众数为c,则有 ( ) A.a>b>c B.b>c>a C.c>a>b D.c>b>a 解析 平均数a= (15+17+14+10+15+17+17+16+14 +12)=14.7.中位数b=15,众数c=17.∴c>b>a.D3.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是 ( )A.32 B.27 C.24 D.33解析 80~100间两个长方形高占总体的比例: 即为频数之比.∴ ∴x=33.答案 D4.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为 ( )A.64 B.54 C.48 D.27解析 前两组中的频数为100×(0.05+0.11)=16.∵后五组频数和为62,∴前三组为38.∴第三组为22.又最大频率为0.32的最大频数为0.32×100=32,∴a=22+32=54.答案 B5.(2009·山东理,8)某工厂对 一批产品进行了抽样检测,右 图是根据抽样检测后的产品净 重(单位:克)数据绘制的频 率分布直方图,其中产品净重 的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是 ( ) A.90 B.75 C.60 D.45 解析 产品净重小于100克的频率为(0.050+0.100) ×2=0.300,已知样本中产品净重小于100克的个数 是36,设样本容量为n,则 =0.300,所以n=120, 净重大于或等于98克并且小于104克的产品的频率 为(0.100+0.150+0.125)×2=0.750,所以样本 中净重大于或等于98克并且小于104克的产品的个 数是120×0.750=90. 答案 A6.下图是某学校举行的运动会上七位评委为某体操 项目打出的分数的茎叶统计图,去掉一个最高分 和一个最低分后,所剩数据的平均数和方差分别 为 ( ) 7 9 8 4 4 6 4 7 9 3 A.84,4.84 B.84,1.6 C.85,1.6 D.85,4 解析 去掉最高分93,最低分79, 平均分为 (84+84+86+84+87)=85, 方差s2= [(84-85)2+(84-85)2+(86-85)2+(84- 85)2+(87-85)2]= =1.6.C二、填空题7.甲、乙两名射击运动员参加某大型运动会的预选 赛,他们分别射击了5次,成绩如下表(单位: 环): 如果甲、乙两人中只有1人入选,则入选的最佳人选应是 . 解析 [(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]= , [(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]= ,故甲更稳定,故填甲.答案 甲8.为了了解“预防禽流感疫苗”的使用情况,某市卫 生部门对本地区5月份至7月份使用疫苗的所有养 鸡场进行了调查,根据下列图表提供的信息,可 以得出这三个月本地区平均每月注射了疫苗的鸡 的数量为 万只. 解析 ×(20×1+50×2+100×1.5)=90万只. 答案 909.(2009·福建理,12)某校开展“爱我海西、爱 我家乡”摄影比赛,9位评委为参赛作品A给出的 分数如茎叶图所示.记分员在去掉一个最高分和 一个最低分后,算得平均分为91,复核员在复核 时,发现有一个数字(茎叶图中的x)无法看清, 若记分员计算无误,则数字x应该是 . 解析 当x≥4时, ∴x<4,则 =91,∴x=1.1三、解答题10.甲、乙两台机床同时生产一种零件,在10天中, 两台机床每天出的次品数分别是:分别计算两个样本的平均数与方差,从计算结果看,哪台机床10天生产中出次品的平均数较小?出次品的波动较小?解 (0×3+1×2+2×3+3×1+4×1)=1.5, (0×2+1×5+2×2+3×1)=1.2, [(0-1.5)2+(1-1.5)2+(0-1.5)2+…+(2-1.5)2+(4-1.5)2]=1.65, [(2-1.2)2+(3-1.2)2+(1-1.2)2+…+(0-1.2)2+(1-1.2)2]=0.76.从结果看乙台机床10天生产出次品的平均数较小,出次品的波动也较小.11.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在[1 000,1 500))(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这段应抽多少人?(3)试估计样本数据的中位数.解 (1)∵月收入在[1 000,1 500)的概率为0.000 8×500=0.4,且有4 000人,∴样本的容量n= =10 000;月收入在[1 500,2 000)的频率为0.000 4×500=0.2;月收入在[2 000,2 500)的频率为0.000 3×500=0.15;月收入在[3 500,4 000)的频率为0.000 1×500=0.05.∴月收入在[2 500,3 500)的频率为1-(0.4+0.2+0.15+0.05)=0.2.∴样本中月收入在[2 500,3 500)的人数为0.2×10 000=2 000.(2)∵月收入在[1 500,2 000)的人数为0.2×10 000=2 000,∴再从10 000人中用分层抽样方法抽出100人,则月收入在[1 500,2 000)的这段应抽取100×=20(人).(3)由(1)知月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5,∴样本数据的中位数为1 500+ =1 500+250=1 750(元).12.为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门将某校12名学生分为两组进行问卷调查.第一组的得分情况为:5,6,7,8,9,10;第二组的得分情况为:4,6,7,9,9,10. (1)根据以上数据,判断两组中哪组更优秀? (2)把第一组的6名学生的得分看成一个总体.用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率.解 (1)第一组的得分平均数为 ×(5+6+7+8+9+10)=7.5 ×[(5-7.5)2+(6-7.5)2+(7-7.5)2+(8-7.5)2+(9-7.5)2+(10-7.5)2]= ×17.5.第二组的得分平均数为 ×(4+6+7+9+9+10)=7.5, × [(4-7.5)2+(6-7.5)2+(7-7.5)2+(9-7.5)2+(9-7.5)2+(10-7.5)2]= ×25.5.所以 说明第一组和第二组的平均得分相同,但是第一组比第二组更稳定,故第一组比第二组更优秀.(2)由(1)知 =7.5.设A表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”.从总体中抽取两个个体的全部可能的基本结果有:(5,6),(5,7),(5,8),(5,9),(5,10),(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共15个基本结果.事件A包括的基本结果有:(5,9),(5,10),(6,8),(6,9),(6,10),(7,8),(7,9),共有7个基本结果.所以所求的概率为P(A)= . 返回