高考数学一轮复习高考大题增分专项六高考中的概率、统计与统计案例课件文
展开从近五年的高考试题来看,在高考的解答题中,对概率、统计与统计案例的考查主要有三个方面:一是统计与统计案例,以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,其中回归分析、独立性检验、用样本的数据特征估计总体的数据特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生数据处理能力;二是统计与概率综合,以现实生活为背景,利用频率估计概率,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;三是古典概型的综合应用,以现实生活为背景,求某些事件发生的概率,常与抽样方法、茎叶图等统计知识交汇考查.
已知样本的频率分布表或样本的频率分布直方图,求样本的中位数、平均数、方差、标准差等数字特征.由于每个样本的具体值不知道,只知道各区间上的端点值,这时取区间两端数据的平均值作为样本的具体值,求样本的数字特征.
例1我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100名居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.
解:(1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1),100名居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.
对点训练1从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
(2)质量指标值的样本平均数为
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,因此不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①当年宣传费x=49时,年销售量及年利润的预报值是多少?②当年宣传费x为何值时,年利润的预报值最大?
(3)①由(2)知,当x=49时,年销售量y的预报值
对点训练2为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
解:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
在统计中,一般通过计算现实生活中某事件的频率,从而用来估计事件的概率,然后用概率计算其他事件的数量.
例3某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
解:(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为 =0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.
(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900;若最高气温位于区间[20,25),则Y=6×300+2(450-300)-4×450=300;若最高气温低于20,则Y=6×200+2(450-200)-4×450=-100.所以,Y的所有可能值为900,300,-100.
因此Y大于零的概率的估计值为0.8.
对点训练3某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400× =20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60× =30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
在求古典概型的概率时,常常应用列举法找出基本事件数及所求事件包含基本事件数.列举的方法通常有直接分类列举、列表、树状图等.
例4某优质高中为了选拔学生参加“全国中学生英语能力竞赛(NEPCS)”,先在本校进行初赛(满分150分),若该校有100名学生参加初赛,并根据初赛成绩得到如图所示的频率分布直方图.(1)根据频率分布直方图,计算这100名学生参加初赛成绩的中位数;(2)该校推荐初赛成绩在110分以上的学生代表学校参加竞赛,为了了解情况,在该校推荐参加竞赛的学生中随机抽取2人,求选取的2人的初赛成绩在频率分布直方图中处于不同组的概率.
解:(1)设初赛成绩的中位数为x,则(0.001+0.004+0.009)×20+0.02×(x-70)=0.5,解得x=81,故初赛成绩的中位数为81.(2)该校学生的初赛分数在[110,130)有0.002×20×100=4(人),分别记为A,B,C,D;分数在[130,150]有0.001×20×100=2(人),分别记为a,b.在这6人中随机选取2人,总的基本事件有(A,B),(A,C),(A,D),(A,a),(A,b),(B,C),(B,D),(B,a),(B,b),(C,D),(C,a),(C,b),(D,a),(D,b),(a,b)共15个,其中符合题设条件的基本事件有8个.故选取的2人的初赛成绩在频率分布直方图中处于不同组的概率为
对点训练4(2018陕西延安模拟)某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量(单位:克)分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400]中,经统计得频率分布直方图如图所示.
(1)现按分层抽样从质量为[250,300),[300,350)的芒果中随机抽取6个,再从这6个芒果中随机抽取3个,求这3个芒果中恰有1个质量在[300,350)内的概率;(2)某经销商来收购芒果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10 000个,经销商提出如下两种收购方案:A方案:所有芒果以10元/千克收购;B方案:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购.通过计算确定该种植园选择哪种方案获利更多.
解:(1)抽取的6个芒果中,质量在[250,300)和[300,350)的分别有4个、2个,设质量在[250,300)的4个芒果分别为A,B,C,D,质量在[300,350)的2个芒果分别为a,b.从这6个芒果中选出3个芒果的情况共有(A,B,C),(A,B,D),(A,B,a),(A,B,b),(A,C,D),(A,C,a),(A,C,b),(A,D,a),(A,D,b),(A,a,b),(B,C,D),(B,C,a),(B,C,b),(B,D,a),(B,D,b),(B,a,b),(C,D,a),(C,D,b),(C,a,b),(D,a,b),共20种,其中恰有1个质量在[300,350)的情况有(A,B,a),(A,B,b),(A,C,a),(A,C,b),(A,D,a),(A,D,b),(B,C,a),(B,C,b),(B,D,a),(B,D,b),(C,D,a),(C,D,b),共12种,
(2)方案A:(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).方案B:由题意,得质量低于250克获利(0.002+0.002+0.003)×50×10 000×2=7 000(元);质量高于或等于250克获利(0.008+0.004+0.001)×50×10 000×3=19 500(元);7 000+19 500=26 500(元).由于25 750<26 500,因此B方案获利更多,应选B方案.
比较多,且公式中两类数据错综复杂,容易代错,运用列表法列出需要的数据,并对数据依据公式进行合并,减少了代入公式量的个数,再代入公式求解运算的准确性高.
例5某工厂有25周岁及以上的工人300名,25周岁以下的工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁及以上”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
25周岁以下组(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断能否在犯错误的概率不超过0.10的前提下认为“生产能手与工人所在的年龄组有关”?
解:(1)由已知得,样本中有25周岁及以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,分别是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,分别是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率为
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁及以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
因为1.79<2.706,所以在犯错误的概率不超过0.10的前提下不能推断“生产能手与工人所在的年龄组有关”.
对点训练5微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间不超过一小时的有60人,其余每天使用微信在一小时以上,若将员工年龄分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,使用微信的人中75%是青年人,若规定:每天使用微信时间在一小时以上为经常使用微信,经常使用微信的员工中 是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表.
(2)根据列联表中的数据,判断能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”.(3)采用分层抽样的方法从“经常使用微信”的人中抽取6人,从这6人中任选2人,求选出的2人均是青年人的概率.
解:(1)由已知可得,该公司员工中使用微信的共200×0.9=180(人).经常使用微信的有180-60=120(人),其中青年人有120× =80(人).使用微信的青年人共有180×75%=135(人).所以可列下面2×2列联表:
(2)将列联表中的数据代入公式可得
所以在犯错误的概率不超过0.001的前提下,认为“经常使用微信与年龄有关”.(3)从“经常使用微信”的人中抽取6人中,青年人有 ×6=4人,中年人有2人.设4名青年人编号分别为1,2,3,4,2名中年人编号分别为5,6,则“从这6人中任选2人”的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个.设“选出的2人均是青年人”为事件A,则事件A包含的基本事件为(1,2),(1,3),(1,4),(2,3),(2,4),(3,4)共6个.故P(A)= .
解决概率与统计相结合的综合问题,读懂题意是关键,能从题目的统计背景中抽取有关概率的相关信息,然后将信息转化为概率试验中的基本关系,按照求某事件概率的方法,计算试验的基本事件数和所求事件包含的基本事件数,进而依据古典概型的概率公式求解.所以原不等式成立.当且仅当a=b=c时,①式和②式等号成立.
广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版文: 这是一份广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版文,共26页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,-4-,-5-,-6-,-7-,-8-等内容,欢迎下载使用。
广西专用高考数学一轮复习高考大题增分专项五高考中的解析几何课件新人教A版文: 这是一份广西专用高考数学一轮复习高考大题增分专项五高考中的解析几何课件新人教A版文,共41页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,题型四,题型五,题型六,-4-,-5-等内容,欢迎下载使用。
广西专用高考数学一轮复习高考大题增分专项六高考中的概率统计与统计案例课件新人教A版理: 这是一份广西专用高考数学一轮复习高考大题增分专项六高考中的概率统计与统计案例课件新人教A版理,共60页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,题型四,题型五,题型六,-4-,-5-等内容,欢迎下载使用。