2019版高中数学二轮复习教师用书:专题四第2讲 大题考法——统计与概率
展开第2讲 大题考法——统计与概率
考向一 统计与概率的综合问题
【典例】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温 | [10,15) | [15,20) | [20,25) |
天数 | 2 | 16 | 36 |
| |||
最高气温 | [25,30) | [30,35) | [35,40) |
天数 | 25 | 7 | 4 |
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)
(2)设六月份一天销售这种(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
[审题指导]
①看到表格,想到表中最高气温与天数的对应关系
②看到估计概率,想到频率与概率的关系可得估计值
③看到酸奶的利润,想到进货成本与售价,注意条件中未售出的酸奶要当天全部降价处理
[规范解答] (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25❶,
2分
由表格数据知,最高气温低于25的频率为=0.6, 4分
所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6. 5分
(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900❷; 6分
若最高气温位于区间[20,25),
则Y=6×300+2(450-300)-4×450=300❸; 7分
若最高气温低于20,
则Y=6×200+2(450-200)-4×450=-100❹. 8分
所以Y的所有可能值为900,300,-100. 10分
Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为=0.8, 11分
因此Y大于零的概率的估计值为0.8. 12分
❶处注意结合题意将需求量不超过300瓶转化为最高气温的关系问题,再利用频率估计概率,易不理解题意失误.
❷❸❹处注意结合气温区间及需求量的关系,计算出Y值,易忽视卖不完的要降价处理.
[技法总结] 求解决概率与统计综合问题的一般步骤
[变式提升]
1.(2018·山西一模)某快递公司收取快递费用的标准是:重量不超过1 kg的包裹收费10元;重量超过1 kg的包裹,除1 kg收费10元之外,超过1 kg的部分,每超出1 kg(不足1 kg,按1 kg计算)需再收5元.
该公司对近60天,每天揽件数量统计如下表:
包裹件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
天数 | 6 | 6 | 30 | 12 | 6 |
(1)某人打算将A(0.3 kg),B(1.8 kg),C(1.5 kg)三件礼物随机分成两个包裹寄出,求该人支付的快递费不超过30元的概率;
(2)该公司从收取的每件快递的费用中抽取5元作为前台工作人员的工资和公司利润,剩余的作为其他费用.前台工作人员每人每天揽件不超过150件,工资100元,目前前台有工作人员3人,那么,公司将前台工作人员裁员1人对提高公司利润是否更有利?
解 (1)由题意,寄出方式有以下三种可能:
情况 | 第一包裹 | 第二包裹 | 甲支付的 总快递费 | ||||
礼物 | 重量 (kg) | 快递 费(元) | 礼物 | 重量 (kg) | 快递 费(元) | ||
1 | A | 0.3 | 10 | B,C | 3.3 | 25 | 35 |
2 | B | 1.8 | 15 | A,C | 1.8 | 15 | 30 |
3 | C | 1.5 | 15 | A,B | 2.1 | 20 | 35 |
所有3种可能中,有1种可能快递费未超过30元,根据古典概型概率计算公式,所示概率为.
(2)将题目中的天数转化为频率,得
包裹件 数范围 | 0~ 100 | 101~ 200 | 201~ 300 | 301~ 400 | 401~ 500 |
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
天数 | 6 | 6 | 30 | 12 | 6 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下:
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
实际揽件数 | 50 | 150 | 250 | 350 | 450 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
平均揽件数 | 50×0.1+150×0.1+250×0.5+350×0.2+450×0.1=260 |
故公司平均每日利润的期望值为
260×5-3×100=1 000(元);
若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下:
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
实际揽件数 | 50 | 150 | 250 | 300 | 300 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
平均揽件数 | 50×0.1+150×0.1+250×0.5+300×0.2+300×0.1=235 |
故公司平均每日利润的期望值为235×5-2×100=975(元).故公司将前台工作人员裁员1人对提高公司利润不利.
考向二 回归分析与统计的交汇问题
【典例】 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
附注:年份代码1~7分别对应年份2008~2014
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:i=9.32,iyi=40.17, =0.55,≈2.646.
参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为=,=-.
解 (1)由折线图中的数据和附注中的参考数据得=4,
(ti-)2=28, =0.55,
(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,
所以r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得
==≈0.103.
=-≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得
=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
[技法总结] 破解回归分析问题的关键
(1)会依据表格及公式=,=-求线性回归方程中的参数的值,注意不要代错公式.
(2)已知变量的某个值去预测相应预报变量时,只需把该值代入回归方程=x+中.
[变式提升]
2.(2018·龙岩二模)2017年5月,“一带一路”沿线的20国青年评选出了中国“新四大发明”:高铁、支付宝、共享单车和网购.2017年末,“支付宝大行动”用发红包的方法刺激支付宝的使用. 某商家统计前5名顾客扫描红包所得金额分别为5.5元,2.1元,3.3元,5.9元,4.7元,商家从这5名顾客中随机抽取3人赠送台历.
(1)求获得台历是三人中至少有一人的红包超过5元的概率;
(2)统计一周内每天使用支付宝付款的人数x与商家每天的净利润y元,得到7组数据,如表所示,并作出了散点图.
x | 12 | 16 | 26 | 29 | 25 | 22 | 30 |
y | 60 | 100 | 150 | 270 | 240 | 210 | 330 |
①直接根据散点图判断,y=a+bx与y=ec+dx哪一个适合作为每天的净利润的回归方程类型.(a,b,c,d的值取整数)
②根据①的判断,建立y关于x的回归方程,并估计使用支付宝付款的人数增加到35时,商家当天的净利润.
参考数据:
(xi-)2 | (xi-)(yi-) | ||
22.86 | 194.29 | 268.86 | 3 484.29 |
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为=,=-.
解 (1)记事件“获得台历的三人中至少有一人的红包超过5元”为事件M,5名顾客中红包超过5元的两人分别记为A1,A2,不足5元的三人分别记为B1,B2,B3,从这5名顾客中随机抽取3人,共有抽取情况如下:A1A2B1,A1A2B2,A1A2B3,A1B1B2,A1B1B3,A1B2B3,A2B1B2,A2B1B3,A2B2B3,B1B2B3,共10种.
其中至少有一人的红包超过5元的是前9种情况,
所以P(M)=.
(2)①根据散点图可判断,选择y=a+bx作为每天的净利润的回归方程类型比较适合.
②由最小二乘法求得系数
==≈13,
所以=- =194.29-13×22.86≈-103,
所以y关于x的回归方程为=-103+13x.
当x=35时,商家当天的净利润y=352元,
故使用支付宝付款的人数增加到35时,预计商家当天的净利润为352元.
考向三 独立性检验与概率、统计的交汇问题
【典例】 (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
| 箱产量<50 kg | 箱产量≥50 kg |
旧养殖法 |
|
|
新养殖法 |
|
|
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
,
K2=.
解 (1)旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
| 箱产量<50 kg | 箱产量≥50 kg |
旧养殖法 | 62 | 38 |
新养殖法 | 34 | 66 |
K2的观测值=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
[技法总结] 独立性检验问题的解题步骤
(1)假设两个分类变量X与Y无关系;
(2)找相关数据,列出2×2列联表;
(3)由公式K2=(其中n=a+b+c+d)计算出K2的观测值;
(4)将K2的观测值与临界值进行对比,进而得出统计推断,这些临界值,在考题中常会附在题后.
[变式提升]
3.(2018·六安二模)以“你我中国梦,全民建小康”为主题“社会主义核心价值观”为主线,为了解A、B两个地区的观众对2018年韩国平昌冬奥会准备工作的满意程度,对A、B地区的100名观众进行统计,统计结果如下:
| 非常满意 | 满意 | 合计 |
A | 30 | y |
|
B | x | z |
|
合计 |
|
|
|
在被调查的全体观众中随机抽取1名“非常满意”的人是B地区的概率为0.45,且3z=2y.
(1)现从100名观众中用分层抽样的方法抽取20名进行问卷调查,则应抽取“满意”的A、B地区的人数各是多少?
(2)在(1)抽取的“满意”的观众中,随机选出3人进行座谈,求至少有两名是A地区观众的概率?
(3)完成上述表格,并根据表格判断是否有95%的把握认为观众的满意程度与所在地区有关系?
附:
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
K2=
解 (1)由题意,得=0.45,∴x=45,∴y+z=25,
因为3z=2y,所以y=15,z=10.
则应抽取A地区的“满意”观众×15=3,抽取B地区的“满意”观众×10=2.
(2)所抽取的A地区的“满意”观众记为a,b,c,所抽取的B地区的“满意”观众记为1,2.
则随机选出三人的不同选法有(a,b,1),(a,b,2),(a,c,1),(a,c,2),(b,c,1),(b,c,2),(a,b,c),(a,1,2),(b,1,2),(c,1,2), 共10个结果.
至少有两名是A地区的结果有7个,其概率为.
(3)
| 非常满意 | 满意 | 合计 |
A | 30 | 15 | 45 |
B | 45 | 10 | 55 |
合计 | 75 | 25 | 100 |
由表格K2==≈3.030<3.841,所以没有95%的把握认为观众的满意程度与所在地区有关系.