2021届高考数学(文)一轮复习学案:概率规范答题系列4高考中的概率与统计问题
展开
规范答题系列4 高考中的概率与统计问题
[命题解读] 从近五年全国卷高考试题来看,概率与统计题多出现在第18题或第19题位置上,2019年全国卷Ⅰ,Ⅲ出现在第17题,全国卷Ⅱ出现在第19题,整体难度有所下降,本专题热点题型有:一是考查用样本估计总体,用频率估计概率;二是考查概率与独立性检验问题;三是考查概率与线性回归问题.
[典例示范] (本题满分12分)(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由①;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表②:
| 超过m | 不超过m |
第一种生产方式 |
|
|
第二种生产方式 |
|
|
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?③
附:χ2=,
P(χ2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
[信息提取] 看到①想到茎叶图的数据特征及数据的分布特点.
看到②想到列联表数据的获得,想到先求m.
看到③想到先求χ2的值,再根据χ2的值判断结论是否成立.
[规范解答](1)第二种生产方式的效率更高. 2分
理由如下:
(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80分钟;用第二种生产方式的工人完成生产任务所需平均时间低于80分钟.因此第二种生产方式的效率更高.
(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
(以上给出了4种理由,答出其中任意一种或其他合理理由均可得分) 5分
(2)由茎叶图知m==80. 7分
列联表如下:
| 超过m | 不超过m |
第一种生产方式 | 15 | 5 |
第二种生产方式 | 5 | 15 |
9分
(3)因为χ2==10>6.635, 11分
所以有99%的把握认为两种生产方式的效率有差异.12分
[易错防范]
易错点 | 防范措施 |
错把平均数大的数据当成效率更高 | 审题要认真、仔细 |
把m值求错 | 关键数据不能错,多检查一遍 |
K2的值求错 | 注意K2公式中每一个字母的含义 |
[通性通法]
1.通过茎叶图中数据的分布情况,可大体判断两组数据平均数的大小,方差的大小,中位数的大小等,从而得到统计结论.
2.进行独立性检验时,列2×2列联表是解题的关键,应正确列出列联表,再求χ2进行判断.
[规范特训] (2019·兰州模拟)“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片.随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人口逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数 | 不大于2天 | 3天或4天 | 不少于5天 |
人数 | 30 | 130 | 40 |
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“是否热烈参与马拉松”与性别有关?
| 热烈参与者 | 非热烈参与者 | 总计 |
男 |
|
| 140 |
女 |
| 55 |
|
总计 |
|
|
|
参考公式及数据:χ2=,其中n=a+b+c+d.
P(χ2≥k) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
[解](1)以200人中“热烈参与者”的频率作为概率,
可得该市“热烈参与者”的人数约为20 000×=4 000.
(2)由题可得2×2列联表如下:
| 热烈参与者 | 非热烈参与者 | 总计 |
男 | 35 | 105 | 140 |
女 | 5 | 55 | 60 |
总计 | 40 | 160 | 200 |
则χ2==≈7.292>6.635,
所以能在犯错误的概率不超过0.01的前提下认为“是否热烈参与马拉松”与性别有关.