所属成套资源:备战2021年高考数学(理) 一轮复习易错点
备战2021年高考数学(理)一轮复习 易错点13 概率与统计 学案
展开
易错点13 概率与统计
易错点1:两个计数原理
①排列组合问题基于两个基本计数原理,即加法原理和乘法原理;故理解“分类用加、分步用乘”是解决排列组合问题的前提.
②在判断一个问题是排列还是组合问题时,主要看元素的组成有没有顺序性,有顺序的是排列,无顺序的是组合.
③在排列组合中常会遇到元素分配问题、平均分组问题等,这些问题要注意避免重复计数,产生错误。
④在排列组合问题中还可能由于考虑问题不够全面,因为遗漏某些情况,而出错。
易错点2:二项式定理
①通项公式与展开式中的第r项区别
②二项式展开式中a,b排列顺序设置陷阱
③不能区分二项式系数和项的系数
易错点3:概率
①对于两个事件和,在已知事件发生的条件下,事件发生的概率叫做条件概率,用符号来表示,其公式为.
②相互独立事件:若与相互独立,则,·.
③二项分布:在次独立重复试验中,事件发生次的概率为(……,)(为事件发生的概率),事件发生的次数是一个随机变量,其分布列为二项分布,记为.
易错点4:统计初步
①统计部分主要研究两个方向,一是对数据的收集,二是对收集的数据进行分析。
②数据收集:从总体中获取样品数据的方法,主要有三种:简单的随机抽样,系统抽样和分层抽样。
③数据分析:用抽取的样本数据评估总体数据的分布情况主要从两个方面入手:数字特征和统计图表。
④样本的数字特征包括:众数,中位数,平均数,方差和标准差;常用的样本统计图表有:饼状图,柱状图,茎叶图,折线图,频率分布直方图和散点图。
易错点5:回归分析与独立性检验
①回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性;
②回归直线:回归直线过样本中心;
③独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立。
01 两个计数原理
例1(2020•新全国1山东)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有( )
A. 120种 B. 90种 C. 60种 D. 30种
【警示】分别安排各场馆的志愿者,利用组合计数和乘法计数原理求解.
【解析】首先从名同学中选名去甲场馆,方法数有;
然后从其余名同学中选名去乙场馆,方法数有;最后剩下的名同学去丙场馆.
故不同的安排方法共有种.故选:C
【叮嘱】求解排列应用题的主要方法
直接法
把符合条件的排列数直接列式计算
间接法
正难则反,等价转化的方法
优先法
优先安排特殊元素或特殊位置
消序法
对于定序问题,可先不考虑顺序限制,排列后再除以定序元素的全排列
捆绑法
把某些元素看作一个整体与其他元素一起排列,同时注意捆绑元素的内部排列
插空法
对不相邻问题,先考虑不受限制的元素的排列,再将不相邻的元素插在前面元素排列的空档中
1.(2020•全国2卷)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有__________种.
【解析】4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学先取2名同学看作一组,选法有:
现在可看成是3组同学分配到3个小区,分法有:
根据分步乘法原理,可得不同的安排方法种
故答案为:.
2.(2017新课标Ⅱ)安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有
A.12种 B.18种 C.24种 D.36种
【解析】由题意可得,一人完成两项工作,其余两人每人完成一项工作,据此可得,只要把工作分成三份:有种方法,然后进行全排列,由乘法原理,不同的安排方式共有种. 故选D.
02 二项式定理
例2(2020•北京卷)在的展开式中,的系数为( ).
A. B. 5 C. D. 10
【警示】二项式定理是今年来常考的考点,一般是基础题或中档题。此题首先写出展开式的通项公式,然后结合通项公式确定的系数即可.
【解析】展开式的通项公式为:,
令可得:,则的系数为:.故选:C.
【叮嘱】二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n和r的隐含条件,即n,r均为非负整数,且n≥r,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.
1.(2020•天津卷)在的展开式中,的系数是_________.
【解析】因为的展开式的通项公式为,令,解得.所以的系数为.故答案为:.
2.(2020•全国1卷)的展开式中x3y3的系数为( )
A. 5 B. 10 C. 15 D. 20
【解析】展开式的通项公式为(且)
所以的各项与展开式的通项的乘积可表示为:
和
在中,令,可得:,该项中的系数为,
在中,令,可得:,该项中的系数为
所以的系数为.故选:C
03 概率
例3(2020•全国1卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【警示】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;
(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;
(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.
【解析】(1)记事件甲连胜四场,则;
(2)记事件为甲输,事件为乙输,事件为丙输,
则四局内结束比赛的概率为
,
所以,需要进行第五场比赛的概率为;
(3)记事件为甲输,事件为乙输,事件为丙输,
记事件甲赢,记事件丙赢,则甲赢的基本事件包括:、、、
、、、、,
所以,甲赢的概率为.
由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为.
【叮嘱】①对于事件、,若的发生与的发生互不影响,则称、是相互独立事件.
②若与相互独立,则,·.
③若与相互独立,则与,与,与也都相互独立.
④若,则、相互独立.
-
1.(2020•江苏卷)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是____.
【解析】根据题意可得基本事件数总为个.
点数和为5的基本事件有,,,共4个.
∴出现向上的点数和为5的概率为.故答案为:.
2.(2020•北京卷)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
男生
女生
支持
不支持
支持
不支持
方案一
200人
400人
300人
100人
方案二
350人
250人
150人
250人
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;
(Ⅲ)将该校学生支持方案的概率估计值记为,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为,试比较与的大小.(结论不要求证明)
【解析】(Ⅰ)该校男生支持方案一的概率为,
该校女生支持方案一的概率为;
(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,
所以3人中恰有2人支持方案一概率为:;
(Ⅲ)
04 统计初步
例4(2020•天津卷)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A. 10 B. 18 C. 20 D. 36
【警示】根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可.
【解析】根据直方图,直径落在区间之间的零件频率为:,
则区间内零件的个数为:.故选:B.
【叮嘱】频率分布直方图的特征:
优点:频率分布直方图能够很容易的表示大量数据,且可以清楚地看出数据分布的总体趋势。
缺点:从频率分布直方图得不出原始的数据内容,即把数据表示成直方图后,原有的具体数据就丢失了。因此利用频率分布直方图求出的众数,中位数和平均数均为这组数据的估计值。
1.(2020•江苏卷)已知一组数据的平均数为4,则的值是_____.
【解析】∵数据的平均数为4∴,即.故答案为:2.
2.(2020•全国3卷)在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A. B.
C. D.
【解析】对于A选项,该组数据的平均数为,
方差为;
对于B选项,该组数据的平均数为,
方差为;
对于C选项,该组数据的平均数为,
方差为;
对于D选项,该组数据的平均数为,
方差为.
因此,B选项这一组的标准差最大.故选:B.
05 回归分析与独立性检验
例5(2020•全国1卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
【警示】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.根据散点图的分布可选择合适的函数模型.
【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.故选:D.
【叮嘱】回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.
.
1.(2020•新全国1山东)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
32
18
4
6
8
12
3
7
10
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
0.050 0.010 0.001
3841 6.635 10.828
【解析】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
(2)由所给数据,可得列联表为:
合计
64
16
80
10
10
20
合计
74
26
100
(3)根据列联表中的数据可得
,
因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
2.(2020•全国2卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
【解析】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
1.(2020•全国2卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( )
A. 10名 B. 18名 C. 24名 D. 32名
【解析】由题意,第二天新增订单数为,设需要志愿者x名,
,,故需要志愿者名.故选:B
2.(2020•新全国1山东)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( )
A. 62% B. 56% C. 46% D. 42%
【解析】记“该中学学生喜欢足球”为事件,“该中学学生喜欢游泳”为事件,则“该中学学生喜欢足球或游泳”为事件,“该中学学生既喜欢足球又喜欢游泳”为事件,
则,,,
所以
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为.故选:C.
3.(2020•新全国1山东)信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为,且,定义X的信息熵.( )
A. 若n=1,则H(X)=0
B. 若n=2,则H(X)随着的增大而增大
C. 若,则H(X)随着n的增大而增大
D. 若n=2m,随机变量Y所有可能的取值为,且,则H(X)≤H(Y)
【解析】对于A选项,若,则,所以,所以A选项正确.
对于B选项,若,则,,
所以,
当时,,
当时,,两者相等,所以B选项错误.
对于C选项,若,则
,
则随着增大而增大,所以C选项正确.
对于D选项,若,随机变量的所有可能的取值为,且().
.
由于,所以,所以,
所以,所以,所以D选项错误.故选:AC
4.(2020•全国3卷)的展开式中常数项是__________(用数字作答).
【解析】
其二项式展开通项:
当,解得
的展开式中常数项是:.故答案为:.
5.(2020•天津卷)已知甲、乙两球落入盒子的概率分别为和.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.
【解析】甲、乙两球落入盒子的概率分别为,且两球是否落入盒子互不影响,
所以甲、乙都落入盒子概率为,
甲、乙两球都不落入盒子的概率为,
所以甲、乙两球至少有一个落入盒子的概率为.故答案为:;.
6.(2020•浙江卷)设,则a5=________;a1+a2 + a3=________.
【解析】的通项为,令,则,故;.故答案为:80;122
7(2020•浙江卷)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为,则_______;______.
【解析】因为对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,
所以,随机变量,,
,所以.故答案为:.
8.(2020•上海卷)从个人中选个人值班,第一天个人,第二天1个人,第三天2个人,共有多少种排法 .
【解析】:.
9.(2019全国I理21)为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,表示“甲药的累计得分为时,最终认为甲药比乙药更有效”的概率,则,,,其中,,.假设,.
(i)证明:为等比数列;
(ii)求,并根据的值解释这种试验方案的合理性.
【解析】(1)解:X的所有可能取值为﹣1,0,1.
P(X=﹣1)=(1﹣α)β,P(X=0)=αβ+(1﹣α)(1﹣β),P(X=1)=α(1﹣β),
∴X的分布列为:
X
﹣1
0
1
P
(1﹣α)β
αβ+(1﹣α)(1﹣β)
α(1﹣β)
(2)(i)证明:∵α=0.5,β=0.8,
∴由(1)得,a=0.4,b=0.5,c=0.1.
因此pi=0.4pi﹣1+0.5pi+0.1pi+1(i=1,2,…,7),
故0.1(pi+1﹣pi)=0.4(pi﹣pi﹣1),即(pi+1﹣pi)=4(pi﹣pi﹣1),
又∵p1﹣p0=p1≠0,∴{pi+1﹣pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列;
(ii)解:由(i)可得,
p8=(p8﹣p7)+(p7﹣p6)+…+(p1﹣p0)+p0=,
∵p8=1,∴p1=,
∴P4=(p4﹣p3)+(p3﹣p2)+(p2﹣p1)+(p1﹣p0)+p0=p1=.
P4表示最终认为甲药更有效的概率.
由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为,此时得出错误结论的概率非常小,说明这种试验方案合理.
10.(2017新课标Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6 元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率。
(1)求六月份这种酸奶一天的需求量(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为(单位:元),当六月份这种酸奶一天的进货量(单位:瓶)为多少时,的数学期望达到最大值?
【解析】(1)由题意知,所有可能取值为200,300,500,由表格数据知
,,.
因此的分布列为:
200
300
500
0.2
0.4
0.4
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200500
当时,
若最高气温不低于25,则;
若最高气温位于区间[20,25),则;
若最高气温低于20,则
因此
当时,
若最高气温不低于20,则;
若最高气温低于20,则
因此
所以时,的数学期望达到最大值,最大值为520元。