专题09 概率与统计——2020年高考真题和模拟题理科数学分项汇编
展开专题09 概率与统计
1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是
A. B.
C. D.
2.【2020年高考全国II卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者
A.10名 B.18名
C.24名 D.32名
3.【2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是
A. B.
C. D.
4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是
A.62% B.56%
C.46% D.42%
5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为,且,定义X的信息熵.
A.若n=1,则H(X)=0
B.若n=2,则H(X)随着的增大而增大
C.若,则H(X)随着n的增大而增大
D.若n=2m,随机变量Y所有可能的取值为,且,则H(X)≤H(Y)
6.【2020年高考江苏】已知一组数据的平均数为4,则的值是 ▲ .
7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____.
8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:
,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为
A.10 B.18
C.20 D.36
9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为和.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.
10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为,则_______,_______.
11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:
累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.
经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数,.
13.【2020年高考全国III卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
锻炼人次 空气质量等级 | [0,200] | (200,400] | (400,600] |
1(优) | 2 | 16 | 25 |
2(良) | 5 | 10 | 12 |
3(轻度污染) | 6 | 7 | 8 |
4(中度污染) | 7 | 2 | 0 |
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
| 人次≤400 | 人次>400 |
空气质量好 |
|
|
空气质量不好 |
|
|
附:K2=, | P(K2≥k) | 0.050 0.010 0.001 |
|
k | 3.841 6.635 10.828 | . |
14.【2020年高考山东】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
| |||
32 | 18 | 4 | |
6 | 8 | 12 | |
3 | 7 | 10 |
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
| ||
|
| |
|
|
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
0.050 0.010 0.001 | |
3.841 6.635 10.828 |
18.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
| 男生 | 女生 | ||
支持 | 不支持 | 支持 | 不支持 | |
方案一 | 200人 | 400人 | 300人 | 100人 |
方案二 | 350人 | 250人 | 150人 | 250人 |
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;
(Ⅲ)将该校学生支持方案的概率估计值记为,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为,试比较与的大小.(结论不要求证明)
1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学号应为
A. B.
C. D.
2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组表示的平面区域为,若从圆:的内部随机选取一点,则取自的概率为
A. B.
C. D.
3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对应的二进制数011(2)化为十进制的计算如下:011(2)=0×22+1×21+1×20=3(10).若从两类符号中任取2个符号进行排列,则得到的二进制数所对应的十进制数大于2的概率为
A. B.
C. D.
4.【2020·河南省高三三模】随着年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是年至年中国雪场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是
A.年至年,中国雪场滑雪人次逐年增加
B.年至年,中国雪场滑雪人次和同比增长率均逐年增加
C.年与年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等
D.年与年相比,中国雪场滑雪人次增长率约为
5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒()引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
周数(x) | 1 | 2 | 3 | 4 | 5 |
治愈人数(y) | 2 | 17 | 36 | 93 | 142 |
由表格可得关于的二次回归方程为,则此回归模型第4周的残差(实际值与预报值之差)为
A.5 B.4
C.1 D.0
6.【2020·四川省绵阳南山中学高三一模】从标号分别为、、、、的张标签中随机抽取一张,放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差的概率为
A. B.
C. D.
7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个数字表示两位数中,能被3整除的概率是
A. B.
C. D.
8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边三角形的边长比为,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是
A. B.
C. D.
9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是
A.若随机变量服从正态分布,,则;
B.已知直线平面,直线平面,则“”是“”的必要不充分条件;
C.若,则在方向上的正射影的数量为
D.命题的否定
10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.
11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相同的概率为______.
12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记表示学生的考核成绩,并规定为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:
(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率;
(Ⅱ)从图中考核成绩满足的学生中任取2人,求至少有一人考核优秀的概率;
(Ⅲ)记表示学生的考核成绩在区间的概率,根据以往培训数据,规定当时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明理由.
13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等级与空气质量指数对照如下表:
空气质量指数 | 300以上 | |||||
空气质量等级 | 一级 (优) | 二级 (良) | 三级 (轻度污染) | 四级 (中度污染) | 五级 (重度污染) | 六级 (严重污染) |
(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;
(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).
①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,求X的分布列和数学期望;
②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不宜进行户外体育运动的概率.
14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元) | ||||||
人数 | 10 | 15 | 20 | 15 | 20 | 10 |
(1)根据以上数据完成列联表,并判断是否有的把握认为购买金额是否少于60元与性别有关.
| 不少于60元 | 少于60元 | 合计 |
男 |
| 40 |
|
女 | 18 |
|
|
合计 |
|
|
|
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为(每次抽奖互不影响,且的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数(元)的分布列并求其数学期望.
附:参考公式和数据:,.
附表:
2.072 | 2.706 | 3.841 | 6.635 | 7.879 | |
0.150 | 0.100 | 0.050 | 0.010 | 0.005 |
15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技术改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)数据,并绘制了如下茎叶图:
(Ⅰ)(1)设所采集的40个连续正常运行时间的中位数,并将连续正常运行时间超过和不超过的次数填入下面的列联表:
| 超过 | 不超过 |
改造前 | ||
改造后 |
试写出,,,的值;
(2)根据(1)中的列联表,能否有的把握认为生产线技术改造前后的连续正常运行时间有差异?
附:,
0.050 | 0.010 | 0.001 | |
3.841 | 6.635 | 10.828 |
(Ⅱ)工厂的生产线的运行需要进行维护.工厂对生产线的生产维护费用包括正常维护费、保障维护费两种对生产线设定维护周期为天(即从开工运行到第天()进行维护.生产线在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产线能连续运行,则不会产生保障维护费;若生产线不能连续运行,则产生保障维护费.经测算,正常维护费为0.5万元次;保障维护费第一次为0.2万元周期,此后每增加一次则保障维护费增加0.2万元.现制定生产线一个生产周期(以120天计)内的维护方案:,,2,3,4.以生产线在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及期望值.
16.【2020·四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用简单随机抽样方法从该地区调查了500位被隔离者,结果如下:
性别 是否需要 | 男 | 女 |
需要 | 40 | 30 |
不需要 | 160 | 270 |
0.050 | 0.010 | 0.001 | |
3.841 | 6.635 | 10.828 |
(1)估计该地区被隔离者中,需要社区非医护人员提供帮助的被隔离者的比例;
(2)能否有99%的把握认为该地区的被隔离者是否需要社区非医护人员提供帮助与性别有关?
17.【2020·四川省阆中中学高三其他】共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有是“年轻人”.
(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?
使用共享单车情况与年龄列联表
| 年轻人 | 非年轻人 | 合计 |
经常使用单车用户 |
|
| 120 |
不常使用单车用户 |
|
| 80 |
合计 | 160 | 40 | 200 |
(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量,求的分布列与期望.
参考数据:独立性检验界值表
0.15 | 0.10 | 0.050 | 0.025 | 0.010 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
其中,,
18.【2020·山西省高三月考】在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.
(1)一研究团队统计了某地区1000名患者的相关信息,得到如下表格,
该传染病的潜伏期受诸多因素影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关
| 潜伏期≤6天 | 潜伏期>6天 | 总计 |
50岁以上(含50岁) |
|
| 100 |
50岁以下 | 55 |
|
|
总计 |
|
| 200 |
(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)是多少?
附:下面的临界值表仅供参考.
0.05 | 0.025 | 0.010 | |
3.841 | 5.024 | 6.635 |
(参考公式:,其中.)