专题7概率(文)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题7概率(文)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共26页。
专题7概率(文)知识点与大题16道专练(基础题)(解析版)
知识点一:常见的概率类型与概率计算公式;
类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;
例如:等腰中,角C=,则:
(1) 若点M是线段AB上一点,求使得的概率;
(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;
而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:;
知识点二:常见的概率计算性质;
类型一:事件间的关系与运算;
A+B(和事件):表示A、B两个事件至少有一个发生;
(积事件):表示A、B两个事件同时发生;
(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式;
1、 和事件的概率:
(1)特别的,若A与B为互斥事件,则:
(2)对立事件的概率公式:
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;
第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算;
特征量一:平均数(数学期望)
计算公式一:;
计算公式二:;
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
计算公式一:;
计算公式二:;
计算公式三:;
;
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法;
方法一:简单随机抽样;
1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、 具体做法:①随机数字法 ; ② 抽签法;
3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便;
抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度;
方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;
2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;
缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;
第三步:用简单随机抽样的方法产生样本;
3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;
总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图;
1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;
3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距;
第三步:列频率分布表;
第四步:作图;
4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;
5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到时的横坐标;
(2) 众数:取最高的那个方框的中点横坐标;
(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;
(4) 方差:;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例;
1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。
2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。
3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,
其中,b是回归方程的斜率,a是在y轴上的截距.
4.样本相关系数:
r= ,用它来衡量两个变量间的线性相关关系.
(1)当r>0时,表明两个变量正相关;
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.
6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
注意:
(1)越大相关性越强,反之越弱;
(2)附表中P(K2≥k)是两个统计学变量无关的概率;
1.2020年4月底,随着新冠疫情防控进入常态化,为了促进消费复苏增长,上饶市开展“五一消费黄金周”系列活动,并发放亿元电子消费券.活动过后,我们随机抽取了50人,对是否使用过电子消费券进行调查,结果如下表:
年龄
(单位:岁)
抽取人数
2
10
13
12
10
3
使用过消费券的人数
1
9
13
8
6
1
若以“年龄40岁为分界点”,由以上统计数据完成下面列联表,并判断是否有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.
年龄低于40岁的人数
年龄不低于40岁的人数
合计
使用过消费券的人数
没有使用消费券的人数
合计
参考数据:
,其中.
【答案】表格见解析,有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关
【分析】
根据题中统计数据即可填写列联表,根据,即可求出,对比题中数据即可判断.
【详解】
解:由以上统计数据填写下面列联表,如下:
年龄低于40岁
的人数
年龄不低于40岁
的人数
合计
使用过消费券的人数
23
15
38
没有使用消费券的人数
2
10
12
合计
25
25
50
根据公式计算,
∴有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.
2.入夏以来,天气炎热,合肥地区用电负荷连创新高,某用户随机统计了家里某4天用电量(千瓦·时)与当天气温(℃)情况,数据如下表:
气温(℃)
30
32
34
36
用电量(千瓦∙时)
20
26
30
36
(1)请根据提供的数据,计算,,用最小二乘法求出y关于x的线性回归方程;
(2)请估计当时的y值.
参考公式:,.
【答案】(1);(2)41千瓦∙时.
【分析】
(1)根据数据直接求出,,再根据,代入数据即可得解;
(2)将代入线性回归方程即可得解.
【详解】
(1),
.
求得线性回归方程为:;
(2)当时,(千瓦∙时)
所以根据回归方程估计用41千瓦∙时.
【点睛】
本题考查了线性回归方程,以及利用线性回归方程进行数据估计,考查了计算能力,属于基础题.
3.某单位对其名员工的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于的人,喜食蔬菜;饮食指数高于的人,喜食肉类).
(1)根据所给数据完成下面的列联表;
喜食蔬菜
喜食肉类
总计
35岁以上
35岁以下
总计
(2)能否有的把握认为该单位员工的饮食习惯与年龄有关?
独立性检验的临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,.
【答案】(1)列联表见解析;(2)有的把握认为该单位员工的饮食习惯与年龄有关.
【分析】
(1)先阅读题意,再填写列联表即可;
(2)将题设中数据代入求值,再结合独立性检验的临界值表即可得解.
【详解】
解:(1)填空列联表如下所示:
喜食蔬菜
喜食肉类
总计
35岁以上
16
2
18
35岁以下
4
8
12
总计
20
10
30
(2)由题意得,,
故有的把握认为该单位员工的饮食习惯与年龄有关.
【点睛】
本题考查了列联表及独立性检验,重点考查了运算能力,属基础题.
4.期末考试结束,高二(1)班班主任张老师从班里的40名学生中,随机抽取10名同学的语文和数学成绩进行抽样分析,研究学生偏科现象.将10名学生编号为1,2,310,再将他们的两科成绩(单位:分)绘成折线图如下:
(1)从这10名学生中随机抽取一名学生,求抽取的这名学生两科成绩相差大于10分的概率;
(2)从两科成绩均超过70分的学生中随机抽取2人进行访谈,求这2人中恰有一个是语文成绩高于数学成绩的概率;
(3)设该班语文和数学两科成绩的平均值分别为,方差分别为,根据折线图,试推断和,和的大小关系(直接写出结论,不需证明).
【答案】(1);(2);(3),.
【分析】
(1)根据第二段抽取的学生编号和数据间隔,写出第六段抽取的学生编号,从而求出概率;
(2)确定基本事件的个数,计算所求的概率值;
(3)根据折线图得出成绩的平均数高低和数据的稳定性问题.
【详解】
解:(1)设“抽取的这名学生两科成绩相差大于10分”为事件
由图可得数学、语文成绩相差大于10分的学生编号分别是2,5,6,7,8,共有5人,所以
(2)设“抽取的这2人中恰有一个是语文成绩高于数学成绩”为事件
因为两科成绩均超过70分的学生编号分别是1,3,4,9,10,则构成的样本空间
共10个样本点
事件包含共6个样本点
所以这2人中恰有一个是语文成绩高于数学成绩的概率;
(3),
5.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:
成绩分组
频数
频率
平均分
[0,20)
3
0.015
16
[20,40)
a
b
32.1
[40,60)
25
0.125
55
[60,80)
c
0.5
74
[80,100]
62
0.31
88
(1)求a,b,c的值;
(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率 (注:60分及60分以上为及格);
(3)试估计这次数学测验的年级平均分.
【答案】(1);;;(2);(3)73分.
【分析】
(1)根据频率和为1即可得,根据频率与频数关系即可得,;
(2)根据题意,抽出的200人的数学成绩中,及格的有162人,故;
(3)根据平均数的计算公式计算即可.
【详解】
解:(1)由题意可得,,
,
(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.
所以.
(3)这次数学测验样本的平均分为,
所以这次数学测验的年级平均分大约为73分.
6.甲、乙两个学习小组各有7名同学,在某次数学测试中,测试成绩的茎叶图如图所示.
(1)求甲组同学成绩的中位数和乙组同学成绩的众数;
(2)从这次测试成绩在90分以上的学生中,随机抽取1名学生,求抽到的这名学生来自甲组的概率.
【答案】(1)甲组成绩的中位数为,乙组成绩的众数;(2).
【分析】
(1)根据茎叶图中的数据可甲组成绩的中位数和乙组成绩的众数.
(2)利用古典概型的概率公式可求概率.
【详解】
(1)甲组共有7名学生的成绩,其中位数为.
乙组成绩中,出现次数最多,故众数为.
(2)90分以上的学生共计5人,其中来自甲组有2人,
设为“随机抽取1名学生,求抽到的这名学生来自甲组”,
则.
7.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某宝电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:十万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(,,精确到0.1);
附参考公式:回归方程中中和最小二乘估计分别为,,参考数据:,.
(2)为了更好地完成任务,某宝电商决定让宣传部门的3名成员各自制定两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
【答案】(1);9.6万元;(2).
【分析】
(1)参照公式求出线性回归方程,再由算出当时,对应的利润.
(2)古典概型问题,先确定总的基本事件数,再找出特定事件包含的基本事件个数.
【详解】
解:(1),
因为,
所以回归直线方程为,
当时,,
即利润约为9.6万元.
(2)记3名成员的方案分别为,;,;,.
从中任选2个方案的基本事件含有:、、、、、、、、、、、、、、共15种.
其中这2个方案出自同一个人的基本事件含有、、,共3种.
∴.
答:这2个方案出自同一个人的概率为.
【点睛】
此题考查了线性回归方程和古典概型,属于简单题.
8.在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产企业在加大生产的同时,狠抓质量管理,不定时抽查口罩质量,该企业质检人员从所生产的口罩中随机抽取了100个,将其质量指标值分成以下六组:,,,…,,得到如下频率分布直方图.
(1)求出直方图中的值;
(2)利用样本估计总体的思想,估计该企业所生产的口罩的质量指标值的平均数和中位数(同一组中的数据用该组区间中点值作代表,中位数精确到0.01).
【答案】(1);(2)平均数为71,中位数为73.33.
【分析】
(1)利用频率之和等于1进行求解即可
(2)利用平均数和中位数的计算公式进行求解即可
【详解】
(1)由,得.
(2)平均数为,
设中位数为,则,得.
故可以估计该企业所生产口罩的质量指标值的平均数为71,中位数为73.33.
9.为了监控一条生产线上的某种零件的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尽寸(单位,cm),下面是检脸员在一天内依次抽取的18个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
9
零件尺寸
9.27
9.26
9.84
9.87
9.78
9.65
9.55
9.43
9.39
抽取次序
10
11
12
13
14
15
16
17
18
零件尺寸
9.36
9.42
9.77
9.83
9.93
9.34
9.82
9.95
9.33
零件尺寸在内为一级;在内为二级;在丙为超标
(1)求这18个数据中不超标数据的中位数;
(2)在以上零件为一级的数据中,随机抽取2个数据,求其中恰有一个零件尺寸小于9.3的概率;
(3)以这18个零件尺寸来估计该生产线的情况,若该生产线每日生产3600个零件,那么约有多少个零件超标.
【答案】(1);(2);(3)约有个的零件超标.
【分析】
(1)列出数据中不超标数据,然后再求其中位数.
(2)零件为一级的数据有,列出从中任取2个数据的结果,再列出其中恰有一个零件尺寸小于的结果,由古典概率公式可得答案.
(3)零件超标的概率,则3600个零件中零件超标的个数为.
【详解】
解:(1)不超标数据有:,共10个数
中位数为
(2)由题目条件可知,零件为一级的数据共有4个,分别为
则由一切可能的结果组成的基本事件空间为
,
共由6个基本事件组成.
设“其中恰有一个零件尺寸小于"为事件,
则,共有4个基本事件
所以
(3)由题意,零件超标的概率
因为,所以一天约有个的零件超标.
10.甲、乙两家商场对同一种商品开展促销活动,对购买该商品的顾客两家商场的奖励方案如下:
甲商场:顾客转动如图所示圆盘,当指针指向阴影部分(图中两个阴影部分均为扇形,且每个扇形圆心角均为,边界忽略不计)即为中奖·
乙商场:从装有2个白球、2个蓝球和2个红球的盒子中一次性摸出1球(这些球除颜色外完全相同),它是红球的概率是,若从盒子中一次性摸出2球,且摸到的是2个相同颜色的球,即为中奖.
(Ⅰ)求实数的值;
(Ⅱ)试问:购买该商品的顾客在哪家商场中奖的可能性大?请说明理由.
【答案】(Ⅰ);(Ⅱ)顾客在甲商场中奖的可能性大.
【解析】
试题分析:(Ⅰ)根据随机事件的概率公式,即可求出的值;(Ⅱ)设顾客去甲商场转动圆盘,指针指向阴影部分为事件,利用几何概型求出顾客去甲商场中奖的概率;设顾客去乙商场一次摸出两个相同颜色的球为事件,利用等可能事件概率计算公式求出顾客去乙商场中奖的概率,由此能求出顾客在甲商场中奖的可能性大.
试题解析:(Ⅰ)根据随机事件的概率公式,,解得.
(Ⅱ)设顾客去甲商场转动圆盘,指针指向阴影部分为事件,试验的全部结果构成的区域为圆盘,
面积为(为圆盘的半径),阴影区域的面积为.
故由几何概型,得.
设顾客去乙商场一次摸出两个相同颜色的球为事件,记2个白球为白1,白2;2个红球为红1、红2;2个蓝球为蓝1、蓝2.
则从盒子中一次性摸出2球,一切可能的结果有(白1、白2),(白1、红1)、(白1、红2),(白1、蓝1),(白1、蓝2);(白2、红1),(白2、红2),(白2、蓝1),(白2、蓝2);(红1、蓝1),(红1、蓝2),(红2、蓝1),(红2、蓝2);(蓝1、蓝2)等共15种;
其中摸到的是2个相同颜色的球有(白1、白2),(红1、红2),(蓝1、蓝2)等共3种;
故由古典概型,得.
因为,所以顾客在甲商场中奖的可能性大.
11.在7块并排,形状大小相同的试验田上进行施肥量对水稻产量影响的实验,得到如下表所示的一组数据:
施肥量()
15
20
25
30
35
40
45
水稻产量()
330
345
365
405
445
450
455
(1)求对的回归直线方程;
(2)如果施肥量为38,其他情况不变,请预测水稻的产量.
..
【答案】(1);(2)437.
【分析】
(1)先求出的值,再求出,的值,再代入公式求出和的值,可得对的回归直线方程;
(2)把代入回归方程中直接求解即可
【详解】
(1)由题意知,,
,,
所以,
,
因此所求回归直线方程为.
(2)如果施肥量为38,则预测水稻产量为.
【点睛】
此题考查利用最小二乘法求线性回归方程,考查计算能力,属于基础题
12.某帮扶单位为帮助定点扶贫村真正脱贫,坚持扶贫同扶智相结合,帮助贫困村种植蜜柚,并利用互联网电商渠道进行销售.为了更好地销售,现从该村的蜜柚树上随机摘下了100个蜜柚进行测重,其质量分布在区间内(单位:克),统计质量的数据作出其频率分布直方图如图所示,以各组数据的中间数值代表这组数据的平均水平,以频率代表概率.
(1)估计这批蜜柚每只的平均重量;
(2)已知该贫困村的蜜柚树上大约还有10000个蜜柚待出售,对于这10000个蜜柚某电商提出两种收购方案:A.所有蜜柚均以40元/千克收购;B.低于2000克的蜜柚以60元/个收购,高于或等于2000克但不超过2500克的以90元/个收购,其余的以100元/个收购,请你通过计算为该村选择收益最好的方案.
【答案】(1)克,(2)该村选择收益最好的方案为方案A
【分析】
(1)由频率分布直方图中的数据进行计算平均值;
(2)分别计算两种方案的收益,然后进行比较即可
【详解】
解:(1)由频率分布直方图估计这批蜜柚每只的平均重量为:
(克)
(2)若选用A方案收益为:(元)
若选用B方案收益为:
(元)
因为,
所以该村选择收益最好的方案为方案A
【点睛】
此题考查平均数、最优方案的判断,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题
13.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.
(1)试比较甲、乙两班分别抽取的这10名同学身高的中位数大小;
(2)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高176cm的同学被抽到的概率.
【答案】(1)甲班:中位数为169;乙班:中位数为172;(2)
【分析】
(1)分别对数据按从小到大排列,按照中位数的定义,可得结果.
(2)使用列举法写出“抽取两名身高不低于173cm的同学”所有可能结果,然后计算“身高176cm的同学被抽到”的个数,根据古典概型,可得结果.
【详解】
(1)对甲班:按从小到大排,可知
中间的两数为168,170,中位数
对乙班:按从小到大排,可知
中间的两数为171,173,中位数
(2)从乙班这10名同学中随机抽取两名身高
不低于173cm的同学有:
共有10个基本事件
“身高176cm的同学被抽到的”有4个基本事件
所以身高176cm的同学被抽到的概率为
【点睛】
本题考查利用茎叶图对统计量的计算以及使用列举法计算概率,重在审清题意,属基础题.
14.为了解人们对“延迟退休年龄政策”的态度,某部门从年龄在岁到岁的人群中随机调查了人,并得到如图所示的频率分布直方图,在这人中不支持“延迟退休年龄政策”的人数与年龄的统计结果如表所示:
年龄
不支持“延迟退休年龄政策”的人数
15
5
15
23
17
(1)由频率分布直方图,估计这人年龄的平均数;(写出必要的表达式)
(2)根据以上统计数据补全下面的列联表,据此表,能否在犯错误的概率不超过的前提下,认为以岁为分界点的不同人群对“延迟退休年龄政策”的态度存在差异?
岁以下
岁以上
总计
不支持
支持
总计
附:临界值表、公式
0.15
0.10
0.050
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)42;(2)详见解析.
【分析】
(1)在频率分布直方图中,平均数为各小组底边中点坐标与对应频率乘积之和.
(2)根据条件,完成联表,计算出,再和参考数据比较,即可得结论.
【详解】
(1)估计这人年龄的平均数为
(岁)
(2)由频率分布直方图可知,岁以下共有人,岁以上共有人.
列联表如下:
岁以下
岁以上
总计
不支持
支持
总计
,
不能在犯错误的概率不超过的前提下,认为以岁为分界点的不同人群对“延迟退休年龄政策”的态度存在差异.
【点睛】
本题考查频率分布直方图中平均数的求法,及的计算,属基础题.
15.某公交公司为了方便市民出行、科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为研究车辆发车间隔时间(分钟)与乘客等候人数(人)之间的关系,经过调查得到如下数据:
间隔时间(分钟)
等候人数(人)
调查小组先从这组数据中选取组数据求线性回归方程,再用剩下的组数据进行检验.检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数,再求与实际等候人数的差,若差值的绝对值不超过,则称所求线性回归方程是“恰当回归方程”.
(1)从这组数据中随机选取组数据后,求剩下的组数据的间隔时间之差大于的概率;
(2)若选取的是后面组数据,求关于的线性回归方程,并判断此方程是否是“恰当回归方程”;
(3)在(2)的条件下,为了使等候的乘客不超过人,则间隔时间最多可以设置为多少分钟?(精确到整数)
参考公式:,.
【答案】(1);(2),是“恰回归方程”; (3)18.
【分析】
(1)用列举法分别求出“从这组数据中随机选取组数据后,剩下组数据”以及“剩下的组数据相邻”所包含的基本事件数,进而求出“剩下的组数据相邻”的概率,再由对立事件的概率,即可求出结果;
(2)由最小二乘法求出线性回归方程,将和代入验证即可;
(3)由(2)的结果结合条件列出不等式,求解即可.
【详解】
解:(1)设“从这组数据中随机选取组数据后,剩下的组数据不相邻”为事件,
记这六组数据分别为,,,,,,剩下的两组数据的基本事件有,,,,,,,,,,,,,,共种,
其中相邻的有,,,,,共种,
所以.
(2)后面组数据是:
间隔时间(分钟)
等候人数(人)
因为,,
,,
所以 ,
所以.
当时, ,;
当时,,,
所以求出的线性回归方程是“恰回归方程”.
(3)由,得,
故间隔时间最多可设置为分钟.
【点睛】
本题主要考查古典概型和线性回归方程,需要考生熟记古典概型的概率计算公式,以及最小二乘法求线性回归方程的方法,属于常考题型.
16.某网购平台为了解某市居民在该平台的消费情况,从该市使用其平台且每周平均消费额超过100元的人员中随机抽取了100名,并绘制如图所示频率分布直方图,已知中间三组的人数可构成等差数列.
(1)求的值;
(2)分析人员对100名调查对象的性别进行统计发现,消费金额不低于300元的男性有20人,低于300元的男性有25人,根据统计数据完成下列列联表,并判断是否有的把握认为消费金额与性别有关?
(3)分析人员对抽取对象每周的消费金额与年龄进一步分析,发现他们线性相关,得到回归方程.已知100名使用者的平均年龄为38岁,试判断一名年龄为25岁的年轻人每周的平均消费金额为多少.(同一组数据用该区间的中点值代替)
列联表
男性
女性
合计
消费金额
消费金额
合计
临界值表:
0.050
0.010
0.001
3.841
6.635
10.828
,其中
【答案】(1),(2)详见解析(3)395元
【分析】
(1)根据频率分布直方图可得,结合可得的值.
(2)根据表格数据可得,再根据临界值表可得有的把握认为消费金额与性别有关.
(3)由频率分布直方图可得调查对象的周平均消费,从而得到,利用线性回归方程可计算年龄为25岁的年轻人每周的平均消费金额.
【详解】
(1)由频率分布直方图可知,,
由中间三组的人数成等差数列可知,
可解得,
(2)周平均消费不低于300元的频率为,因此100人中,周平均消费不低于300元的人数为人.
所以列联表为
男性
女性
合计
消费金额
20
40
60
消费金额
25
15
40
合计
45
55
100
所以有的把握认为消费金额与性别有关.
(3)调查对象的周平均消费为
,
由题意,∴
.
∴该名年龄为25岁的年轻人每周的平均消费金额为395元.
【点睛】
(1)频率分布直方图中,各矩形的面积之和为1,注意直方图中,各矩形的高是;
(2)两类变量是否相关,应先计算的值,再与临界值比较后可判断是否相关.
(3)线性回归方程对应的直线必经过.
相关学案
这是一份专题19概率(理)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共20页。学案主要包含了椭圆,双曲线,抛物线,直线与圆锥曲线的位置关系,弦长问题等内容,欢迎下载使用。
这是一份专题10概率(理)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共26页。
这是一份专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共14页。