专题9概率(文)知识点与大题16道专练(培优题)(解析版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题9概率(文)知识点与大题16道专练(培优题)(解析版)-备战2022年高考数学大题分类提升专题学案,共31页。
专题9概率(文)知识点与大题16道专练(培优题)(解析版)
知识点一:常见的概率类型与概率计算公式;
类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;
例如:等腰中,角C=,则:
(1) 若点M是线段AB上一点,求使得的概率;
(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;
而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:;
知识点二:常见的概率计算性质;
类型一:事件间的关系与运算;
A+B(和事件):表示A、B两个事件至少有一个发生;
(积事件):表示A、B两个事件同时发生;
(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式;
1、 和事件的概率:
(1)特别的,若A与B为互斥事件,则:
(2)对立事件的概率公式:
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;
第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算;
特征量一:平均数(数学期望)
计算公式一:;
计算公式二:;
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
计算公式一:;
计算公式二:;
计算公式三:;
;
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法;
方法一:简单随机抽样;
1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、 具体做法:①随机数字法 ; ② 抽签法;
3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便;
抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度;
方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;
2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;
缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;
第三步:用简单随机抽样的方法产生样本;
3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;
总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图;
1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;
3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距;
第三步:列频率分布表;
第四步:作图;
4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;
5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到时的横坐标;
(2) 众数:取最高的那个方框的中点横坐标;
(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;
(4) 方差:;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例;
1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。
2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。
3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,
其中,b是回归方程的斜率,a是在y轴上的截距.
4.样本相关系数:
r= ,用它来衡量两个变量间的线性相关关系.
(1)当r>0时,表明两个变量正相关;
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.
6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
注意:
(1)越大相关性越强,反之越弱;
(2)附表中P(K2≥k)是两个统计学变量无关的概率;
1.某高中社会实践小组设计了一个研究性学习项目,研究学习成绩(以单科为准)与手机使用(电子产品)的相关性,他们从全校随机抽样调查了名学生,其中有四成学生经常使用手机.名同学的物理成绩(百分制)的茎叶图如图所示.小组约定物理成绩低于分为一般,分以上为良好.
(1)根据以上资料完成以下列联表,并判断有多大的把握认为“物理成绩一般与经常使用手机有关系”.
物理成绩一般
物理成绩良好
合计
不使用手机
经常使用手机
合计
(2)现将个成绩分为,,,,共组,补全频率分布直方图,并依据频率分布直方图计算这名学生的物理平均成绩的估计值.
(3)从这名学生成绩高于分的人中随机选取人,求至少有一人不使用手机的概率.
附表及公式:,.
【答案】(1)列联表见解析,有的把握;(2)直方图见解析,;(3).
【分析】
(1)由茎叶图计数可得列联表中数据.然后计算,结合对比值可得;
(2)同样由茎叶图计数求出各组频率,可补全频率分布直方图,每组取中间点数值乘以频率相加得平均估计值;
(3)高于分经常使用手机的有人,记为,,不使用手机的有人,记为,,,,,用列举法写出任选2人的所有基本事件,并得出至少有一人不使用手机的基本事件,然后可计算出概率.
【详解】
解:(1)
物理成绩一般
物理成绩良好
合计
不使用手机
经常使用手机
合计
,
有的把握认为“物理成绩一般与经常使用手机有关系”.
(2)
设名学生物理平均成绩估计值为
.
(3)高于分经常使用手机的有人,分别设为,
不使用手机的有人,分别设为,,,,
高于分人中随机抽取人共有:,,,,,;,,,,;,,,;,,,,,,共21种
则至少有一人不使用手机的概率为.
【点睛】
关键点点睛:本题考查茎叶图,考查列联表与独立性检验,频率分布直方图,古典概型.正确认识茎叶图是解题关键.由茎叶图的数据进行计数得列联表,得频率,频率分布直方图,求古典概型概率一般用列举法写出所有的基本事件,并得出所求概率事件所包含的基本事件,从而计算出概率.
2.黄石新华书店为了了解销售单价(单位:元)在内的图书销售情况,从年已经销售的图书中随机抽取本,用分层抽样的方法获得的所有样本数据按照、、、、、分成组,制成如图所示的频率分布直方图,已知样本中销售单价在内的图书数是销售单价在内的图书数的倍.
(1)求出与;
(2)根据频率分布直方图佔计这本图书销售单价的平均数、中位数(同一组中的数据用该组区间的中点值作代表);
(3)根据频率分布直方图从销售单价价格低于元的书中任取本,求这本书价格至少有本低于元的概率.
【答案】(1),;(2)平均数为(元),中位数为;(3).
【分析】
(1)根据已知条件可得出关于、的方程组,可解出这两个未知数的值;
(2)在频率分布直方图中,将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全加可得出样本的平均数,利用中位数左边矩形的面积和为可求得样本的中位数;
(3)利用组合数公式以及对立事件的概率公式可求得所求事件的概率.
【详解】
(1)样本中图书的销售单价在内的图书数是,
样本中图书的销售单价在内的图书数是,
依据题意,有,即,①
根据频率分布直方图可知,②
由①②得,;
(2)根据频率分布直方图估计这本图书销售单价的平均数为
(元),
,故可判断中位数在之间,
设中位数为,则,
解得,故中位数为;
(3)销售单价价格低于元的书共有本,
其中销售单价价格低于元的书共有本,
从销售单价价格低于元的书中任取本,这本书价格都不低于元共有种,
因此,所求事件的概率为.
【点睛】
方法点睛:求古典概型概率的方法的如下:
(1)列举法;
(2)数状图法;
(3)列表法;
(4)排列组合数的应用.
3.月日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国可持续发展目标——实现全球土地退化零增长.自年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗埔中随机地抽测了株树苗的高度(单位:),得到以下频率分布直方图.
(1)求直方图中的值及众数、中位数;
(2)估计苗埔中树苗的平均高度;
(3)在样本中从及以上的树苗中按分层抽样抽出株,再从株中抽出两株树苗,其中含有及以上树苗的概率.
【答案】(1),众数为,中位数为;(2);(3).
【分析】
(1)利用频率分布直方图中所有矩形的面积之和为可求得的值,利用最高矩形底边的中点值为众数可求得样本的众数,利用中位数左边矩形的面积和为可求得样本的中位数;
(2)将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全加可得样本的平均数,即为所求;
(3)计算可知株中在株高这一组抽取的有株,记为、、、,在株高抽取株,记为,列举出所有的基本事件,并确定事件“抽取的株中含有及以上树苗”所包含的基本事件数,利用古典概型的概率公式可求得所求事件的概率.
【详解】
(1)由频率分布直方图中所有矩形的面积之和为可得,解得.
众数为190,
设中位数为,因为,
,则,
,解得;
(2).
因此,估计苗埔中树苗的平均高度为;
(3)在株高这一组应抽取:株,在株高这一组应抽取:株,
用、、、表示在株高这一组的株,用表示在株高这一组的株,
从中抽调株的抽法:、、、、、、、、、,共个基本事件,
设抽取株中含有株高这一组株为事件,包含个基本事件,.
【点睛】
方法点睛:计算古典概型概率的方法如下:
(1)列举法;
(2)列表法;
(3)树状图法;
(4)排列组合数的应用.
4.某企业投资两个新型项目,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的散点图如图所示.
(1)求关于的线性回归方程;
(2)根据(1)中的回归方程,若,两个项目都投资60万元,试预测哪个项目的收益更好.
附:回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1);(2)项目的收益更好.
【分析】
(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出的值,最后将样本中心点的坐标代入回归方程求得的值即可;
(2)分别利用所给关系式以及所求回归方程,求出,两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好.
【详解】
(1)由散点图可知,取时,的值分别为,
所以,,
,
则,
故关于的线性回归方程为.
(2)因为投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,
所以若项目投资60万元,则该企业所得纯利润的估计值为万元;
因为关于的线性回归方程为,
所以若项目投资60万元,则该企业所得纯利润的估计值为万元.
因为,所以可预测项目的收益更好.
【点睛】
方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算的值;③计算回归系数;④写出回归直线方程为; 回归直线过样本点中心是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.
5.袋中有9个大小相同颜色不全相同的小球,分别为黑球、黄球、绿球,从中任意取一球,得到黑球或黄球的概率是,得到黄球或绿球的概率是,试求:
(1)从中任取一球,得到黑球、黄球、绿球的概率各是多少?
(2)从中任取两个球,得到的两个球颜色不相同的概率是多少?
【答案】(1)黑球、黄球、绿球的概率分别是,,;(2).
【分析】
(1)从中任取一球,分别记得到黑球、黄球、绿球为事件,,,由已知列出的方程组可得答案;
(2)求出从9个球中取出2个球的样本空间中共有的样本点,再求出两个球同色的样本点可得答案.
【详解】
(1)从中任取一球,分别记得到黑球、黄球、绿球为事件,,,
由于,,为互斥事件,
根据已知,得,
解得,
所以,任取一球,得到黑球、黄球、绿球的概率分别是,,.
(2)由(1)知黑球、黄球、绿球个数分别为3,2,4,
从9个球中取出2个球的样本空间中共有36个样本点,
其中两个是黑球的样本点是3个,两个黄球的是1个,两个绿球的是6个,
于是,两个球同色的概率为,
则两个球颜色不相同的概率是.
【点睛】
本题考查互斥事件和对立事件的概率,一般地,如果事件A1、A2、…、An彼此互斥,那么事件A1+A2+…+An发生(即A1、A2、…、An中有一个发生)的概率,等于这n个事件分别发生的概率的和,即P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An).
6.“工资条里显红利,个税新政人民心”,随着年新年钟声的敲响,我国自年以来,力度最大的一次个人所得税(简称个税)改革至年实施以来发挥巨大作用.个税新政主要内容包括:
(1)个税起征点为元;
(2)每月应纳税所得额(含税)收入个税起征点专项附加扣除;
(3)专项附加扣除包括住房、子女教育和赡养老人等.新旧个税政策下每月应纳税所得额(含税)计算方法及其对应的税率表如表:
旧个税税率表(税起征点元)
新个税税率表(个税起征点元)
缴税级数
每月应纳税所得额(含税)收入个税起征点
税率
每月应纳税所得额(含税)收入个税起征点专项附加扣除
税率
不超过元部分
不超过元部分
超过元至元部分
超过元至元部分
超过元至元的部分
超过元至元的部分
超过元至元的部分
超过元至元的部分
超过元至元部分
超过元至元部分
随机抽取某市名同一收入层级的从业者的相关资料,经统计分析,预估他们年的人均月收入元.统计资料还表明,他们均符合住房专项扣除;同时,他们每人至多只有一个符合子女教育扣除的孩子,并且他们之中既不符合子女教育扣除又不符合赡养老人扣除、只符合子女教育扣除但不符合赡养老人扣除、只符合赡养老人扣除但不符合子女教育扣除、即符合子女教育扣除又符合赡养老人扣除的人数之比是;此外,他们均不符合其他专项附加扣除.新个税政策下该市的专项附加扣除标准为:住房元/月,子女教育每孩元/月,赡养老人元/月等.假设该市该收入层级的从业者都独自享受专项附加扣除,将预估的该市该收入层级的从业者的人均月收入视为其个人月收入.根据样本估计总体的思想,解决如下问题:
(1)求该市该收入层级的从业者年月缴个税的所有可能及其概率.
(2)根据新旧个税方案,估计从年月开始,经过多少个月,该市该收入层级的从业者各月少缴交的个税之和就超过年的月收入?
【答案】(1)答案见解析;(2)经过个月.
【分析】
(1)计算出题中四类人群每月应纳税所得额,结合题意求出每类人群的月缴个税及其概率;
(2)计算出在旧政策下,该收入阶层的从业者每月应纳税所得额,可求得新政策下,每月少缴个税额,设经过个月该市该收入阶层的从业者各月少缴交的个税之和就超过年的月收入,根据已知条件可得出关于的不等式,结合可求得结果.
【详解】
(1)由题意,既不符合子女教育扣除又不符合赡养老人扣除、只符合子女教育扣除但不符合赡养老人扣除、只符合赡养老人扣除但不符合子女教育扣除、即符合子女教育扣除又符合赡养老人扣除的人数之比是.
①既不符合子女教育扣除又不符合赡养老人扣除的人群每月应纳税所得额为
元,
月缴个税为元,其概率为;
②只符合子女教育扣除但不符合赡养老人扣除的人群每月应纳税所得额为
元,
月缴个税为元,其概率为;
③只符合赡养老人扣除但不符合子女教育扣除的人群每月应纳税所得额为元,
月缴个税为元,其概率为;
④既符合子女教育扣除又符合赡养老人扣除的人群每月应纳税所得额为元,
月缴个税为元,其概率为;
(2)在旧政策下,该收入阶层的从业者每月应纳税所得额为元,
故月缴个税为元,
在新政策下,该收入阶层的从业者每月应纳税所得额为元,
每月少缴个税元,
设经过个月该市该收入阶层的从业者各月少缴交的个税之和就超过年的月收入,
则,又,解得,
所以经过个月,该市该收入阶层的从业者各月少缴交的个税之和就超过年的月收入.
【点睛】
关键点点睛:解决本题第一问的关键在于理解题中个税新旧政策中的扣税方案,并依据题意计算出各类人群所扣的税额;
解决本题第二问的关键在于求出新旧政策下所扣的税额,并结合题意列不等式求解.
7.为了解学生寒假期间学习情况,学校对某班男、女学生学习时间进行调查,学习时间按整小时统计,调查结果绘制成折线图如下:
(1)已知该校有400名学生,试估计全校学生中,每天学习不足4小时的人数;
(2)若从学习时间不少于4小时的学生中选取4人,设选取的男生人数为X,求随机变量X的分布列及均值E(X);
(3)试比较男生学习时间的方差与女生学习时间的方差的大小.(只需写出结论)
【答案】(1)240人;(2)分布列见解析,2;(3).
【分析】
(1)由折线图分析可得20名学生中有12名学生每天学习不足4小时,把频率当概率可以估计校400名学生中天学习不足4小时的人数;(2)学习时间不少于4本的学生共8人,其中男学生人数为4人,故的取值为0,1,2,3,4;利用组合知识,由古典概型公式计算可得 =0,1,2,3,4的概率,进而可得随机变量的分布列;(3)根据折线图,看出男生、女生的学习时间的集中与分散程度,根据方差的实际意义可得答案.
【详解】
(1)由折线图可得共抽取了20人,其中男生中学习时间不足4小时的有8人,女生中学习时间不足4小时的有4人.
故可估计全校学生中每天学习时间不足4小时的人数为400×=240.
(2)学习时间不少于4小时的学生共8人,其中男生人数为4,
故X的所有可能取值为0,1,2,3,4.
由题意可得
P(X=0)=,
P(X=1)=,
P(X=2)=,
P(X=3)=,
P(X=4)=.
X
0
1
2
3
4
P
所以随机变量X的分布列为
∴均值E(X)=0×+1×+2×+3×+4×=2.
(3)由折线图可得.
【点睛】
方法点睛:本题考查了折线统计图和超几何分布,考查了离散型随机变量分布列和数学期望的计算,求解离散型随机变量分布列的步骤是:
1.首先确定随机变量的所有可能取值;
2.计算取得每一个值的概率,可通过所有概率和为来检验是否正确;
3.进行列表,画出分布列的表格;
4.最后扣题,根据题意求数学期望或者其它.
8.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关?
强力有效
效力一般
合计
男性
50
女性
10
合计
100
参考数据:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
,其中.
【答案】(1),平均数为;(2)2×2列联表见解析,能在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关.
【分析】
(1)利用小矩形的面积之和等于即可求的值,再利用小矩形底边中点横坐标乘以对应的小矩形面积之和即可得平均数;
(2)由已知条件即可补充列联表;再利用卡方分布的计算公式求与临界值比较即可判断.
【详解】
(1)由,解得:
平均得分为
(2)由己知可得强力有效人数有人,
则列联表为:
强力有效
效力一般
合计
男性
20
30
50
女性
10
40
50
合计
30
70
100
所以能在犯错误的概率不超过的前提下认为疫苗强效力与性别有关.
【点睛】
结论点睛: 率分布直方图的相关公式以及数字特征的计算,
①直方图中各个小长方形的面积之和为;
②直方图中每组样本的频数为频率乘以总数;
③最高的小矩形底边中点横坐标即是众数;
④中位数的左边和右边小长方形面积之和相等;
⑤平均数是频率分布直方图的重心,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
9.近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由),并求出关于的回归方程;
(2)已知每辆单车的购入成本为元,年调度费以及维修等的使用成本为每人次元,按用户每使用一次,收费元计算,若投入辆单车,则几年后可实现盈利?
参考数据:
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)适宜,;(2)6年.
【分析】
(1)由散点图可判断适宜,设,则,再根据参考数据及公式即可得解;
(2)先将代入得年使用人次,进而可得收益和总投资比较大小即可得解.
【详解】
(1)由散点图判断,适宜作为投放量与年使用人次的回归方程类型.
由,两边同时取常用对数得.
设,则.
因为,,,,
所以.
把代入,得,
所以,所以,
则,
故关于的回归方程为.
(2)投入千辆单车,则年使用人次为千人次,
每年的收益为(千元),
总投资千元,
假设需要年开始盈利,则,即,
故需要年才能开始盈利.
【点睛】
关键点点睛:对于非线性回归方程的求解,一般要结合题意作变换,转化为线性回归方程来求解,同时也要注意相应数据的变化.
10.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米):
男:173 178 174 185 170 169 167 164 161 170
女:165 166 156 170 163 162 158 153 169 172
(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;
(2)请根据测量结果得到20名学生身高的中位数h(单位:厘米),将男、女生身高不低于h和低于h的人数填入下表中,并判断是否有的把握认为男、女生身高有差异?
人数
男生
女生
身高
身高
参照公式:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.
【答案】(1)男:,女:;(2)答案见解析,有;(3)0.6.
【分析】
(1)根据题中数据完善茎叶图即可,结合平均数的计算公式即可求出结果;
(2)根据题中数据完善列联表,再由求出,结合临界值表即可得出结论;
(3)先由题意确定身高属于正常的男生概率,进而可求出结果.
【详解】
(1)茎叶图为:
男生
女生
15
6
8
3
1
4
7
9
16
5
6
3
2
9
0
4
8
0
3
17
0
2
5
18
平均身高为:男:,
女:.
(2)20名学生身高的中位数,
男、女身高的列联表:
人数
男生
女生
身高
7
3
身高
3
7
∵,
∴有90%把握认为男、女身高有差异.
(3)由测量结果可知,身高属于正常的男生,记这三名男生为a,b,c身高属于不正常(偏矮或偏高)的男生,记这两名男生为1,2
从以上5名学生中任取2人的结果有:,,,,,,,,12共10种其中恰好一名身高属于正常的男生的事件A有:,,,,,,共6种.
∴恰有1人属于正常的概率为0.6.
【点睛】
本题主要考查茎叶图以及独立性检验的问题,熟记平均数的计算公式、独立性检验的思想等即可,属于常考题型.
走进高考
11.(2020年全国统一高考数学试卷(文科)新课标Ⅰ)
某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级
A
B
C
D
频数
40
20
20
20
乙分厂产品等级的频数分布表
等级
A
B
C
D
频数
28
17
34
21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
【答案】(1)甲分厂加工出来的级品的概率为,乙分厂加工出来的级品的概率为;(2)选甲分厂,理由见解析.
【分析】
(1)根据两个频数分布表即可求出;
(2)根据题意分别求出甲乙两厂加工件产品的总利润,即可求出平均利润,由此作出选择.
【详解】
(1)由表可知,甲厂加工出来的一件产品为级品的概率为,乙厂加工出来的一件产品为级品的概率为;
(2)甲分厂加工件产品的总利润为元,
所以甲分厂加工件产品的平均利润为元每件;
乙分厂加工件产品的总利润为
元,
所以乙分厂加工件产品的平均利润为元每件.
故厂家选择甲分厂承接加工任务.
【点睛】
本题主要考查古典概型的概率公式的应用,以及平均数的求法,并根据平均值作出决策,属于基础题.
12.(2020年全国统一高考数学试卷(文科)新课标Ⅱ)
某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
【答案】(1);(2);(3)详见解析
【分析】
(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;
(2)利用公式计算即可;
(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.
【详解】
(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
【点晴】
本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.
13.(2020年全国统一高考数学试卷(理科)新课标Ⅲ)
某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【分析】
(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;
(2)利用每组的中点值乘以频数,相加后除以可得结果;
(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.
【详解】
(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量不好
空气质量好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】
本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.
14.(2019年全国统一高考数学试卷(文科)新课标Ⅰ)
某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1);
(2)能有的把握认为男、女顾客对该商场服务的评价有差异.
【分析】
(1)从题中所给的列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;
(2)利用公式求得观测值与临界值比较,得到能有的把握认为男、女顾客对该商场服务的评价有差异.
【详解】
(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为,
50名女顾客对商场满意的有30人,
所以女顾客对商场服务满意率估计为,
(2)由列联表可知,
所以能有的把握认为男、女顾客对该商场服务的评价有差异.
【点睛】
该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算的值,独立性检验,属于简单题目.
15.(2019年全国统一高考数学试卷(文科)新课标Ⅱ)
某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
【答案】(1) 增长率超过的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.
【分析】
(1)本题首先可以通过题意确定个企业中增长率超过的企业以及产值负增长的企业的个数,然后通过增长率超过的企业以及产值负增长的企业的个数除随机调查的企业总数即可得出结果;
(2)可通过平均值以及标准差的计算公式得出结果.
相关学案
这是一份专题20概率(理)知识点与大题16道专练(中档题)(解析版)-备战2022年高考数学大题分类提升专题学案,共22页。学案主要包含了椭圆,双曲线,抛物线,直线与圆锥曲线的位置关系,弦长问题等内容,欢迎下载使用。
这是一份专题12概率(理)知识点与大题16道专练(培优题)(解析版)-备战2022年高考数学大题分类提升专题学案,共27页。
这是一份专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共14页。