高中数学高考 2021届高三大题优练3 统计案例(理) 教师版(1)
展开
例1.随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中表示开设网店数量,表示这个分店的年销售额总和),现已知,,求解下列问题;
(1)经判断,可利用线性回归模型拟合与的关系,求解关于的回归方程;
(2)按照经验,超市每年在网上销售获得的总利润(单位:万元)满足,请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.
参考公式;线性回归方程,其中,.
【答案】(1);(2)开设8或9个分店时,才能使得总利润最大.
【解析】(1)由题意得,,,
,
所以.
(2)由(1)知,,
所以当或时能获得总利润最大.
例2.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
附:,
(1)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别有关?
| 非体育迷 | 体育迷 | 合计 |
男 |
|
|
|
女 |
| 10 | 55 |
合计 |
|
|
|
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取一名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为.若每次抽取的结果是相互独立的,求的分布列,期望和方差.
【答案】(1)列联表见解析,没有95%以上的把握认为“体育迷”与性别有关;(2)分布列见解析,数学期望为,方差为.
【解析】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成列联表如下:
| 非体育迷 | 体育迷 | 合计 |
男 | 30 | 15 | 45 |
女 | 45 | 10 | 55 |
合计 | 75 | 25 | 100 |
将列联表中的数据代入公式计算,得
,
因为,所以没有95%以上的把握认为“体育迷”与性别有关.
(2)由频率分布直方图知抽到“体育迷”的频率为,
将频率视为概率,即从观众中抽取一名“体育迷”的概率为.
由题意,从而的分布列为
0 | 1 | 2 | 3 | |
所以,
.
例3.某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,,得到相关数据如表所示:
(1)从①;②;③三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出与的回归方程;
(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?(结果保留到万元)
参考数据:,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
【答案】(1)选择回归类型更好;(2);(3)下一年应至少投入万元广告费用.
【解析】(1)由散点图知,年广告费用和年利润额的回归类型并不是直线型的,而是曲线型的,且与呈正相关.
所以选择回归类型更好.
(2)对两边取自然对数,得,
,,则,
由表中数据得,
所以,所以,
所以年广告费用和年利润额的回归方程为.
(3)由(2),知,令,得,得,
所以,所以(十万元),
故下一年应至少投入万元广告费用.
1.某外卖平台为提高外卖配送效率,针对外卖配送业务提出了两种新的配送方案,为比较两种配送方案的效率,共选取50名外卖骑手,并将他们随机分成两组,每组25人,第一组骑手用甲配送方案,第二组骑手用乙配送方案.根据骑手在相同时间内完成配送订单的数量(单位:单)绘制了如图茎叶图:
甲配送方案 |
| 乙配送方案 |
9 7 9 9 8 8 7 0 9 7 6 4 4 4 3 3 3 3 2 1 1 2 1 0 0 | 3 4 5 6 | 7 8 9 9 3 3 5 7 7 7 8 8 9 9 9 9 2 3 4 4 7 8 8 0 2 |
(1)根据茎叶图,求各组内25位骑手完成订单数的中位数,已知用甲配送方案的25位骑手完成订单数的平均数为52,结合中位数与平均数判断哪种配送方案的效率更高,并说明理由;
(2)设所有50名骑手在相同时间内完成订单数的平均数,将完成订单数超过记为“优秀”,不超过记为“一般”,然后将骑手的对应人数填入如表列联表;
| 优秀 | 一般 |
甲配送方案 |
|
|
乙配送方案 |
|
|
(3)根据(2)中的列联表,判断能否有95%的把握认为两种配送方案的效率有差异.
附:,其中.
【答案】(1)甲配送方案的效率更高,理由见解析;(2)填表见解析;(3)有95%的把握认为两种配送方案的效率有差异.
【解析】(1)由茎叶图知用甲配送方案的骑手完成外卖订单数的中位数为53,
用乙配送方案的骑手完成外卖订单数的中位数为49,
因为用乙配送方案的骑手完成外卖订单数的平均数为,且,
所以,甲配送方案的效率更高.
(2)由茎叶图知,
列联表如下:
| 优秀 | 一般 | 总计 |
甲配送方案 | 17 | 8 | 25 |
乙配送方案 | 9 | 16 | 25 |
总计 | 26 | 24 | 50 |
(3)因为,
所以有95%的把握认为两种配送方案的效率有差异.
2.近几年来,热饮越来越受到年轻人的欢迎.一个研究性学习小组为了研究气温对热饮销售的影响,统计了学校门口一个热饮店在2019年1月份某6天白天的平均气温和热饮销售量,得到以下数据:
x气温/ | 0 | 3 | 6 | 10 | 13 | |
y销售量/杯 | 161 | 146 | 138 | 133 | 120 | 112 |
(1)求销售量关于气温的回归直线方程,若某天白天的平均气温为,估计当天的热饮销售量;
(2)根据表格中的数据计算(精确到),由此解释平均气温对销售量变化的影响.
参考公式:,;.
【答案】(1),102杯;(2),平均气温解释了的销售量变化(或销售量变化有是由平均气温引起的).
【解析】(1)由题知,,,从而
x | 0 | 3 | 6 | 10 | 13 | |
y | 161 | 146 | 138 | 133 | 120 | 112 |
1 | 5 | 8 | ||||
26 | 11 | 3 |
,
,
解得,,
所以,气温预报销售量的回归直线方程为.
当时,.
因此,某天白天的平均气温为时,估计可以卖出102杯热饮.
(2)
x | 0 | 3 | 6 | 10 | 13 | |
y | 161 | 146 | 138 | 133 | 120 | 112 |
156 | 150 | 141 | 132 | 120 | 111 | |
5 | 1 | 0 | 1 |
,
,
.
所以,平均气温解释了的销售量变化(或销售量变化有是由平均气温引起的).
3.截止2020年5月15日,新冠肺炎全球确诊数已经超过440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构收集了1000名患者的病毒潜伏期的信息,将数据统计如下表所示:
潜伏期 | 0-2天 | 2-4天 | 4-6天 | 6-8天 | 8-10天 | 10-12天 | 12-14天 |
人数 | 40 | 160 | 300 | 360 | 60 | 60 | 20 |
(1)求1000名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表);
(2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期高于平均数的患者,称为“长潜伏者”.为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有的把握认为潜伏期长短与患者年龄有关.
| 短潜伏者 | 长潜伏者 | 合计 |
60岁及以上 | 100 |
|
|
60岁以下 |
|
| 140 |
合计 |
|
| 300 |
附表及公式:
.
【答案】(1)6;(2)填表见解析;有的把握认为潜伏期长短与患者年龄有关.
【解析】(1)
.
(2)抽取的短潜伏者的总人数为,
长潜伏者的总人数为.
列联表如下:
| 短潜伏者 | 长潜伏者 | 合计 |
60岁及以上 | 100 | 60 | 160 |
60岁以下 | 50 | 90 | 140 |
合计 | 150 | 150 | 300 |
,
故有的把握认为潜伏期长短与患者年龄有关.
4.近年来,网络电商已经悄然进入了广大市民的日常生活,并慢慢改变了人们的消费方式为了更好地服务民众,某电商在其官方APP中设置了用户评价反馈系统,以了解用户对商品状况和优惠活动的评价现从评价系统中随机抽出200条较为详细的评价信息进行统计,商品状况和优惠活动评价的2×2列联表如下:
| 对优惠活动好评 | 对优惠活动不满意 | 合计 |
对商品状况好评 | 100 | 20 | 120 |
对商品状况不满意 | 50 | 30 | 80 |
合计 | 150 | 50 | 200 |
(1)能否在犯错误的概率不超过的前提下认为优惠活动好评与商品状况好评之间有关系?
(2)为了回馈用户,公司通过APP向用户随机派送每张面额为0元,1元,2元的三种优惠券用户每次使用APP购物后,都可获得一张优惠券,且购物一次获得1元优惠券,2元优惠券的概率分别是,,各次获取优惠券的结果相互独立若某用户一天使用了APP购物两次,记该用户当天获得的优惠券面额之和为X,求随机变量X的分布列和数学期望.
参考数据
P(K2≥k) | 0150 | 0100 | 0050 | 0025 | 0010 | 0005 | 0001 |
k | 2072 | 2706 | 3841 | 5024 | 6635 | 7879 | 10828 |
参考公式:,其中n=a+b+c+d.
【答案】(1)在犯错误的概率不超过的前提下认为优惠活动好评与商品状况好评之间有关系;(2)见解析.
【解析】(1)由题意,根据独立性检验的公式,
可得.
∴在犯错误的概率不超过的前提下认为优惠活动好评与商品状况好评之间有关系.
(2)由题意可得:X的取值分别为0,1,2,3,4.
则,,
,,
.
可得X的分布列为:
X | 0 | 1 | 2 | 3 | 4 |
P(X) |
可得数学期望.
5.近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:表:根据以上数据,绘制了散点图.
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
6 | 11 | 21 | 34 | 66 | 101 | 196 |
(1)根据散点图判断,在推广期内与(,均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断,不必说明理由);
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:
支付方式 | 现金 | 乘车卡 | 扫码 |
比例 | 10% | 60% | 30% |
车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有的概率享受7折优惠,有的概率享受8折优惠,有的概率享受9折优惠,预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要年才能开始盈利,求的值.
参考数据:其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
【答案】(1);(2),347;(3)7.
【解析】(1)因为散点近似在指数型函数的图象上,所以适宜作为扫码支付的人数关于活动推出天数的回归方程类型.
(2)∵,两边同时取常用对数得,
设,∴,
∵,,,
∴,
把样本中心点代入,得,
∴,∴,
∴关于的回归方程式,
把代入上式,∴,
活动推出第8天使用扫码支付的人次为347.
(3)记一名乘客乘车支付的费用为,则的取值可能为,,,,
;;
;,
所以,一名乘客一次乘车的平均费用为(元),
由题意可知,,
所以,取7,估计这批车大概需要7年才能开始盈利.
6.2019年12月以来,湖北省武汉市持续开展流感及相关疾病监测,发现多起病毒性肺炎病例,均诊断为病毒性肺炎/肺部感染,后被命名为新型冠状病毒肺炎(CoronaVirusDisease2019,COVID-19),简称“新冠肺炎”.下图是2020年1月15日至1月24日累计确诊人数随时间变化的散点图.
为了预测在未采取强力措施下,后期的累计确诊人数,建立了累计确诊人数与时间变量的两个回归模型,根据1月15日至1月24日的数据(时间变量的值依次为1,2,...,10)建立模型和.
(1)根据散点图判断,与哪一个适宜作为累计确诊人数与时间变量的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及附表中数据,建立关于的回归方程;
(3)以下是1月25日至1月29日累计确诊人数的真实数据,根据(2)的结果回答下列问题:
时间 | 1月25日 | 1月26日 | 1月27日 | 1月28日 | 1月29日 |
累计确诊人数的真实数据 | 1975 | 2744 | 4515 | 5974 | 7111 |
(i)当1月25日至1月27日这3天的误差)模型预测数据与真实数据差值的绝对值与真实数据的比值)都小于则认为模型可靠,请判断(2)的回归方程是否可靠?
(ii)2020年1月24日在以习近平同志为核心的党中央坚强领导下,全国人民共同采取了强力的预防“新冠肺炎”的措施,若采取措施5天后,真实数据明显低于预测数据,则认为防护措施有效,请判断预防措施是否有效?
附:一组数据,...,,回归直线公式为,.
参考数据:其中,.
【答案】(1)适宜;(2);(3)(i)可靠;(ii)有效.
【解析】(1)根据散点图可知:适宜作为累计确诊人数与时间变量的回归方程类型.
(2)设,则,,
,∴.
(3)(i)时,,;
当时,,;
当时,,,
所以(2)的回归方程可靠.
(ii)当时,,10150远大于7111,所以防护措施有效.
高中数学高考 2021届高三大题优练14 不等式选讲(理) 教师版(1): 这是一份高中数学高考 2021届高三大题优练14 不等式选讲(理) 教师版(1),共8页。试卷主要包含了设函数的最小值为,已知函数,已知,证明,设,,均为正实数,且,已知,求证等内容,欢迎下载使用。
高中数学高考 2021届高三大题优练12 导数极值点偏移问题(理) 教师版(1): 这是一份高中数学高考 2021届高三大题优练12 导数极值点偏移问题(理) 教师版(1),共8页。试卷主要包含了已知函数有两个零点,,已知函数,设函数等内容,欢迎下载使用。
高中数学高考 2021届高三大题优练11 导数恒成立问题(理) 教师版(1): 这是一份高中数学高考 2021届高三大题优练11 导数恒成立问题(理) 教师版(1),共12页。试卷主要包含了已知函数,,已知实数,设函数,已知且,,已知函数等内容,欢迎下载使用。