





所属成套资源:新高考数学二轮复习解答题提优训练专题 (2份,原卷版+解析版)
新高考数学二轮复习解答题提优训练专题2.5 概率与统计(回归分析、独立性检验)(2份,原卷版+解析版)
展开
这是一份新高考数学二轮复习解答题提优训练专题2.5 概率与统计(回归分析、独立性检验)(2份,原卷版+解析版),文件包含新高考数学二轮复习解答题提优训练专题25概率与统计回归分析独立性检验原卷版doc、新高考数学二轮复习解答题提优训练专题25概率与统计回归分析独立性检验解析版doc等2份试卷配套教学资源,其中试卷共63页, 欢迎下载使用。
1.有关独立性检验的问题,分析如下:
(1)利用频率估计概率;
(2)根据题意,求得的值,对照临界值得结果.
2.对于非线性回归方程及其应用,考查将非线性回归问题转化为线性回归问题求解,在解题的过程中,要注重回归方程的公式的正确计算,注意所给数据的正确应用.
1.(2023·辽宁朝阳·校联考一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)
如下:
(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);
(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?
(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.
参考公式和数据:其中
回归直线方程中,
2.(2023·四川成都·校考二模)2022年12月2日晚,神舟十四号、神舟十五号航天员乘组进行在轨交接仪式,两个乘组移交了中国空间站的钥匙,6名航天员分别在确认书上签字,中国空间站正式开启长期有人驻留模式.为调查大学生对中国航天事业的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下列联表,经计算,有97.5%的把握认为该校学生对中国航天事业的了解与性别有关,但没有99%的把握认为该校学生对中国航天事业的了解与性别有关.
(1)求n的值.
(2)现采用分层抽样的方法在调查结果“了解中国航天事业”的学生中抽取5人,再从这5人中抽取3人进行第二次调查,以便了解学生获得中国航天事业信息的渠道,则至少有2名男生被第二次调查的概率.
附表:
3.(2023·四川南充·统考二模)某甜品屋店庆当天为酬谢顾客,当天顾客每消费满一百元获得一次抽奖机会,奖品分别为价值5元,10元,15元的甜品一份,每次抽奖,抽到价值为5元,10元,15元的甜品的概率分别为,且每次抽奖的结果相互独立.
(1)若某人当天共获得两次抽奖机会,设这两次抽奖所获甜品价值之和为X元,求X的分布列与期望.
(2)某大学“爱牙协会”为了解“爱吃甜食”与青少年“蛀牙”情况之间的关系,随机对200名青少年展开了调查,得知这200个人中共有120个人“有蛀牙”,其中“不爱吃甜食”且“有蛀牙”的有30人,“不爱吃甜食”且“无蛀牙”的有50人.有列联表:
完成上面的列联表,根据独立性检验,能否有99.5%的把握认为“爱吃甜食”与青少年“蛀牙”有关?
附:,.
4.(2023·宁夏石嘴山·校考一模)2022年卡塔尔世界杯足球赛于11月21日至12月18日在卡塔尔境内举办,这是第二十二届世界杯足球赛,是历史上首次在卡塔尔和中东国家境内举行,也是继2002年韩日世界杯之后时隔二十年第二次在亚洲举行的世界杯足球赛,备受瞩目,一时间掀起了国内外的足球热潮.某机构为了了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各120名观众进行调查,统计数据如下:
(1)根据上表说明,能否在犯错误概率不超过0.01的前提下认为喜爱足球运动与性别有关?
(2)现从参与调查且喜爱足球运动的观众中,采用按性别分层抽样的方法,选取7人进行有奖竞答.
①求男、女性观众各选取多少人?
②若从这7人中随机抽取4人进行本届世界杯赛事集锦分享,求抽到男生人数的分布列和数学期望.
附:,.
5.(2023·吉林长春·校联考一模)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布,其中μ近似为样本的平均数(每组数据取区间的中间值),且,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
并依据小概率值的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:;;.
6.(2023·内蒙古包头·一模)新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.
30名女生成绩频数分布表:
(1)根据以上数据,完成以下列联表,并判断是否有95%的把握认为“防疫标兵”与性别有关;
(2)设男生和女生样本平均数分别为和,样本的中位数分别为和,求(精确到0.01).
附:
7.(2023·河南·校联考模拟预测)基础学科招生改革试点,也称强基计划,强基计划是教育部开展的招生改革工作,主要是为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域.某校在一次强基计划模拟考试后,从全体考生中随机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:
根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:,,,,,其中分别表示这50名考生的数学成绩、物理成绩,,2,…,50,y与x的相关系数.
(1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为.试判断与r的大小关系(不必说明理由);
(2)求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到0.1)
附:线性回归方程中:.
8.(2023·河南·校考模拟预测)造林绿化对生态发展特别是在防风固沙、缓解温室效应、净化空气、涵养水源等方面有着重要意义.某苗木培养基地为了对某种树苗的高度偏差x(单位:)与树干最大直径偏差y(单位:)之间的关系进行分析,随机挑选了8株该品种的树苗,得到它们的偏差数据(偏差是指个别测定值与测定的平均值之差)如下:
(1)若x与y之间具有线性相关关系,求y关于x的线性回归方程;
(2)若这种树苗的平均高度为,树干最大直径平均为,试由(1)的结论预测高度为的这种树苗的树干最大直径为多少毫米.
参考数据:,.
参考公式:回归直线方程中斜率和截距的最小二乘估计:,.
9.(2023·全国·模拟预测)为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:
(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断(a,b为常数)与(,为常数,且,)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(,为常数,且,),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
①证明:“对于非线性回归方程,令,可以得到繁殖个数的对数z关于天数x具有线性关系(即,β,α为常数)”;
②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).
附:对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘估计分别为,.
10.(2023·辽宁抚顺·统考模拟预测)学校为提升高一年级学生自主体育锻炼的意识,拟称每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女姓组,对每周自主体育锻炼的时间分段进行统计(单位:小时)第一段,第二段,第三段,第四段,第五段.将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
(2)填写下列列联表,并判断是否有95%的把握认为是否为“体育迷”与学生的性别有关?
附:
(3)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平?(同一段中的数据用该组区间的中点值代表)
11.(2023·陕西咸阳·统考二模)2021年,党中央、国务院印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,也就是我们现在所称的“双减”政策.某地为了检测双减的落实情况,从某高中选了6名同学,检测课外学习时长(单位:分钟),相关数据如下表所示.
(1)若从被抽中的6名同学中随机抽出2名,则抽出的2名同学课外学习时长都不小于210分钟的概率;
(2)下表是某班统计了本班同学2022年1-7月份的人均月课外劳动时间(单位:小时),并建立了人均月课外劳动时间关于月份的线性回归方程,与的原始数据如下表所示:
由于某些原因导致部分数据丢失,但已知.
(i)求,的值;
(ii)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).
附:,,.
12.(2023·辽宁·校联考一模)一所中学组织学生对某线下某实体店2022年部分月份的月利润情况进行调查统计,得到的数据如下:
根据散点图,准备用①或②建立关于的回归方程.
(1)用线性相关系数说明上面的两种模型哪种适宜作为关于的回归方程?
(2)由参考数据,根据(1)的判断结果,求关于的回归方程(精确到0.1).
附:对于一组数据(,2,3,⋯,n),其回归直线的斜率和截距的最小二乘估计分别为,.相关系数.
参考数据:,,,,,
,,,
,.
13.(2023·四川遂宁·校考模拟预测)某高校共有学生15000人,其中男生10500人,女生4500人.为了调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:小时)的样本数据.
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为,估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请给出每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.
附:
参考公式:,其中.
14.(2023·全国·模拟预测)第五届中国国际进口博览会(以下简称进博会)于2022年11月5日至10日在国家会展中心(上海)举办.本届进博会共有284家世界500强和行业龙头企业参展,数量超过上届,其中至少参展过两届及以上进博会的企业占比约为90%.本届进博会首次运用虚拟现实、三维建模等新技术手段,引入了全新的线上展示技术,为参观者带来不同以往的观展体验.活动结束后,进博会组委会从参观者中随机抽取100人(其中年龄在50周岁及以下的有60人)了解他们对全新的线上展示活动的满意度,并按年龄(50周岁及以下和50周岁以上)分类统计得到如下不完整的列联表:
(1)根据统计数据完成以上列联表,并根据小概率值的独立性检验,能否认为对全新的线上展示活动是否满意与年龄有关联?
(2)从本届参展的284家世界500强和行业龙头企业中随机抽取3家了解他们对组委会的组织工作的满意度,设其中至少参展过两届及以上进博会的企业的个数为,若以本届参展的世界500强和行业龙头企业中至少参展过两届及以上进博会的企业的频率为概率.
①求的分布列和数学期望;
②求.
参考公式及数据:,其中.
15.(2023·福建厦门·统考二模)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.右图是2018-2022年移动物联网连接数W与年份代码t的散点图,其中年份2018-2022对应的t分别为1~5.
(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;
(2)(i)假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型 (随机误差).请推导:当随机误差平方和Q=取得最小值时,参数b的最小二乘估计.
(ii)令变量,则变量x与变量Y满足一元线性回归模型利用(i)中结论求y关于x的经验回归方程,并预测2024年移动物联网连接数.
附:样本相关系数,,,,
16.(2023·山西·统考模拟预测)某农科所对冬季大棚内的昼夜温差与某反季节大豆新品种发芽率之间的关系进行分析研究,记录了2023年1月1日至1月12日大棚内的昼夜温差与每天每100颗种子的发芽数,得到如下资料:
已知发芽数与温差之间线性相关,该农科所确定的研究方案是:先从这12组数据中选取2组,用剩下的10组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻2天的数据的概率;
(2)若选取的是1日与6日的两组数据,试根据除这两日之外的其他数据,求出关于的线性回归方程;(精确到1)
(3)若由线性回归方程得到的估计数据与所选取的检验数据的误差均不超过2颗,则认为求得的线性回归方程是可靠的,试问:(2)中所得的线性回归方程是否可靠.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
17.(2023·浙江·校联考三模)大坝是一座具有灌溉、防洪、发电、航运、养殖和游览等综合效益的大型水利枢纽工程.为预测渗压值和控制库水位,工程师在水库选取一支编号为的渗压计,随机收集个该渗压计管内水位和水库水位监测数据:
并计算得,,.
(1)估计该水库中号渗压计管内平均水位与水库的平均水位;
(2)求该水库号渗压计管内水位与水库水位的样本相关系数(精确到);
(3)某天雨后工程师测量了水库水位,并得到水库的水位为.利用以上数据给出此时号渗压计管内水位的估计值.
附:相关系数,,,.
18.(2023·福建漳州·统考三模)年月日,由工业和信息化部、安徽省人民政府共同主办的第十七届“中国芯”集成电路产业大会在合肥成功举办.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.年,全国芯片研发单位相比年增加家,提交芯片数量增加个,均增长超过倍.某芯片研发单位用在“芯片”上研发费用占本单位总研发费用的百分比()如表所示.
(1)根据表中的数据,作出相应的折线图;并结合相关数据,计算相关系数,并推断与线性相关程度;(已知:,则认为与线性相关很强;,则认为与线性相关一般;,则认为与线性相关较弱)
(2)求出与的回归直线方程(保留一位小数);
(3)请判断,若年用在“芯片”上研发费用不低于万元,则该单位年芯片研发的总费用预算为万元是否符合研发要求?
附:相关数据:,,,.
相关计算公式:①相关系数;
在回归直线方程中,,.
19.(2023·湖南·模拟预测)2022年12月15至16日,中央经济工作会议在北京举行.关于房地产主要有三点新提法,其中“住房改善”位列扩大消费三大抓手的第一位.某房地产开发公司旗下位于生态公园的楼盘贯彻中央经济工作会议精神,推出了为期10天的促进住房改善的惠民优惠售房活动,该楼盘售楼部统计了惠民优惠售房活动期间到访客户的情况,统计数据如下表:(注:活动开始的第i天记为,第i天到访的人次记为,)
(1)根据统计数据,通过建模分析得到适合函数模型为(c,d均为大于零的常数).请根据统计数据及下表中的数据,求活动到访人次y关于活动开展的天次x的回归方程,并预测活动推出第8天售楼部来访的人次;
参考数据:其中;
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:;
(2)该楼盘营销策划部从有意向购房的客户中,随机通过电话进行回访,统计有效回访发现,客户购房意向的决定因素主要有三类:A类是楼盘的品质与周边的生态环境,B类是楼盘的品质与房子的设计布局,C类是楼盘的品质与周边的生活与教育配套设施.统计结果如下表:
从被回访的客户中再随机抽取3人聘为楼盘的代言人,视频率为概率,记随机变量X为被抽取的3人中A类和C类的人数之和,求随机变量X的分布列和数学期望.
20.(2023·广东江门·统考一模)某高科技公司对其产品研发年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表和散点图.
(1)该公司科研团队通过分析散点图的特征后,计划分别用①和②两种方案作为年销售量y关于年投资额x的回归分析模型,请根据统计表的数据,确定方案①和②的经验回归方程;(注:系数b,a,d,c按四舍五入保留一位小数)
(2)根据下表中数据,用相关指数(不必计算,只比较大小)比较两种模型的拟合效果哪个更好,并选择拟合精度更高、更可靠的模型,预测当研发年投资额为8百万元时,产品的年销售量是多少?
参考公式及数据:,,
,
,.
日期
第一天
第二天
第三天
第四天
第五天
第六天
第七天
日期代码
1
2
3
4
5
6
7
杯数
4
15
22
26
29
31
32
22.7
1.2
759
235.1
13.2
8.2
男生
女生
合计
了解
不了解
合计
0.10
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
有蛀牙
无蛀牙
合计
爱吃甜食
不爱吃甜食
合计
0.05
0.01
0.005
3.841
6.635
7.879
喜爱足球运动
不喜爱足球运动
男性
80
40
女性
60
60
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
成绩
频数
10
10
6
4
男生
女生
合计
防疫标兵
非防疫标兵
合计
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
树苗序号
1
2
3
4
5
6
7
8
高度偏差x
20
15
13
3
2
直径偏差y
6.5
3.5
3.5
1.5
0.5
天数x
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
3.50
62.83
3.53
17.50
596.57
12.9
体育迷
非体育迷
合计
男
女
合计
0.050
0.010
0.001
3.841
6.635
10.828
学生序号
1
2
3
4
5
6
学习时长/分
220
180
210
220
200
230
月份
1
2
3
4
5
6
7
人均月劳动时间
8
9
12
19
22
月份
2
4
6
8
10
12
净利润(万元)
0.9
2.0
4.2
3.9
5.2
5.1
0.7
1.4
1.8
2.1
2.3
2.5
1.4
2.0
2.4
2.8
3.2
3.5
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
不满意
满意
总计
50周岁及以下
55
50周岁以上
15
总计
100
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
日期
1日
2日
3日
4日
5日
6日
7日
8日
9日
10日
11日
12日
温差/℃
10
11
13
12
8
10
9
11
13
10
12
9
发芽数/颗
21
24
28
28
15
22
17
22
30
18
27
18
;;;
样本号
总和
水库水位
渗压计管内水位
年份
年份代码
(单位:天)
1
2
3
4
5
6
7
(单位:人次)
12
22
42
68
132
202
392
类别
A类
B类
C类
频率
0.4
0.2
0.4
x
1
2
3
4
5
6
y
0.5
1
1.5
3
6
12
-0.7
0
0.4
1.1
1.8
2.5
经验回归方程
残差平方和
18.29
0.65
相关试卷
这是一份新高考数学二轮复习解答题提优训练专题2.6 概率与统计(随机变量及其分布)(2份,原卷版+解析版),文件包含新高考数学二轮复习解答题提优训练专题26概率与统计随机变量及其分布原卷版doc、新高考数学二轮复习解答题提优训练专题26概率与统计随机变量及其分布解析版doc等2份试卷配套教学资源,其中试卷共53页, 欢迎下载使用。
这是一份新高考数学二轮复习解答题提优训练专题2.3 数列(常规型)(2份,原卷版+解析版),共32页。试卷主要包含了等差数列问题解决的基本方法,数列求和的方法,已知数列的前n项和为,且,,设数列的前n项和为,且,.,在数列中,等内容,欢迎下载使用。
这是一份新高考数学二轮复习解答题提优训练专题1.6 概率与统计(随机变量及其分布)(2份,原卷版+解析版),文件包含新高考数学二轮复习解答题提优训练专题16概率与统计随机变量及其分布原卷版doc、新高考数学二轮复习解答题提优训练专题16概率与统计随机变量及其分布解析版doc等2份试卷配套教学资源,其中试卷共52页, 欢迎下载使用。
