所属成套资源:【艺考生专用】高考数学40天突破训练讲义(教师版+学生版)
专题28 统计案例和回归方程 -2025年新高考艺术生数学突破讲义
展开
这是一份专题28 统计案例和回归方程 -2025年新高考艺术生数学突破讲义,文件包含专题28统计案例和回归方程原卷版docx、专题28统计案例和回归方程解析版docx等2份学案配套教学资源,其中学案共68页, 欢迎下载使用。
知识点一、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.
3、相关系数
若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为.
(1)当时,表示两个变量正相关;当时,表示两个变量负相关.
(2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.
(3)通常当时,认为两个变量具有很强的线性相关关系.
知识点二、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
知识点三、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.
(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.
3、独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量的观测值,查下表确定临界值:
②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”.
(2)两个分类变量和是否有关系的判断标准:
统计学研究表明:
当时,认为与无关;
当时,有的把握说与有关;
当时,有的把握说与有关;
当时,有的把握说与有关.
【典型例题】
例1.(山东省枣庄市2024届高三学期3月模拟考试数学试题)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
经计算得到,根据小概率值的独立性检验(已知独立性检验中),则可以认为( )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
例2.(四川省成都市2024届高三学期第二次诊断性检测文科数学试题)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且B.变量与呈现负相关,且
C.变量与呈现正相关,且D.变量与呈现负相关,且
例3.(FHsx1225yl136)如图,去掉点D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.决定系数R2变大
D.解释变量x与预报变量y的相关性变强
例4.(湖南省2024年普通高等学校招生全国统一考试考前演练二数学试题)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
例5.(四川省成都市第七中学2024届高三学期期末数学试题)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001B.0.05C.0.01D.0.005
例6.(云南省曲靖市2024届高三学期第一次质量监测数学试题)已知变量关于的回归方程为,若对两边取自然对数,可以发现与线性相关.现有一组数据如下表所示:
则当时,预测的值为( )
A.B.C.D.
例7.(山东省滨州市2024届高三学期期末数学试题)某学校一同学研究温差(单位:℃)与本校当天新增感冒人数(单位:人)的关系,该同学记录了5天的数据:
由上表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是( )
A.与有正相关关系B.经验回归直线经过点
C.D.时,残差为0.2
例8.(云南省大理白族自治州2024届高三第二次复习统一检测数学试题)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下表对应数据:
根据表中数据得到关于的经验回归方程为,则当时,残差为 .(残差观测值-预测值)
例9.(天津市八校联考2023-2024学年高三学期期末质量调查数学试卷)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
例10.(2024年普通高等学校招生全国统一考试数学文科猜题卷(七))近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
例11.(湖北省七市州2024届高三学期3月联合统一调研测试数学试题)某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表:
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下列联表,并依据小概率值的独立性检验,能否认为性别因素与学生体育锻炼的经常性有关系;
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为,求和;
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:
例12.(陕西省汉中市汉台区2024届高三学期第四次校际联考数学试题)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
并计算得.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.
例13.在一次抽样调查中测得个样本点,得到下表及散点图.
(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)
参考公式:
【过关测试】
一、单选题
1.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A.B.
C.D.
2.(上海市普陀区桃浦中学2024届高三学期期末数学试题)下列命题中,真命题的是( )
A.若回归方程,则变量与负相关
B.线性回归分析中决定系数用来刻画回归的效果,若该值越小,则模型的拟合效果越好
C.若样本数据的方差为2,则数据的方差9
D.若与独立,则
3.(内蒙古呼和浩特市2024届高三学期学业质量监测数学试题)用模型拟合一组数据组,其中,设,得变换后的线性回归方程为,则( )
A.B.C.35D.21
4.(上海市浦东新区2024届高三学期期中教学质量检测数学试卷)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
二、多选题
5.(2024届广东省湛江市高三一模数学试题)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:
下列说法正确的有( )
参考公式:,其中.
附表:
A.
B.
C.根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
6.(河北省沧州市泊头市联考2024届高三学期高考模拟考试数学试题)下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:
以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有( )
A.变量和变量的样本相关系数为正数
B.比的拟合效果好
C.由回归方程可准确预测2024年的能源消费总量
D.
7.(FHsx1225yl136)(多选)某学校为了调查学生对“只要学习够努力,成绩一定有奇迹”这句话的认可程度,随机调查了90名本校高一、高二的学生,得到如下列联表.用样本估计总体,则下列说法正确的是(参考数据:χ2=,n=a+b+c+d,P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001)( )
A.高一高二大约有66.7%的学生认可这句话
B.高一高二大约有99%的学生认可这句话
C.依据α=0.01的独立性检验,认为学生对这句话认可与否与年级有关
D.在犯错误的概率不超过0.01的前提下,认为学生对这句话认可与否与年级无关
8.(安徽省芜湖市安徽师范大学附属中学2024届高三第二次模拟考试数学试题)已知由样本数据(i=1,2,3,…,10)组成的一个样本,得到回归直线方程为,且.剔除一个偏离直线较大的异常点后,得到新的回归直线经过点.则下列说法正确的是
A.相关变量x,y具有正相关关系
B.剔除该异常点后,样本相关系数的绝对值变大
C.剔除该异常点后的回归直线方程经过点
D.剔除该异常点后,随x值增加相关变量y值减小速度变小
9.(湘豫名校联考2024年2月高三第一次模拟考试数学试题)下列说法中,正确的是( )
A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位
B.已知随机变量,若,则
C.两组样本数据和的方差分别为.若已知且,则
D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则
10.(河南省部分重点中学2024届高三学期2月质量检测数学试题)已知变量之间的经验回归方程为,且变量的数据如下表所示:
则下列说法正确的是( )
A.变量之间负相关B.
C.当时,可估计的值为11D.当时,残差为
11.(吉林省部分学校2024届高三学期高考模拟(三)数学试题)为了解高二学生是否喜爱物理学科与性别的关联性,某学校随机抽取了200名学生进行统计.得到如图所示的列联表,则下列说法正确的是( )
A.喜爱物理学科的学生中,男生的频率为
B.女生中喜爱物理学科的频率为
C.依据小概率值的独立性检验,可以推断学生是否喜爱物理学科与性别有关
D.在犯错误的概率不超过的前提下,认为学生是否喜爱物理学科与性别无关
参考公式:,其中.
附表:
12.(云南省三校2024届高三高考备考实用性联考卷(五)数学试题)下列命题正确的是( )
A.若样本数据的方差为3,则数据的方差为12
B.以模型去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则
C.若某校高三(1)班8位同学身高(单位)分别为:,,,,,,,,则这组数据的下四分位数(即第25百分位数)为170
D.根据变量与的样本数据计算得到,根据的独立性检验,可判断与有关,且犯错误的概率不超过0.05
13.(浙江省宁波市慈溪市2024届高三学期期末测试数学试题)某电商平台为了对某一产品进行合理定价,采用不同的单价在平台试销,得到的数据如下表所示:
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程为,则( )
A.相关系数B.点一定在经验回归直线上
C.D.时,对应销量的残差为
14.(广东省揭阳市2024届高三学期期末教学质量测试数学试题)2023年入冬以来,流感高发,某医院统计了一周中连续5天的流感就诊人数y与第天的数据如表所示.
根据表中数据可知x,y具有较强的线性相关关系,其经验回归方程为,则( )
A.样本相关系数在内B.当时,残差为-2
C.点一定在经验回归直线上D.第6天到该医院就诊人数的预测值为130
15.(辽宁省沈阳市辽中区第一私立高级中学2023-2024学年高二学期期末考试数学试题)对两个变量和进行回归分析,则下列结论正确的为()
A.回归直线至少会经过其中一个样本点
B.残差平方和越小的模型,拟合的效果越好
C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好
D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别为
16.(重庆市黔江中学校2024届高三学期8月考试数学试题)下列说法中正确的是( )
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.回归直线恒过样本点的中心,且至少过一个样本点
C.用相关指数来刻画回归效果时,越接近1,说明模型的拟合效果越好
D.在列联表中,的值越大,说明两个分类变量之间的关系越弱
三、填空题
17.(广东省广州市2024届普通高中毕业班综合测试(一)数学试卷)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为 ;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .(参考公式:决定系数)
18.(专题04回归分析与独立性检验的应用(四大类型))学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数 (结果保留两位小数).
四、解答题
19.(四川省成都市郫都区2024届高三学期阶段检测(三))数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统计了该商场开通在线直播的第x天的线下顾客人数y(单位:百人)的数据:
(1)根据第1至第5天的数据分析,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后三位);
(2)根据第1至第5天的数据分析,可用线性回归模型拟合y与x的关系,试求出该线性回归方程并估计该商场开通在线直播的第10天的线下顾客人数.
(参考公式:相关系数,参考数据:
回归方程:,其中,)
20.(河南省TOP二十名校2024届高三学期质检一数学试题)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:
其中的数据为统计的人数,已知被调研的青年人数为400.
(1)求的值;
(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?
参考公式:,其中.
临界值表:
21.(山西省晋城市第一中学校2024届高三学期第十四次调研考试数学试题)成都第31届世界大学生夏季运动会于7月28日开幕,蓬勃向上的青春活力在“大运之城”绽放,多所学校掀起了运动的热潮,为了解决学生对运动的喜爱程度,某学校从全校学生中随机抽取200名学生进行问卷调查,得到以下信息:
①抽取的学生中,男生占的比例为60%;
②抽取的学生中,不喜欢运动的学生占的比例为40%;
③抽取的学生中,喜欢运动的男生比喜欢运动的女生多40人.
(1)完成列联表,依据小概率值的独立性检验,能否认为是否喜欢运动与性别有关联?
(2)从随机抽取的这200名学生中随机抽取20人,其中喜欢运动的有11人,不喜欢运动的有9人,现从这20人中随机选出2人,设2人中喜欢运动的学生人数为,求随机变量的分布列.
参考公式及数据
22.(河北省张家口市尚义县第一中学等校2024届高三学期开学收心联考数学试题)为了研究体育锻炼对某年龄段的人患某种慢性病的影响,某人随机走访了个该年龄段的人,得到的数据如下:
(1)定义分类变量、如下:,,以频率估计概率,求条件概率与的值;
(2)根据小概率值的独立性检验,分析经常进行体育锻炼是否对患该种慢性病有影响.
附:
23.(江苏省南京市金陵中学2023-2024学年高三学期2月模拟测试数学试题)某高中为了了解高中学生暑假期间阅读古典名著的时间(小时/每周)和他们的语文成绩(分)的关系,某实验小组做了调查,得到一些数据(表一).
表一
(1)请根据所给数据求出语文成绩的平均数和方差;
(2)基于上述调查,学校为了确认学生喜欢阅读古典名著与语文成绩的关系,抽样调查了200位学生.按照是否喜欢阅读古典名著与语文成绩是否优秀统计,得到下列数据,请依据表中数据及小概率值的独立性检验,分析“喜欢阅读古典名著与语文成绩优秀”是否有关.
表二
24.(陕西省2024届高三教学质量检测(一)文科数学试题)我国老龄化时代已经到来,老龄人口比例越来越大,出现很多社会问题.2015年10月,中国共产党第十八届中央委员会第五次全体会议公报指出:坚持计划生育基本国策,积极开展应对人口老龄化行动,实施全面二孩政策.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
(1)求x和y的值.
(2)分析调查数据,是否有以上的把握认为“生育意愿与城市级别有关”?
(3)在以上二孩生育意愿中按分层抽样的方法,抽取6名育龄妇女,再选取两名参加育儿知识讲座,求至少有一名来自一线城市的概率.
参考公式:,
25.(广东省深圳外国语学校、执信中学2023-2024学年高三学期期末校际联考数学试卷)杭州第19届亚运会,中国代表团共获得201金111银71铜,共383枚奖牌,金牌数超越2010年广州亚运会的199枚,标志着我国体育运动又有了新的突破.某大学从全校学生中随机抽取了130名学生,对其日常参加体育运动情况做了调查,其中是否经常参加体育运动的数据统计如下:
(1)利用频率估计概率,现从全校女生中随机抽取5人,求其中恰有2人不经常参加体育运动的概率;
(2)依据小概率值的独立性检验,能否认为是否经常参加体育运动与性别有关联.
参考公式:.
26.(河北省张家口市2023-2024学年高三学期1月期末考试数学试题)某公司男女职工人数相等,该公司为了解职工是否接受去外地长时间出差,进行了如下调查:在男女职工中各随机抽取了100人,经调查,男职工和女职工接受去外地长时间出差的人数分别为40和20.
(1)根据所给数据,完成下面列联表,并依据小概率值的独立性检验,能否认为是否接受去外地长时间出差与性别有关联?
单位:人
(2)若将频率视为概率,用样本估计总体,从该公司中随机抽取5人,记其中接受去外地长时间出差的人数为X,求X的数学期望,
附表:
附:,其中.
27.(艺体生一轮复习第九章计数原理、概率与统计第50讲独立性检验【练】)第五代移动通信技术(简称)是最新一代蜂窝移动通信技术,是实现人机物互联的网络基础设施.某市工信部门为了解本市手机用户对网络的满意情况,随机抽取了本市200名手机用户进行了调查,所得情况统计如下:
附:
,其中.
(1)完成上述列联表,并估计本市手机用户对网络满意的概率;
(2)依据小概率值的独立性检验,分析本市手机用户对网络满意与年龄在50岁以下是否有关.
28.(青海省西宁市大通县2024届高三学期期末数学试题)家居消费是指居民在日常生活中购买和使用的家具、家电、建材、装修等产品和服务所形成的消费行为.长期以来,家居消费一直是居民消费的重要组成部分,对于带动居民消费增长和经济恢复具有重要意义.某家居店为了迎接周年庆举办促销活动,统计了半个月以来天数x与销售额y(万元)的一组数据:.通过分析发现x与y呈线性相关.
(1)求x与y的样本相关系数r(结果保留三位小数);
(2)求x与y的线性回归方程(,的结果用分数表示).
参考公式:相关系数,,.
参考数据:,,,.
29.(江苏省镇江市第一中学2024届高三学期1月学情检测调研数学试题)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各人进行分析,从而得到表(单位:人):
(1)完成上表;对于以上数据,采用小概率值的独立性检验,能否认为我市市民网购与性别有关联?
(2)①现从所抽取的女市民中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
②将频率视为概率,从我市所有参与调查的市民中随机抽取20人赠送礼品,记其中经常网购的人数为,求随机变量的数学期望和方差.
参考公式:.常用的小概率值和对应的临界值如下表:
30.(河北省邢台市宁晋县河北宁晋中学2024届高三学期模拟预测数学试题)“世界卫生组织”通过总结“世界预防医学”的最新成果,指出:的疾病都与不良水质有关,50多种疾病与饮用不良水质有关.下表是某省A市的慢性病研究中心调查得到的甲慢性病与饮用水水质的调查表:
单位:人
(1)依据小概率值的独立性检验,能否认为A市患慢性病与饮用不良水质有关?
(2)已知某省A市、B市和其他县市人口占比分别是,,,以调查表数据的频率估计A市患甲慢性病的概率,经过深入调查发现B市和其他县市患甲慢性病的概率分别为,,从该省任意抽取一人,试估计此人患甲慢性病的概率.
附表及公式:,其中.
临界值表:
31.(黑龙江省鸡西市第一中学校2024届高三学期期末数学试题)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:
(1)计算变量的相关系数(结果精确到0.01).
(2)求变量之间的线性回归方程,并据此预测2023年6月份该公司的直播带货金额.
参考数据:,
参考公式:相关系数,线性回归方程的斜率,截距.
32.(江西省赣州市兴国县联考2024届高三学期5月月考文科数学试题)随着人们生活水平的提高,我国城乡居民消费结构发生了很大变化,家庭食品支出的比重呈逐年下降趋势,下表是近5年某居民家庭食品支出占总消费的比重(以下简称比重)的统计表.
(1)求与的相关系数(精确到0.001),并据此判断比重与年份的相关性强弱;
(2)若比重与年份代码之间具有较强的线性相关性,求关于的线性回归方程;
附:①相关系数:,若,则可判断与线性相关性较强.
②线性回归方程中斜率与截距的最小二乘估计公式分别为.
③参考数据:.
33.(江西省泰和中学2024届高三7月暑期质量检测数学试题)某骑行爱好者近段时间在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分x与对应用时y(单位:小时)如下表:
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程.
参考数据和参考公式:相关系数,,,
34.(山东省滨州市2023-2024学年高二学期期末数学试题)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1-10分别对应年份2013-2022.
根据散点图,分别用模型①,②作为年研发投入关于年份代码的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
表中.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入关于年份代码的经验回归方程模型?并说明理由;
(2)根据(1)中所选模型,求出关于的经验回归方程,并预测该公司2028年的高科技研发投入.
附:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
35.(2023年普通高等学校招生全国统一考试数学猜题卷(三))近年来,我国新能源汽车技术水平不断进步、产品性能明显提升,产销规模连续六年位居世界首位.我国新能源汽车行业取得的成就离不开国家政策的支持,为支持我国新能源汽车行业发展,国家出台了一系列政策,其中《新能源汽车产业发展规划(2021-2035年)》提出,到2025年,新能源汽车新车销售量达到汽车新车销售总量的20%左右,力争经过15年的持续努力,我国新能源汽车核心技术达到国际先进水平,质量品牌具备较强国际竞争力.某汽车城从某天开始连续的营业天数x与新能源汽车销售总量y(单位:辆)的统计数据如表所示:
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,并预测该汽车城连续营业130天的汽车销售总量.
参考数据:,,.
参考公式:相关系数,
线性回归方程中斜率与截距的最小二乘估计公式分别为,.
36.(山东省淄博市2024届高三学期一模数学试题)某电商平台统计了近七年小家电的年度广告费支出(万元)与年度销售量(万台)的数据,如表所示:
其中,
(1)若用线性回归模型拟合与的关系,求出关于的线性回归方程;
(2)若用模型拟合得到的回归方程为,经计算线性回归模型及该模型的分别为0.75和0.88,请根据的数值选择更好的回归模型拟合与的关系,进而计算出年度广告费为何值时,利润的预报值最大?
参考公式:,;
总计
总计
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
疗法
疗效
合计
未治愈
治愈
甲
15
52
67
乙
6
63
69
合计
21
115
136
身体综合指标评分
1
2
3
4
5
用时小时)
9.5
8.8
7.8
7
6.1
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
1
2
3
4
5
5
6
8
9
12
16
20
25
28
36
1
3
4
5
7
15
20
30
40
45
天数x
1
2
3
4
5
6
7
一次最多答对题数y
12
15
16
18
21
24
27
年份
2019
2020
2021
2022
2023
充电桩数量x/万台
1
3
5
7
9
新能源汽车年销量y/万辆
25
37
48
58
72
一周参加体育锻炼次数
0
1
2
3
4
5
6
7
合计
男生人数
1
2
4
5
6
5
4
3
30
女生人数
4
5
5
6
4
3
2
1
30
合计
5
7
9
11
10
8
6
4
60
性别
锻炼
合计
不经常
经常
男生
女生
合计
0.1
0.05
0.01
2.706
3.841
6.635
样本号
1
2
3
4
5
6
7
8
9
10
总和
零件的横截面积
0.03
0.05
0.04
0.07
0.07
0.04
0.05
0.06
0.06
0.05
0.52
耗材量
0.24
0.40
0.23
0.55
0.50
0.34
0.35
0.45
0.43
0.41
3.9
性别
是否患过某流行疾病
合计
患过该疾病
未患过该疾病
男
b
女
c
合计
80
110
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
年份
2019
2020
2021
2022
2023
年份代号
1
2
3
4
5
能源消费总量近似值(单位:千万吨标准煤)
44.2
44.6
46.2
47.8
50.8
认可
不认可
总计
高一
20
20
40
高二
40
10
50
总计
60
30
90
5
6
8
12
14
10
8
6
5
1
性别
物理学科
喜爱
不喜爱
男
60
40
女
20
80
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
单价x/元
8
8.5
9
9.5
10
销量y/万件
89
85
80
78
68
x
1
2
3
4
5
y
21
10a
15a
90
109
天数x
1
2
3
4
5
6
7
一次最多答对题数y
12
15
16
18
21
24
27
x
1
2
3
4
5
y
10
12
15
18
20
青年人
中年人
老年人
对短视频剪接成长视频的APP有需求
200
对短视频剪接成长视频的APP无需求
150
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
喜欢运动
不喜欢运动
合计
男生
女生
合计
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
慢性病
体育锻炼
合计
经常
不经常
未患病
患病
合计
编号
1
2
3
4
5
学习时间
2
4
7
7
10
语文成绩
82
93
95
108
122
语文成绩优秀
语文成绩不优秀
合计
喜欢阅读
75
25
100
不喜欢阅读
55
45
100
合计
130
70
200
0.10
0.05
0.010
2.706
3.841
6.635
非一线
一线
总计
愿生
40
y
60
不愿生
x
22
40
总计
58
42
100
0.050
0.010
0.001
k
3.841
6.635
10.828
经常参加
不经常参加
男生
60
20
女生
40
10
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
性别
接受
不接受
合计
男
女
合计
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
满意情况
年龄
合计
50岁以下
50岁或50岁以上
满意
95
不满意
25
合计
120
200
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
经常网购
偶尔或不用网购
合计
男性
45
100
女性
65
100
合计
a
0.150
0.100
0.050
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
饮用水水质
甲慢性病
合计
患病
不患病
优良水质
100
400
500
不良水质
100
200
300
合计
200
600
800
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
月份
1
2
3
4
5
带货金额万元
350
440
580
700
880
年份
2017年
2018年
2019年
2020年
2021年
年份代号
1
2
3
4
5
比重
38
32
30
27
23
身体综合指标评分
1
2
3
4
5
用时(/小时)
9.5
8.6
7.8
7
6.1
75
2.25
82.5
4.5
120
28.35
从某天开始连续的营业天数x
10
20
30
40
50
新能源汽车销售总量y/辆
62
68
75
81
89
年份
2016
2017
2018
2019
2020
2021
2022
广告费支出
1
2
4
6
11
13
19
销售量
1.9
3.2
4.0
4.4
5.2
5.3
5.4
相关学案
这是一份专题27 统计的应用-2025年新高考艺术生数学突破讲义,文件包含专题27统计的应用原卷版docx、专题27统计的应用解析版docx等2份学案配套教学资源,其中学案共46页, 欢迎下载使用。
这是一份专题23 复数经典问题 -2025年新高考艺术生数学突破讲义,文件包含专题23复数经典问题原卷版docx、专题23复数经典问题解析版docx等2份学案配套教学资源,其中学案共26页, 欢迎下载使用。
这是一份专题16 极值与最值-2025年新高考艺术生数学突破讲义,文件包含专题16极值与最值原卷版docx、专题16极值与最值解析版docx等2份学案配套教学资源,其中学案共29页, 欢迎下载使用。