终身会员
搜索
    上传资料 赚现金
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)
    立即下载
    加入资料篮
    资料中包含下列文件,点击文件名可预览资料内容
    • 原卷
      人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(原卷版).docx
    • 解析
      人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(解析版).docx
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)01
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)02
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)03
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)01
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)02
    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)03
    还剩22页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)

    展开
    这是一份人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版),文件包含人教版高中数学选择性必修三精讲精练第八章成对数据的统计分析章末小结及测试原卷版docx、人教版高中数学选择性必修三精讲精练第八章成对数据的统计分析章末小结及测试解析版docx等2份试卷配套教学资源,其中试卷共62页, 欢迎下载使用。

    第八章 成对数据的统计分析 章末小结及测试考法一 相关系数【例1-1】(2024·山西运城)对变量,有观测数据,得散点图1;对变量,有观测数据,得散点图2. 表示变量,之间的样本相关系数,表示变量,之间的样本相关系数,则(    )A. B.C. D.【答案】A【解析】从图像中看出随增大而减少(图像下降),随增大而减少(图像下降),则与呈负相关关系, 与呈负相关关系,即,故C,D不正确; 另外对比两图,容易看出与相关性更强,故越接近,所以得,A正确,B错误.故选:A.【例1-2】(2024·湖南 )某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:由上表数据得到的正确结论是(    )参考数据:参考公式:相关系数.A.身体综合指标评分与骑行用时正相关B.身体综合指标评分与骑行用时的相关程度较弱C.身体综合指标评分与骑行用时的相关程度较强D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合【答案】C【解析】因为相关系数.即相关系数近似为与负相关,且相关程度相当高,从而可用线性回归模型拟合与的关系.所以选项ABD错误,C正确.故选:C.【例1-3】(2024陕西汉中 )大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:并计算得.(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.【答案】(1)平均每个零件的横截面积为,一个零件的耗材量(2)(3)【解析】(1)样本中10个这种零件的横截面积的平均值,样本中10个这种零件的耗材量的平均值,由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为,平均一个零件的耗材量为.(2),这种零件的横截面积和耗材量的样本相关系数为.(3)设这种零件的总耗材量的估计值为,又已知这种零件的耗材量和其横截面积近似成正比,,解得,故这种零件的总耗材量的估计值为.4【例1-4】(2023·河南·模拟预测)党的二十大以来,国家不断加大对科技创新的支持力度,极大鼓舞了企业持续投入研发的信心.某科技企业在国家一系列优惠政策的大力扶持下,通过不断的研发和技术革新,提升了企业收益水平.下表是对2023 年1 ~5月份该企业的利润y(单位:百万)的统计.(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.附:相关系数 【答案】(1);具有很强的线性相关性(2)分布列见解析;【解析】(1)由统计表数据可得:    所以    所以相关系数 , 因此,两个变量具有很强的线性相关性.(2)由题意知,的可能取值为                        因为 , ,所以 的分布列为:所以 考法二 线性回归方程【例2-1】(2023山东滨州·期末)某学校一同学研究温差(单位:℃)与本校当天新增感冒人数(单位:人)的关系,该同学记录了5天的数据:由上表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是(    )A.与有正相关关系 B.经验回归直线经过点C. D.时,残差为0.2【答案】C【解析】由表格可知,越大,越大,所以与有正相关关系,故A正确;,,样本点中心为,经验回归直线经过点,故B正确;将样本点中心代入直线方程,得,所以,故C错误;,当 时,,,故D正确.故选:C【例2-2】(2024·全国·模拟预测)(多选)节约用电是低碳生活的重要组成部分,契合环保和社会可持续发展的原则,是推动“双碳”目标实现的一场全社会的行动,离不开你我的共同参与.某企业从2019年开始加强节电管理,收效明显.下表是该企业自2018年至2022年的用电量:根据表格数据计算得,.已知y与x具有线性相关关系,则下列说法中正确的是(    )(附:,)A.该企业2018年至2022年平均每年用电量为B.y与x正相关C.估计该企业2017年用电量为D.预测该企业2023年用电量为【答案】AD【解析】因为,,所以A正确;, ,所以B错误;因为该企业是从2019年开始加强节电管理,所以不能估计2017年的用电量,所以C错误;因为,即y与x满足的线性回归方程为,2023年对应的年份编号为6,所以预计2023年该校用电量为,所以D正确.故选:AD.【例2-3】(2023山东日照 )发展新能源汽车是我国从汽车大国迈向汽车强国的必由之路,是应对气候变化推动绿色发展的战略举措.随着国务院《新能源汽车产业发展规划(2021—2035)》的发布,我国自主品牌汽车越来越具备竞争力.国产某品牌汽车对市场进行调研,统计了该品牌新能源汽车在某城市年前几个月的销售量(单位:辆),用表示第月份该市汽车的销售量,得到如下统计表格:(1)经研究,、满足线性相关关系,求关于的线性回归方程,并根据此方程预测该店月份的成交量(、按四舍五入精确到整数);(2)该市某店为感谢客户,决定针对该品牌的汽车成交客户开展抽奖活动,设“一等奖”、“二等奖”和“祝您平安”三种奖项,“一等奖”奖励千元;“二等奖”奖励千元;“祝您平安”奖励纪念品一份.在一次抽奖活动中获得“二等奖”的概率为,获得一份纪念品的概率为,现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.参考数据及公式:,,.【答案】(1),预测该店月份的成交量为辆(2)分布列见解析,【解析】(1)解:由题意可得,,, ,, 故线性回归方程为, 当时,,故预计月份的成交量为辆.(2)解:由题意可得,获得“一等奖”的概率为, 的所有可能取值为、、、、、,,,,,,,故的分布列为:故.【例2-4】(2024重庆·阶段练习)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升. 下表为重庆市 2014 2022 年全体居民人均可支配收入,将其绘制成散点图 (如图 1),发现全体居民人均可支配收入与年份具有线性相关关系. (数据来源于重庆市统计局 2023-05-06 发布).(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到 0.01 ),并根据所求回归方程,预测2023年重庆市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.参考数据:.参考公式: 对于一组数据 ,其回归直线方程 的斜率和截距的最小二乘估计分别为.【答案】(1);3.77万元(2)分布列见解析;1【解析】(1)由题意得,,,故,故回归方程为,又2023年的年份编号为10,将代入,得,即预测2023年重庆市全体居民人均可支配收入为3.77万元;(2)由图表知,人均可支配收入超过3万的年份有3年,故X的可能取值为,则,,,,故随机变量的分布列为:故.考法三 独立性检验【例3-1】(2023江苏常州·期末)某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则的值是 .附:,其中.【答案】5【解析】根据独立性检验思想可得,,得,因为且,所以;故答案为:5.【例3-2】(2024河南省直辖县级单位·期中)为了解患某疾病是否与性别有关,随机地调查了50人,得到如下的列联表:则 (填“有”或“没有”)的把握认为患该疾病与性别有关.参考公式:,其中.参考数据:【答案】没有【解析】根据的计算公式求得,结合题意给的数据表和独立性检验的思想即可下结论.由题意知,,所以没有99.9%的把握认为患者与该疾病有关.故答案为:没有【例3-3】(2024·山东淄博 )为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为 ,求小明星期天选择跑步的概率.参考公式: 附:【答案】(1)有关(2)分布列见解析;期望为(3)【解析】(1)零假设:体育锻炼频率的高低与年龄无关,由题得列联表如下:,根据小概率值的独立性检验推断不成立,即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.(2)由数表知,利用分层抽样的方法抽取的8人中,年龄在内的人数分别为1,2,依题意,的所有可能取值分别为为0,1,2,所以,,,所以的分布列::所以的数学期望为.(3)记小明在某一周星期六选择跑步、篮球、羽毛球,分别为事件A,B,C,星期天选择跑步为事件,则,,所以所以小明星期天选择跑步的概率为.【例3-4】(2024·江苏徐州 )某中学对该校学生的学习兴趣和预习情况进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类,设事件A:学习兴趣高,事件B:主动预习.据统计显示,,,.(1)计算和的值,并判断A与B是否为独立事件;(2)为验证学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有99.5%的把握认为学习兴趣与主动预习有关,试确定的最小值.附:,其中.【答案】(1),,不相互独立(2)【解析】(1)由已知,,又因为,所以,所以,又,所以,所以A与B不为独立事件;(2)假设原列联表为根据原数据有若将样本容量调整为原来的倍,则新的列联表为:则,解得,又,所以的最小值为.考法四 非线性回归方程【例4-1】(2023山东·开学考试)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则(    )A.-2 B.-1 C. D.【答案】C【解析】由已知可得,,,所以,有,解得,所以,,由,得,所以,,则.故选:C.【例4-2】(2024山东聊城·阶段练习)今年刚过去的4月份是“全国消费促进月”,各地拼起了特色经济”,带动消费复苏、市场回暖.“小饼烤炉加蘸料,灵魂烧烤三件套”,最近,淄博烧烤在社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营业额也在近一个月内实现了成倍增长.因此某烧烤店老板考虑投入更多的人工成本,现有以往的服务人员增量x(单位:人)与年收益增量y单位:万元)的数据如下:据此,建立了y与x的两个回归模型:  模型①:由最小二乘公式可求得与的一元线性经验回归方程为;模型②:由散点图(如图)的样本点分布,可以认为样本点集中在曲线的附近.对数据进行初步处理后,得到了一些统计的量的值:,,,,其中,(1)根据所给的统计量,求模型②中关于的经验回归方程(精确到0.1);(2)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高的模型,预测服务人员增加25人时的年收益增量.附:样本的最小二乘估计公式为,,刻画样本回归效果的决定系数 【答案】(1)=21.3-14.4(2)模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好,92.1万元.【解析】(1)令,则. 由参考数据得==38.9-21.32×2.5≈-14.4,所以,模型②中y关于x的经验回归方程为=21.3-14.4.(2)由表格中的数据,有182.4>79.2,即,模型①的小于模型②,说明回归模型②刻画的拟合效果更好当x=25时,模型②的收益增量的预测值为=21.3×-14.4=21.3×5-14.4=92.1(万元).所以预测服务人员增加25人时的年收益增量为92.1万元.【例4-3】(2024吉林长春·阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了名网红直播的观看人次和农产品销售量的数据,得到如图所示的散点图.(1)利用散点图判断,和哪一个更适合作为观看人次和销售量的回归方程类型;(只要给出判断即可,不必说明理由)(2)对数据作出如下处理:得到相关统计量的值如表:其中令,.根据(1)的判断结果及表中数据,求(单位:千件)关于(单位:十万次)的回归方程,并预测当观看人次为万人时的销售量;参考数据和公式:,附:对于一组数据、、、,其回归线的斜率和截距的最小二乘估计分别为:,.【答案】(1)更适合;(2),预测当观看人次为万人时的销售量约为件.【解析】(1)解:由散点图可知,散点分布在一条对数型曲线附近,所以选择回归方程更适合.(2)解:令,则,因为,,所以,又因为,,所以,所以与的线性回归方程为,故关于的回归方程为.令,代入回归方程可得(千件)所以预测观看人次为万人时的销售量约为件.考法五 综合运用【例5-1】(2023辽宁沈阳·期末)(多选)对两个变量和进行回归分析,则下列结论正确的为()A.回归直线至少会经过其中一个样本点B.残差平方和越小的模型,拟合的效果越好C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别为【答案】BD【解析】A选项,回归直线不一定经过样本点,A选项错误.B选项,残差平方和越小的模型,拟合的效果越好,B选项正确.C选项,,所以模型的拟合度更好,C选项错误.D选项,由,得,D选项正确.故选:BD【例5-2】(2024·河南南阳 )(多选)下列说法中,正确的是(    )A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位B.已知随机变量,若,则C.两组样本数据和的方差分别为.若已知且,则D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则【答案】BC【解析】若有一个经验回归方程,随着的增大,会减小,错误;曲线关于对称,因为,所以,所以,B正确;因为,所以,所以,同理可得:,故,C正确;经验回归方程为,且样本点与的残差相等,则,D错误.故选:.【例5-3】(2023浙江湖州·期末)(多选)下列结论中正确的是(    )A.在列联表中,若每个数据均变为原来的2倍,则的值不变B.已知随机变量服从正态分布,若,则C.在一组样本数据的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为0.9D.分别抛掷2枚相同的硬币,事件表示为“第1枚为正面”,事件表示为“两枚结果相同”,则事件是相互独立事件【答案】BD【解析】对于A中,若的列联表中的每个数字变成原理的2倍,则,此时变为原理的2倍,所以A错误;对于B中,在随机变量服从正态分布,若,则,所以B正确;对于C中,若所有样本点都在直线上,则这组样本数据完全相关,所以这组样本数据的样本相关系数为,所以C不正确;对于D中,分别抛掷2枚相同的硬币,事件表示为“第1枚为正面”,事件表示为“两枚结果相同”,可得,,可得,所以事件是相互独立事件,所以D正确.故选:BD.单选题1.(2023湖北)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是(    )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是【答案】C【解析】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是,D选项错误故选:C2.(2023陕西西安 )如图是某地在50天内感染新冠病毒的累计病例y(单位:万人)与时间x(单位:天)的散点图,则下列最适宜作为此模型的回归方程类型的是(    )  A. B.C. D.【答案】B【解析】选项A,对应的“直线型”的拟合函数,散点图中的点应在某直线附近,故A错误;选项B,根据散点图可以看出散点大致分布在一条“指数型”函数曲线附近,则的图象可以如图所示,故B正确;选项C,对应的“幂函数型”的拟合函数,则其对应图象应上凸下凹,故C错误;选项D,对应的“对数型”的拟合函数,则其对应图象应上凸下凹,故D错误.故选:B.3.(2024高三·全国·专题练习)下列命题中①散点图可以直观地判断两个变量是否具有线性相关关系;②回归直线就是散点图中经过样本数据点最多的那条直线;③回归分析和独立性检验没有什么区别;④回归直线一定经过样本中心点.其中正确的命题个数为( )A. B. C. D.【答案】B【解析】散点图可以直观地判断两个变量是否具有线性相关关系,故①正确;回归直线可以不经过散点图中的任何一个点,故②错误;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,独立性检验是对两个变量是否具有某种关系的分析,故③错误;回归直线一定经过样本中心点,故④正确.所以正确的命题个数为个. 故选:B.4.(2024天津 )中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间和茶水温度的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是.则拟合效果最好的模型是(    )A.模型① B.模型② C.模型③ D.模型④【答案】B【解析】对于回归模型,残差平方和越小,回归模型的拟合效果越好,故拟合效果最好的模型是模型②.故选:B.5.(2024河北 )集校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:由表格制作成如图所示的散点图:  由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是(    )A.B.C.D.【答案】A【解析】身高的平均数为,因为离群点的横坐标167小于平均值176,纵坐标90相对过大,所以去掉后经验回归直线的截距变小而斜率变大,故去掉后相关性更强,拟合效果也更好,且还是正相关,,故选:A.6.(2023高二下·全国·课时练习)经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:由样本中样本数据求得回归直线方程为,则点与直线的位置关系是(    )A. B.C. D.与的大小无法确定【答案】B【解析】由题意,,,因为落在回归直线方程上,所以,故.故选:B.7.(2024天津 )有人调查了某高校14名男大学生的身高及其父亲的身高,得到如下数据表:利用最小二乘法计算的儿子身高关于父亲身高的回归直线为.根据以上信息进行的如下推断中,正确的是(   )A.当时,,若一位父亲身高为,则他儿子长大成人后的身高一定是B.父亲身高和儿子身高是正相关,因此身高更高的父亲,其儿子的身高也更高C.从回归直线中,无法判断父亲身高和儿子身高是正相关还是负相关D.回归直线的斜率可以解释为父亲身高每增加,其儿子身高平均增加【答案】D【解析】对A选项:为估计值,并不一定,故错误;对B选项:同上,该值为估计值,并不绝对,故错误;对C选项:由,故可判断父亲身高和儿子身高是正相关,故错误;都D选项:回归直线的斜率可以解释为父亲身高每增加,其儿子身高平均增加,故正确.故选:D.8.(2024四川绵阳 )有一散点图如图所示,在5个数据中去掉后,给出下列说法:①相关系数r变大;②相关指数变大;③残差平方和变小;④变量x与变量y的相关性变强.其中正确说法的个数为(   )A.1个 B.2个 C.3个 D.4个【答案】D【解析】根据题意,散点图有5个数据中去掉,可得与的相关性越强,并且是正相关,所以相关系数变大,相关指数变大,残差的平方和变小,所以四个命题都正确.故选:D.多选题9.(2024·湖南邵阳)下列命题中,说法正确的有(    )A.设随机变量,则B.成对样本数据的线性相关程度越强,样本相关系数越接近于1C.决定系数越大,表示残差平方和越小,即模型的拟合效果越好D.基于小概率值的检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立【答案】CD【解析】对于A项,根据二项分布的方差公式可得,.故A错误;对于B项,样本相关系数越接近于1,线性相关性越强.故B错误;对于C项,决定系数,残差平方和为,根据决定系数公式可得,越大,表示残差平方和越小,即模型的拟合效果越好.故C正确;对于D项,根据独立性检验思想可知,D正确.故选:CD.10.(2023山西·期末)下列说法正确的是(    )A.设随机变量的均值为,是不等于的常数,则相对于的偏离程度小于相对于的偏离程度(偏离程度用差的平方表示)B.若一组数据,,…,的方差为0,则所有数据都相同C.用决定系数比较两个回归模型的拟合效果时,越大,残差平方和越小,模型拟合效果越好D.在对两个分类变量进行独立性检验时,如果列联表中所有数据都扩大为原来的10倍,在相同的检验标准下,再去判断两变量的关联性时,结论不会发生改变【答案】ABC【解析】对于A,由均值的性质可知,由于是不等于的常数,故可得,即相对于的偏离程度小于相对于的偏离程度,A正确;对于B,根据方差公式,可知若一组数据,,…,的方差为0,则,B正确;对于C,由决定系数的定义可知,C正确,对于D,的值变为原来的10倍,在相同的检验标准下,再去判断两变量的关联性时,结论可能发生改变,D错误,故选:ABC11.(2023江苏常州 )已知由样本数据组成的一个样本,根据最小二乘法求得线性回归方程为且,去除两个异常数据和后,得到新的线性回归直线的斜率为3,则下列结论中正确的是(    )A.相关变量,具有正相关关系B.去除异常数据后,新的平均数C.去除异常数据后的线性回归方程为D.去除异常数据后,随值增加,的值增加速度变大【答案】AD【解析】A选项,因为回归方程的斜率为正,所以相关变量,具有正相关关系,所以A正确;B选项,因为,所以去除两个异常数据和后,得到新的,故B错;且,得,因为得到的新的经验回归直线的斜率为3,所以,去除异常数据后的线性回归方程为,故C错;因为经验回归直线的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由2增大到3,故值增加的速度变大,故D对;故选:AD12.(2023浙江宁波 )某电商平台为了对某一产品进行合理定价,采用不同的单价在平台试销,得到的数据如下表所示:根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程为,则(     )A.相关系数 B.点一定在经验回归直线上C. D.时,对应销量的残差为【答案】BC【解析】由表中数据可得,所以样本中心为,故在经验回归直线上,B正确,由可得与具负相关,故A错误,将代入可得,解得,C正确,当时,,所以残差为,D错误,故选:BC填空题13.(2024江西·开学考试)商家为了解某品牌取暖器的月销售量Y(台)与月平均气温之间的关系,随机统计了某4个月该品牌取暖器的月销售量与当月平均气温,其数据如下表;由表中数据算出线性回归方程中的,当平均气温为时,此品牌取暖器的月销售量为 台(结果保留整数).【答案】90【解析】由题意可得,,可知点在回归方程上,其中,即,解得,所以,当时,.故答案为:90.14.(2024·山西吕梁 )某市2018年至2022年新能源汽车年销量(单位:百台)与年份代号的数据如下表:若根据表中的数据用最小二乘法求得关于的回归直线方程为,据此计算相应于样本点的残差为 .【答案】/【解析】依题意,,,代入回归直线,解得所以回归直线为当时,,因此残差为,故答案为:15.(2024江苏·课时练习)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得线性回归方程为,则该模型的非线性回归方程为 .【答案】【解析】由回归直线方程,得:,整理得:,所以该模型的回归方程为.故答案为: .16(2023江苏·单元测试)为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:根据列联表数据,求得χ2= (保留3位有效数字),根据下表,有 的把握认为患慢性气管炎与吸烟有关.附:χ2=.【答案】 22.2 99.9%【解析】由20+m=40,得m=20.由20+n=25,得n=5. 故χ2=≈22.2>10.828.所以有99.9%的把握认为患慢性气管炎与吸烟有关.故答案为:22.2;99.9%解答题17.(2023·全国·模拟预测)新冠病毒奥密克戎毒株开始流行后,为了控制新冠肺炎疫情,杭州某高中开展了每周核酸检测工作.周一至周五,每天中午13:30开始,安排位师生进行核酸检测,教职工每天都要检测,用五天时间实现全员覆盖.(1)该校教职工有人,高二学生有人,高三学生有人.①用分层抽样的方法,求高一学生每天的检测人数.②高一年级共个班,该年级每天进行核酸检测的学生有两种安排方案.方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理?给出理由.(2)学校开展核酸检测的第一周,周一至周五核酸检测用时记录如下表.①计算变量和的相关系数(精确到),并说明两变量的线性相关程度;②根据①中的计算结果,判定变量和是正相关还是负相关,并给出可能的原因.参考数据和公式:,相关系数.【答案】(1)①;②方案二更合理,理由见解析(2)①,两变量线性相关性很强;②负相关,理由见解析【解析】(1)①高一学生每天的检测人数为人,②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强,潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作;(2)①,,,,,故,,两变量线性相关性很强,②由可知变量和负相关.可能的原因:随着核酸检测工作的开展,学校相关管理协调工作效率提高,因此用时缩短.18.(2024·贵州贵阳 )某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数忘了记录,但知道,(,分别表示小明、小红第天的成功次数).(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;(2)根据小明这7天内前6天的成功次数,求其成功次数关于序号的线性回归方程,并估计小明第七天成功次数的值.参考公式:回归方程中斜率与截距的最小二乘估计公式分别为:,.参考数据:;.【答案】(1)(2),【解析】(1)因为,且,所以的取值共有种情况,、分别表示小明、小红第i天成功次数,又当小明成功的总次数不少于小红成功的总次数时,在,即,得,又,所以,且,所以小明成功的总次数不少于小红成功的总次数时,的取值共有情况,所以这7天内小明成功的总次数不少于小红成功的总次数的概率为;(2)由题设可知,,,所以,,所以关于序号的线性回旧方程为.当时,,估计小明第7天成功次数的值为.19.(2023山东菏泽·期末)2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件“了解亚运会项目”,“学生为女生”,据统计,.(1)根据已知条件,填写列联表,并依据的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.附:,.【答案】(1)列联表见解析,不能(2)分布列见解析,【解析】(1)因为,,所以对杭州亚运会项目了解的女生为 了解亚运会项目的学生为, 结合男生和女生各50名,填写列联表为:零假设:该校学生对杭州亚运会项目的了解情况与性别无关,根据列联表中的数据,依据的独立性检验,可以推断成立,即该校学生对杭州亚运会项目的了解情况与性别无关.(2)由(1)知,采用分层随机抽样的方法随机抽取9名学生,其中男生人数为(人); 女生人数为(人),由题意可得,随机变量的所有可能取值为0,1,2,3. ,,,.随机变量X的分布列如下:则.20(2023·贵州贵阳 )为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断(a,b为常数)与(,为常数,且,)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)(2)对于非线性回归方程(,为常数,且,),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.①证明:“对于非线性回归方程,令,可以得到繁殖个数的对数z关于天数x具有线性关系(即,β,α为常数)”;②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).附:对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘估计分别为,.【答案】(1)作图见解析,选择为回归方程较适宜(2)① 证明见解析;②【解析】(1)作出散点图如图所示.由散点图看出样本点分布在一条指数型曲线的周围,故选择为回归方程较适宜;(2)①由已知,,则,则,,即.所以繁殖个数的对数z关于天数x具有线性关系.②由①知繁殖个数的对数z关于天数x可以用线性回归方程来拟合.由表中数据可得,,则z关于x的线性回归方程为.又,因此细菌的繁殖个数y关于天数x的非线性回归方程为.21.(2024·四川·模拟预测)甲、乙两医院到某医科大学实施“小小医生计划”,即通过对毕业生进行笔试,面试,模拟诊断这3项程序后直接签约一批毕业生.已知3项程序分别由3个部门独立依次考核,且互不影响,当3项程序全部通过即可签约.假设该校口腔医学系170名毕业生参加甲医院的“小小医生计划”的具体情况如下表(不存在通过3项程序考核后放弃签约的现象).该校口腔医学系的小华准备参加两医院的“小小医生计划”,小华通过甲医院的每项程序的概率均为,通过乙医院的每项程序的概率依次为,,,其中.(1)判断是否有的把握认为这170名毕业生参加甲医院的“小小医生计划”能否签约与性别有关;(2)若小华通过甲、乙两医院程序的项数分别记为X,Y.当时,求小华参加乙医院考核并能成功签约的概率.参考公式与临界值表:,.【答案】(1)有的把握认为这170名毕业生参加甲医院的“小小医生计划”能否签约与性别有关;(2)【解析】(1)因为,且,所以有的把握认为这170名毕业生参加甲医院的“小小医生计划”能否签约与性别有关;(2)因为小华通过甲医院各程序的结果相互不影响,所以,则,的可能取值为0,1,2,3.,,,, 随机变量Y的分布列:,因为,所以,即,小华参加乙医院考核并能成功签约的概率为.22(2024福建三明 )近几年,电商的蓬勃发展带动了快递行业的迅速增长.为了获得更大的利润,某快递公司在城市的网点对“一天中收发一件块递的平均成本(单位:元)与当天揽收的快递件数(单位:千件)之间的关系”进行调查研究,得到相关数据如下表:根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个经验回归方程:方程甲:,方程乙:.(1)为了评价两种模型的拟合效果,完成以下问题:①根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数):( 备注:称为相应于点的随机误差)②分别计算模型甲与模型乙的随机误差平方和,并依此判断哪个模型的拟合效果更好.(2)已知该快递网点每天能揽收的快递件数(单位:千件)与揽收一件快递的平均价格(单位:元)之间的关系是,根据(1)中拟合效果较好的模型建立的回归方程解决以下问题:①若一天揽收快递6千件,则当天总利润的预报值是多少?②为使每天获得的总利润最高,该快递网点应该将揽收一件快递的平均价格定为多少?(备注:利润=价格-成本)【答案】(1)①表格见解析;②,,模型乙的拟合效果较好(2)①元;②6.75元【解析】(1)(1)①表中数据填写如下:②计算可得:,.因为,所以模型乙的拟合效果较好.(2)解法一:①设每天获得的总利润为,则当时,由回归方程得.由得,所以总利润的预报值(元).②由,则,所以当时,取得最大值,此时,所以当揽收平均价格定为6.75元时,该网点一天的总利润最大.解法二:①每天获得的总利润为,则当时,由回归方程得.由得,所以总利润的预报值(千元)②设揽收一件快递的平均价格为元,由,得揽收快递件数,所以,平均成本,所以每天获得的总利润为.当时,该快递网点每天获得的总利润最大,所以当揽收平均价格定为元时,该网点一天的总利润最大. 身体综合指标评分12345用时小时)9.58.87.876.1样本号12345678910总和零件的横截面积0.030.050.040.070.070.040.050.060.060.050.52耗材量0.240.400.230.550.500.340.350.450.430.413.9月份1 月2 月3 月4 月5 月月份编号x12345利润y(百万)7121319245689121620252836年份2018年2019年2020年2021年2022年年份编号x12345用电量y(单位:)3.242.942.602.222.00123456728323745475260年份201420152016201720182019202020212022全体居民人均可支配收入 (元)183522011022034241532638628920308243380335666X0123P对工作满意对工作不满意男女患该疾病不患该疾病总计男151025女52025总计2030500.0500.0100.001k3.8416.63510.828           年龄次数[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010α0.100.050.010.0050.0012.7063.8416.6357.87910.828青年中年合计体育锻炼频率低12595220体育锻炼频率高75105180合计2002004000120.100.050.0100.0050.001k2.7063.8416.6357.87910.828兴趣高兴趣不高总计主动预习不太主动预习总计兴趣高兴趣不高总计主动预习不太主动预习总计346722.54.57服务人员增量x/人234681013年收益增量y/万元13223142505658回归模型模型①模型②回归方程182.479.2身高(单位:167173175177178180181体重(单位:90545964677276x1516181922y10298115115120编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182单价x/元88.599.510销量y/万件8985807868平均气温()10741月销售量(台)26375582年份20182019202020212022年份代号01234年销量1015203035患慢性气管炎未患慢性气管炎合计吸烟20m40不吸烟n5560合计2575100P(χ2≥x0)0.0500.0100.001x03.8416.63510.828第天用时第一天第二天第三天第四天第五天第六天第七天序号1234567小明成功次数162020253036小红成功次数162225263235350.0500.0100.0013.8416.63510.828了解不了解合计男生153550女生302050合计4555100X0123P天数x123456繁殖个数y6122549951903.5062.833.5317.50596.5712.09性别参加考核但未能签约的人数参加考核并能签约的人数合计男生582785女生424385合计100701700.1000.0500.0250.0102.7063.8415.0246.635Y0123P每天揽收快递件数(千件)23458每件快递的平均成本(元)5.64.84.44.34.1每天揽收快递件数xi/千件23458每件快递的平均成本yi/元5.64.84.44.34.1模型甲预报值5.254.8随机误差-0.40.20.4模型乙预报值5.54.84.5随机误差-0.100.1每天揽收快递件数千件23458每件快递的平均成本元5.64.84.44.34.1模型甲预报值5.25.04.84.64.0随机误差-0.40.20.40.3-0.1模型乙预报值5.54.84.54.34.0随机误差-0.100.10-0.1
    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        人教版高中数学选择性必修三 精讲精练第八章 成对数据的统计分析 章末小结及测试(2份,原卷版+解析版)
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map