资料中包含下列文件,点击文件名可预览资料内容
还剩7页未读,
继续阅读
成套系列资料,整套一键下载
苏教版数学高二选择性必修第二册 第9章 统计 单元综合检测
展开
这是一份苏教版数学高二选择性必修第二册 第9章 统计 单元综合检测,文件包含苏教版数学高二选择性必修第二册第9章统计单元综合检测原卷版docx、苏教版数学高二选择性必修第二册第9章统计单元综合检测解析版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。
第9章 统计 单元综合检测一、单选题1.下列有关回归分析的说法中不正确的是( )A.回归直线必过点B.回归直线就是散点图中经过样本数据点最多的那条直线C.当相关系数时,两个变量正相关D.如果两个变量的线性相关性越弱,则就越接近于【答案】B【分析】根据线性回归直线的性质可判断选项AB;根据相关系数的性质可判断CD,进而可得正确选项.【解析】对于A选项,回归直线必过点,A对;对于B选项,线性回归直线在散点图中可能不经过任一样本数据点,B错;对于C选项,当相关系数时,两个变量正相关,C对;对于D选项,如果两个变量的线性相关性越弱,则就越接近于,D对.故选:B.2.某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )A.相关系数r变小 B.决定系数变小C.残差平方和变大 D.解释变量x与预报变量y的相关性变强【答案】D【分析】从图中分析得到去掉后,回归效果更好,再由相关系数,决定系数,残差平方和和相关性的概念和性质作出判断即可.【解析】从图中可以看出较其他点,偏离直线远,故去掉后,回归效果更好,对于A,相关系数越接近于1,模型的拟合效果越好,若去掉后,相关系数r变大,故A错误;对于B,决定系数越接近于1,模型的拟合效果越好,若去掉后,决定系数变大,故B错误;对于C,残差平方和越小,模型的拟合效果越好,若去掉后,残差平方和变小,故C错误;对于D,若去掉后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.故选:D.3.下列图形中具有相关关系的是( )A. B.C. D.【答案】C【分析】根据图形的特点结合相关关系的概念判断即可.【解析】根据图象可得选项AB中的图形为连续曲线,变量间的关系是确定的,不是相关关系;选项C中散点分布在一条直线附近,可得其线性相关;选项D中散点分布在一个长方形区域,即其不具有相关关系.故选:C4.营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:则这组数据模型的回归方程的最好选择应是( )A. B.C. D.【答案】B【分析】根据相关指数的性质,相关指数的值越大,模型的拟合效果越好,即可得出答案.【解析】相关指数的值越大,说明模型的拟合效果越好,观察可知,指数曲线的最大,故回归方程的最好选择应是,故选:B.5.若由一个列联表中的数据计算得,则( )A.能有的把握认为这两个变量有关系B.能有的把握认为这两个变量没有关系C.能有的把握认为这两个变量有关系D.能有的把握认为这两个变量没有关系【答案】A【分析】通过所给的观测值,同临界值表中的数据进行比较,得到结论.【解析】因为,所以能有的把握认为这两个变量有关系.故选:A6.党的二十大报告提出全面推进乡村振兴.为振兴乡村经济,某市一知名电商平台决定为乡村的特色产品开设直播带货专场.该特色产品的热卖黄金时段为2023年2月1至4月1日,为了解直播的效果和关注度,该电商平台统计了已直播的2023年2月1日至2月5日时段的相关数据,这5天的第天到该电商平台专营店购物人数(单位:万人)的数据如下表:依据表中的统计数据,该电商平台直播黄金时间的天数与到该电商平台专营店购物的人数(单位:万人)具有较强的线性相关关系,经计算得,到该电商平台专营店购物人数与直播天数的线性回归方程为.请预测从2023年2月1日起的第38天到该专营店购物的人数(单位:万人)为( )A.312 B.313 C.314 D.315【答案】C【分析】根据回归直线过样本中心,建立方程,可得参数,即可得答案.【解析】由题意,,,将代入,可得,解得,线性回归直线方程为,将代入上式,.故选:C.7.已知变量y与x之间具有线性相关关系,根据变量x与y的相关数据,计算得则y关于x的线性回归方程为( )附:回归方程中的斜率和截距的最小二乘法估计公式分别为A. B.C. D.【答案】B【分析】根据已知数据求,代入回归直线方程即可求解.【解析】由题中的数据可知,所以.所以.所以y关于x的线性回归方程为.故选:B.8.为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:注:独立性检验中,.常用的小概率值和相应的临界值如下表:根据这些数据,给出下列四个结论:①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④【答案】B【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.【解析】由表可知,女生有21人,其中经常锻炼的有7人,频率为,男生有19人,其中经常锻炼的有11人,频率为,因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故①正确,②错误;,所以根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故④正确,③错误.故选:B.二、多选题9.下列说法正确的是( )A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位【答案】ABD【分析】A选项,可以利用散点图直观判断两个变量是否具有线性相关关系;B选项,可以从残差图中发现可疑数据,用残差平方和判断模型拟合效果;C选项,拟合效果的好坏不能用样本相关系数来进行判断;D选项,根据经验回归方程,得到当解释变量每增加1个单位时,相应变量增加0.1个单位.【解析】对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以A正确;对于B,残差图可以发现原始数据中的可疑数据;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,所以B选项正确;对于C,样本相关系数的绝对值越大,只能说明两个变量的线性相关性越强,不能作为分析模型的拟合效果好坏的依据,应该是越大,模型的拟合效果越好,所以C错误;对于D,在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位,所以D正确.故选:ABD.10.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )A.变量x与y具有正相关关系 B.去除后的回归方程为C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05【答案】AB【解析】A. 根据回归直线方程的x系数的正负判断.B. 根据去除前后样本点不变判断.C. 根据去除前后x的系数大小判断.D.根据残差的计算公式判断.【解析】因为回归直线方程为,,所以变量x与y具有正相关关系.故A正确.当时,,样本点为,去掉两个数据点和后,样本点还是,又因为去除后重新求得的回归直线l的斜率为1.2,所以,解得,所以去除后的回归方程为,故B正确.因为,所以去除后y的估计值增加速度变慢,故C错误.因为,所以,故D错误.故选:AB【点睛】本题主要考查回归分析的理解,还考查了理解辨析的能力,属于基础题.11.晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中衡水某高中有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )附:,A.衡水某高中的前50名学生中有60%的学生学习效率高B.另一所同类高中的前50名学生中有40%的学生学习效率高C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05【答案】AC【分析】先根据题意求出每一所学校中前50名学生中学习效率高的人数,再列出列联表,通过计算就可以对选项作出判断.【解析】设这100名学生中学习效率高的人数有人,由题意有,得.所以某高中的50名学生中有30人学习效率高,另一所同类高中的50名学生中有10人学习效率高,所以某高中的前50名学生中有的学生学习效率高,故选项A正确,另一所同类高中的前50名学生中有学习效率高,故选项B不正确.根据以上数据得到所下的列联表:,所以选项C正确,选项D不正确.故选:AC.12.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归直线方程为,以下结论正确的是( )A.15名志愿者身高的极差小于臂展的极差B.15名志愿者的身高和臂展具有正相关关系C.可估计身高为190厘米的人臂展大约为189.65厘米D.身高相差10厘米的两人臂展都相差11.6厘米【答案】ABC【分析】根据折线图数据判断,由回归直线方程、散点图判断BCD.【解析】对于,身高极差大约为21,臂展极差大约为26,故结论正确;对于B,很明显根据散点图以及回归直线得到,身高矮一些,臂展就会短一些,身高高一些,臂展就长些,故结论正确;对于C,身高为190厘米,代入回归直线方程可得到臂展估计值等于189.65厘米,但不是准确值,故结论正确;对于D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归直线上的点并不都是准确的样本点,故结论不正确.故选:ABC.三、填空题13.下表是关于男婴与女婴出生时间调查的列联表:那么,A=_____,B=_____,C=_____,D=_____,E=_____.【答案】 47 92 88 82 53【分析】由题意,根据独立性检验的的列联表,列出关于的方程组,即可求解.【解析】由题意,根据独立性检验的的列联表,可得,解得.【点睛】本题主要考查了独立性检验的应用,其中解答中熟记独立性检验中的列联表,列出相应的方程组是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.【答案】1【分析】根据线性回归方程过样本点中心求解出的值即可.【解析】因为,,所以,所以,故答案为:.15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.【答案】68度【分析】先求样本数据的中心点,代入回归直线方程可得,然后代入可求.【解析】回归直线过(,),根据题意得,,将(10,40)代入,解得=60,,当x=-4时,,即当气温为-4℃时用电量约为68度.【点睛】本题主要考查 回归直线方程的求解,根据回归直线一定经过样本数据的中心点可求参数,然后根据方程可求预测值,侧重考查数据分析和数学运算的核心素养.16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:单位:人在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.附表:【答案】0.1##【分析】计算卡方,进行独立性检验.【解析】由题中列联表中的数据,得,因为,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系.故答案为:四、解答题17.以下是在某地搜集到的房屋的销售价格y和房屋的面积x的一组数据:(1)画出数据对应的散点图;(2)求经验回归方程;(3)根据(2)的结果估算当房屋面积为150时的销售价格.参考数据:,.【答案】(1)图见解析(2)(3)(万元)【分析】(1)根据题目所给数据画出散点图.(2)根据回归直线方程计算公式,计算出回归直线方程.(3)利用回归直线方程进行预测.(1)数据对应的散点图如图所示:(2), ,所求经验回归方程为.(3)所求销售价格的估计值为(万元).18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:(1)画出散点图,观察散点图,说明两个变量是否线性相关;(2)用最小二乘法计算利润额y对销售额x的线性回归方程;(3)当销售额为4千万元时,估计利润额的大小.(参考公式:,)【答案】(1)图见解析,变量线性相关;(2);(3)2.4百万元【解析】(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断;(2)根据公式分别求出,即可求出;(3)由(2)中求出的回归方程,将代入,即可估计利润额的大小.【解析】解:(1)散点图如图所示.由散点图可以看出变量线性相关.(2)设线性回归方程是.因为,所以,,即利润额y对销售额x的线性回归方程为.(3)当销售额为4千万元时,利润额约为(百万元).【点睛】本题主要考查利用散点图判断两个变量是否存在相关关系,利用最小二乘法求线性回归方程,以及利用回归方程进行预测,属于基础题.19.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.(1)根据已知条件与等高条形图完成下面的列联表:单位:名(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.附:,其中.【答案】(1)答案见解析;(2)认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.【分析】(1)根据等高条形图分别求出男、女同学需要帮助和不需要帮助的分数,可得出列联表.(2)先由公式求出的值,再对照表格中给出的值可得答案.【解析】(1)由题意知有20名男同学,则有30名女同学.由题中等高条形图可知男同学需要帮助的有4人,不需要帮助的有16人.女同学需要帮助的有3人,不需要帮助的有27人.则列联表为单位:名(2)假设:该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.经计算得,依据的独立性检验,没有充分证据推断不成立,因此证明成立,即认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.20.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔、使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.【答案】(1);(2)答案见解析;(3)最有可能正确的结果为,回归方程为.【分析】(1)由散点图数出佩戴率大于50%的城市有10个,计算结果;(2)由较强的负相关关系分析;(3)最有可能正确的结果为.由给定公式可得,代入数据计算求出,,,代入可求出,从而求出回归方程.【解析】解:(1)电动自行车头盔佩戴率大于50%的城市有10个,故所求的概率为.(2)由散点图可知与有较强的负相关关系,提高电动自行车头盔佩戴率能有效降低驾乘人员交通事故死亡率,所以佩戴安全头盔十分有必要.(3)最有可能正确的结果为.根据参考数据得,,所以,,所以关于的线性回归方程为.【点睛】知识点点睛:(1)一般情况下,相关系数时,两个变量不具备相关关系,当时,两个变量具备较强的相关关系;(2)线性回归方程必过点.21.年月国务院印发《全民健身计划》,《计划》中提出了各方面的主要任务,包括加大全民健身场地设施供给、广泛开展全民健身赛事活动、提升科学健身指导服务水平、激发体育社会组织活动、促进重点人群健身活动开展和营造全民健身社会氛围等.在各种健身的方式中,瑜伽逐渐成为一种新型的热门健身运动.某瑜伽馆在月份随机采访了名市民,对于是否愿意把瑜伽作为主要的健身方式作了调查.(1)能否在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关?附:(2)为了推广全民健身,某市文化馆计划联合该瑜伽馆举办“瑜你一起”的公益活动,在全市范围内开设一期公益瑜伽课,先从上述参与调查的人中选择“愿意”的人按分层抽样抽出人,再从人中随机抽取人免费参加.市文化馆拨给瑜伽馆一定的经费补贴,补贴方案为:男性每人元,女性每人元.求补贴金额的分布列及数学期望(四舍五入精确到元)【答案】(1)能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关(2)的分布列为期望为1385(元)【分析】(1)根据公式计算出,和比较大小,得到结论;(2)通过分层抽样算出抽出的男性和女性人数,写出的可能取值,计算出相应的概率,写出分布列,计算出期望.(1)由已知得.所以能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关.(2)调查的人中选择“愿意”的人按分层抽样抽出人,其中男性人数为,女性人数为.记补贴金额为,则可能为,,.,,,则的分布列为数学期望(元).22.随着全球经济一体化进程的不断加快,机械零件的加工质量决定了制造工厂的生存,零件加工精度逐渐成为供应商判断制造公司产品的标准.已知某公司生产不同规格的一种产品,根据检测精度的标准,其合格产品的质量y()与尺寸x()之间近似满足关系式(b,c为大于0的常数).现随机从中抽取6件合格产品,测得数据如下:根据测得数据作出如下处理:令,得相关统计量的值如下表:(1)根据所给统计数据,求y关于x的回归方程;(2)若从一批该产品中抽取n件进行检测,已知检测结果的误差满足,求至少需要抽取多少件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545?附:①对于样本,i)(i=1,2,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:,,.②,则【答案】(1)(2)800【分析】(1)按照公式求出与,写出回归方程;(2)根据正态分布及所给数据得出不等关系,解出答案.(1),,所以,即,整理为:,所以y关于x的回归方程为(2)因为,,所以,要想使误差在(-0.1,0.1)的概率不少于0.9545,则满足,解得:,即至少需要抽取800件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545.拟合曲线直线指数曲线抛物线三次曲线与的回归方程相关指数0.8930.9860.9310.3120.250.150.100.050.0250.0100.0050.0011.3232.0722.7063.8415.0246.6357.87910.828日期2月1日2月2日2月3日2月4日2月5日第x天12345人数y(单位:万人)75849398100性别锻炼情况合计不经常经常女生/人14721男生/人81119合计/人2218400.10.050.010.0050.0012.7063.8416.6357.87910.8280.0500.0100.0050.0013.8416.6357.87910.828学校晚上休息时间学习效率高人数学习效率不高人数总计某高中302050另一所同类高中104050总计4060100晚上白天总计男婴45AB女婴E35C总计98D180气温(℃)181310-1用电量(度)24343864读书健身合计女243155男82634合计3257890.10.050.010.0050.0012.7063.8416.6357.87910.828房屋面积x/11511080135105销售价格y/万元24.821.618.429.222商店名称ABCDE销售额x/千万元35679利润额y/百万元23345男同学女同学总计需要帮助不需要帮助总计0.0500.0100.0013.8416.63510.828男同学女同学总计需要帮助437不需要帮助162743总计203050愿意不愿意合计男性女性合计尺寸x(〕384858687888质量y(〕16.818.820.722.42425.575.324.618.3101.4
第9章 统计 单元综合检测一、单选题1.下列有关回归分析的说法中不正确的是( )A.回归直线必过点B.回归直线就是散点图中经过样本数据点最多的那条直线C.当相关系数时,两个变量正相关D.如果两个变量的线性相关性越弱,则就越接近于【答案】B【分析】根据线性回归直线的性质可判断选项AB;根据相关系数的性质可判断CD,进而可得正确选项.【解析】对于A选项,回归直线必过点,A对;对于B选项,线性回归直线在散点图中可能不经过任一样本数据点,B错;对于C选项,当相关系数时,两个变量正相关,C对;对于D选项,如果两个变量的线性相关性越弱,则就越接近于,D对.故选:B.2.某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )A.相关系数r变小 B.决定系数变小C.残差平方和变大 D.解释变量x与预报变量y的相关性变强【答案】D【分析】从图中分析得到去掉后,回归效果更好,再由相关系数,决定系数,残差平方和和相关性的概念和性质作出判断即可.【解析】从图中可以看出较其他点,偏离直线远,故去掉后,回归效果更好,对于A,相关系数越接近于1,模型的拟合效果越好,若去掉后,相关系数r变大,故A错误;对于B,决定系数越接近于1,模型的拟合效果越好,若去掉后,决定系数变大,故B错误;对于C,残差平方和越小,模型的拟合效果越好,若去掉后,残差平方和变小,故C错误;对于D,若去掉后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.故选:D.3.下列图形中具有相关关系的是( )A. B.C. D.【答案】C【分析】根据图形的特点结合相关关系的概念判断即可.【解析】根据图象可得选项AB中的图形为连续曲线,变量间的关系是确定的,不是相关关系;选项C中散点分布在一条直线附近,可得其线性相关;选项D中散点分布在一个长方形区域,即其不具有相关关系.故选:C4.营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:则这组数据模型的回归方程的最好选择应是( )A. B.C. D.【答案】B【分析】根据相关指数的性质,相关指数的值越大,模型的拟合效果越好,即可得出答案.【解析】相关指数的值越大,说明模型的拟合效果越好,观察可知,指数曲线的最大,故回归方程的最好选择应是,故选:B.5.若由一个列联表中的数据计算得,则( )A.能有的把握认为这两个变量有关系B.能有的把握认为这两个变量没有关系C.能有的把握认为这两个变量有关系D.能有的把握认为这两个变量没有关系【答案】A【分析】通过所给的观测值,同临界值表中的数据进行比较,得到结论.【解析】因为,所以能有的把握认为这两个变量有关系.故选:A6.党的二十大报告提出全面推进乡村振兴.为振兴乡村经济,某市一知名电商平台决定为乡村的特色产品开设直播带货专场.该特色产品的热卖黄金时段为2023年2月1至4月1日,为了解直播的效果和关注度,该电商平台统计了已直播的2023年2月1日至2月5日时段的相关数据,这5天的第天到该电商平台专营店购物人数(单位:万人)的数据如下表:依据表中的统计数据,该电商平台直播黄金时间的天数与到该电商平台专营店购物的人数(单位:万人)具有较强的线性相关关系,经计算得,到该电商平台专营店购物人数与直播天数的线性回归方程为.请预测从2023年2月1日起的第38天到该专营店购物的人数(单位:万人)为( )A.312 B.313 C.314 D.315【答案】C【分析】根据回归直线过样本中心,建立方程,可得参数,即可得答案.【解析】由题意,,,将代入,可得,解得,线性回归直线方程为,将代入上式,.故选:C.7.已知变量y与x之间具有线性相关关系,根据变量x与y的相关数据,计算得则y关于x的线性回归方程为( )附:回归方程中的斜率和截距的最小二乘法估计公式分别为A. B.C. D.【答案】B【分析】根据已知数据求,代入回归直线方程即可求解.【解析】由题中的数据可知,所以.所以.所以y关于x的线性回归方程为.故选:B.8.为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:注:独立性检验中,.常用的小概率值和相应的临界值如下表:根据这些数据,给出下列四个结论:①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④【答案】B【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.【解析】由表可知,女生有21人,其中经常锻炼的有7人,频率为,男生有19人,其中经常锻炼的有11人,频率为,因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故①正确,②错误;,所以根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故④正确,③错误.故选:B.二、多选题9.下列说法正确的是( )A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好D.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位【答案】ABD【分析】A选项,可以利用散点图直观判断两个变量是否具有线性相关关系;B选项,可以从残差图中发现可疑数据,用残差平方和判断模型拟合效果;C选项,拟合效果的好坏不能用样本相关系数来进行判断;D选项,根据经验回归方程,得到当解释变量每增加1个单位时,相应变量增加0.1个单位.【解析】对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以A正确;对于B,残差图可以发现原始数据中的可疑数据;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,所以B选项正确;对于C,样本相关系数的绝对值越大,只能说明两个变量的线性相关性越强,不能作为分析模型的拟合效果好坏的依据,应该是越大,模型的拟合效果越好,所以C错误;对于D,在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.1个单位,所以D正确.故选:ABD.10.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )A.变量x与y具有正相关关系 B.去除后的回归方程为C.去除后y的估计值增加速度变快 D.去除后相应于样本点的残差为0.05【答案】AB【解析】A. 根据回归直线方程的x系数的正负判断.B. 根据去除前后样本点不变判断.C. 根据去除前后x的系数大小判断.D.根据残差的计算公式判断.【解析】因为回归直线方程为,,所以变量x与y具有正相关关系.故A正确.当时,,样本点为,去掉两个数据点和后,样本点还是,又因为去除后重新求得的回归直线l的斜率为1.2,所以,解得,所以去除后的回归方程为,故B正确.因为,所以去除后y的估计值增加速度变慢,故C错误.因为,所以,故D错误.故选:AB【点睛】本题主要考查回归分析的理解,还考查了理解辨析的能力,属于基础题.11.晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中衡水某高中有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )附:,A.衡水某高中的前50名学生中有60%的学生学习效率高B.另一所同类高中的前50名学生中有40%的学生学习效率高C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05【答案】AC【分析】先根据题意求出每一所学校中前50名学生中学习效率高的人数,再列出列联表,通过计算就可以对选项作出判断.【解析】设这100名学生中学习效率高的人数有人,由题意有,得.所以某高中的50名学生中有30人学习效率高,另一所同类高中的50名学生中有10人学习效率高,所以某高中的前50名学生中有的学生学习效率高,故选项A正确,另一所同类高中的前50名学生中有学习效率高,故选项B不正确.根据以上数据得到所下的列联表:,所以选项C正确,选项D不正确.故选:AC.12.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归直线方程为,以下结论正确的是( )A.15名志愿者身高的极差小于臂展的极差B.15名志愿者的身高和臂展具有正相关关系C.可估计身高为190厘米的人臂展大约为189.65厘米D.身高相差10厘米的两人臂展都相差11.6厘米【答案】ABC【分析】根据折线图数据判断,由回归直线方程、散点图判断BCD.【解析】对于,身高极差大约为21,臂展极差大约为26,故结论正确;对于B,很明显根据散点图以及回归直线得到,身高矮一些,臂展就会短一些,身高高一些,臂展就长些,故结论正确;对于C,身高为190厘米,代入回归直线方程可得到臂展估计值等于189.65厘米,但不是准确值,故结论正确;对于D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归直线上的点并不都是准确的样本点,故结论不正确.故选:ABC.三、填空题13.下表是关于男婴与女婴出生时间调查的列联表:那么,A=_____,B=_____,C=_____,D=_____,E=_____.【答案】 47 92 88 82 53【分析】由题意,根据独立性检验的的列联表,列出关于的方程组,即可求解.【解析】由题意,根据独立性检验的的列联表,可得,解得.【点睛】本题主要考查了独立性检验的应用,其中解答中熟记独立性检验中的列联表,列出相应的方程组是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.14.如图是一组数据的散点图,经最小二乘估计公式计算,与之间的线性回归方程为,则______.【答案】1【分析】根据线性回归方程过样本点中心求解出的值即可.【解析】因为,,所以,所以,故答案为:.15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:表中数据得回归直线方程中的=-2,预测当气温为-4℃时,用电量为________.【答案】68度【分析】先求样本数据的中心点,代入回归直线方程可得,然后代入可求.【解析】回归直线过(,),根据题意得,,将(10,40)代入,解得=60,,当x=-4时,,即当气温为-4℃时用电量约为68度.【点睛】本题主要考查 回归直线方程的求解,根据回归直线一定经过样本数据的中心点可求参数,然后根据方程可求预测值,侧重考查数据分析和数学运算的核心素养.16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身得到的数据如下表:单位:人在犯错误的概率不超过___________的前提下认为性别与休闲方式有关系.附表:【答案】0.1##【分析】计算卡方,进行独立性检验.【解析】由题中列联表中的数据,得,因为,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系.故答案为:四、解答题17.以下是在某地搜集到的房屋的销售价格y和房屋的面积x的一组数据:(1)画出数据对应的散点图;(2)求经验回归方程;(3)根据(2)的结果估算当房屋面积为150时的销售价格.参考数据:,.【答案】(1)图见解析(2)(3)(万元)【分析】(1)根据题目所给数据画出散点图.(2)根据回归直线方程计算公式,计算出回归直线方程.(3)利用回归直线方程进行预测.(1)数据对应的散点图如图所示:(2), ,所求经验回归方程为.(3)所求销售价格的估计值为(万元).18.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:(1)画出散点图,观察散点图,说明两个变量是否线性相关;(2)用最小二乘法计算利润额y对销售额x的线性回归方程;(3)当销售额为4千万元时,估计利润额的大小.(参考公式:,)【答案】(1)图见解析,变量线性相关;(2);(3)2.4百万元【解析】(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断;(2)根据公式分别求出,即可求出;(3)由(2)中求出的回归方程,将代入,即可估计利润额的大小.【解析】解:(1)散点图如图所示.由散点图可以看出变量线性相关.(2)设线性回归方程是.因为,所以,,即利润额y对销售额x的线性回归方程为.(3)当销售额为4千万元时,利润额约为(百万元).【点睛】本题主要考查利用散点图判断两个变量是否存在相关关系,利用最小二乘法求线性回归方程,以及利用回归方程进行预测,属于基础题.19.某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.(1)根据已知条件与等高条形图完成下面的列联表:单位:名(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.附:,其中.【答案】(1)答案见解析;(2)认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.【分析】(1)根据等高条形图分别求出男、女同学需要帮助和不需要帮助的分数,可得出列联表.(2)先由公式求出的值,再对照表格中给出的值可得答案.【解析】(1)由题意知有20名男同学,则有30名女同学.由题中等高条形图可知男同学需要帮助的有4人,不需要帮助的有16人.女同学需要帮助的有3人,不需要帮助的有27人.则列联表为单位:名(2)假设:该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.经计算得,依据的独立性检验,没有充分证据推断不成立,因此证明成立,即认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.20.从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔、使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.【答案】(1);(2)答案见解析;(3)最有可能正确的结果为,回归方程为.【分析】(1)由散点图数出佩戴率大于50%的城市有10个,计算结果;(2)由较强的负相关关系分析;(3)最有可能正确的结果为.由给定公式可得,代入数据计算求出,,,代入可求出,从而求出回归方程.【解析】解:(1)电动自行车头盔佩戴率大于50%的城市有10个,故所求的概率为.(2)由散点图可知与有较强的负相关关系,提高电动自行车头盔佩戴率能有效降低驾乘人员交通事故死亡率,所以佩戴安全头盔十分有必要.(3)最有可能正确的结果为.根据参考数据得,,所以,,所以关于的线性回归方程为.【点睛】知识点点睛:(1)一般情况下,相关系数时,两个变量不具备相关关系,当时,两个变量具备较强的相关关系;(2)线性回归方程必过点.21.年月国务院印发《全民健身计划》,《计划》中提出了各方面的主要任务,包括加大全民健身场地设施供给、广泛开展全民健身赛事活动、提升科学健身指导服务水平、激发体育社会组织活动、促进重点人群健身活动开展和营造全民健身社会氛围等.在各种健身的方式中,瑜伽逐渐成为一种新型的热门健身运动.某瑜伽馆在月份随机采访了名市民,对于是否愿意把瑜伽作为主要的健身方式作了调查.(1)能否在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关?附:(2)为了推广全民健身,某市文化馆计划联合该瑜伽馆举办“瑜你一起”的公益活动,在全市范围内开设一期公益瑜伽课,先从上述参与调查的人中选择“愿意”的人按分层抽样抽出人,再从人中随机抽取人免费参加.市文化馆拨给瑜伽馆一定的经费补贴,补贴方案为:男性每人元,女性每人元.求补贴金额的分布列及数学期望(四舍五入精确到元)【答案】(1)能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关(2)的分布列为期望为1385(元)【分析】(1)根据公式计算出,和比较大小,得到结论;(2)通过分层抽样算出抽出的男性和女性人数,写出的可能取值,计算出相应的概率,写出分布列,计算出期望.(1)由已知得.所以能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关.(2)调查的人中选择“愿意”的人按分层抽样抽出人,其中男性人数为,女性人数为.记补贴金额为,则可能为,,.,,,则的分布列为数学期望(元).22.随着全球经济一体化进程的不断加快,机械零件的加工质量决定了制造工厂的生存,零件加工精度逐渐成为供应商判断制造公司产品的标准.已知某公司生产不同规格的一种产品,根据检测精度的标准,其合格产品的质量y()与尺寸x()之间近似满足关系式(b,c为大于0的常数).现随机从中抽取6件合格产品,测得数据如下:根据测得数据作出如下处理:令,得相关统计量的值如下表:(1)根据所给统计数据,求y关于x的回归方程;(2)若从一批该产品中抽取n件进行检测,已知检测结果的误差满足,求至少需要抽取多少件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545?附:①对于样本,i)(i=1,2,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:,,.②,则【答案】(1)(2)800【分析】(1)按照公式求出与,写出回归方程;(2)根据正态分布及所给数据得出不等关系,解出答案.(1),,所以,即,整理为:,所以y关于x的回归方程为(2)因为,,所以,要想使误差在(-0.1,0.1)的概率不少于0.9545,则满足,解得:,即至少需要抽取800件该产品,才能使误差在(-0.1,0.1)的概率不少于0.9545.拟合曲线直线指数曲线抛物线三次曲线与的回归方程相关指数0.8930.9860.9310.3120.250.150.100.050.0250.0100.0050.0011.3232.0722.7063.8415.0246.6357.87910.828日期2月1日2月2日2月3日2月4日2月5日第x天12345人数y(单位:万人)75849398100性别锻炼情况合计不经常经常女生/人14721男生/人81119合计/人2218400.10.050.010.0050.0012.7063.8416.6357.87910.8280.0500.0100.0050.0013.8416.6357.87910.828学校晚上休息时间学习效率高人数学习效率不高人数总计某高中302050另一所同类高中104050总计4060100晚上白天总计男婴45AB女婴E35C总计98D180气温(℃)181310-1用电量(度)24343864读书健身合计女243155男82634合计3257890.10.050.010.0050.0012.7063.8416.6357.87910.828房屋面积x/11511080135105销售价格y/万元24.821.618.429.222商店名称ABCDE销售额x/千万元35679利润额y/百万元23345男同学女同学总计需要帮助不需要帮助总计0.0500.0100.0013.8416.63510.828男同学女同学总计需要帮助437不需要帮助162743总计203050愿意不愿意合计男性女性合计尺寸x(〕384858687888质量y(〕16.818.820.722.42425.575.324.618.3101.4
相关资料
更多