还剩15页未读,
继续阅读
第八章成对数据的统计分析章节练习卷1-2023-2024学年高二数学-(人教A版2019选择性必修三)
展开
这是一份第八章成对数据的统计分析章节练习卷1-2023-2024学年高二数学-(人教A版2019选择性必修三),共18页。
第八章� 成对数据的统计分析章节练习卷1-2023-2024学年高二数学-(人教A版2019选择性必修三)注意事项:1.答题前填写好自己的姓名、班级、考号等信息2.请将答案正确填写在答题卡上第I卷(选择题)请点击修改第I卷的文字说明一、单选题1.若变量y与x之间的样本相关系数,则变量y与x之间( ).A.具有很弱的线性相关关系 B.具有较强的线性相关关系C.它们的线性相关关系还需要进一确定 D.不确定2.已知x与y之间的一组数据:则y与x的线性回归方程为必过( )A.(1.5,4)点 B.(1.5,0)点C.(1,2)点 D.(2,2)点3.下列命题:①在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越好;②对两个变量和进行回归分析,若相关系数为 r=-0.9462则变量和之间具有线性相关关系;③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.5个单位;④对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越大. 其中不正确命题的个数是( )A.1个 B.2个 C.3个 D.4个4.已知变量x和y满足回归方程,变量y和z负相关.下列说法正确的是( )A.x和y负相关,x和z负相关 B.x和y正相关,x和z正相关C.x和y正相关,x和z负相关 D.x和y负相关,x和z正相关5.已知一组鞋码与身高的数据(x表示鞋码,y(cm)表示身高),其中m+n=360.若用此数据由最小二乘法计算得到回归直线,则实数( )A.82.5 B.83.5 C.84.5 D.85.56.根据如图所示的散点图得出的经验回归方程为,则( ) A.2.8 B.3.2 C.3.6 D.47.已知x、y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为,则a=( )A.1.25 B.1.05 C.1.35 D.1.458.下列关于回归分析的说法中错误的是( )A.线性回归方程对应的直线不一定经过其样本数据中的点B.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越高C.若回归方程为,则当时,的值必为58.79D.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和0.3二、多选题9.下列说法正确的是( )A.回归直线过样本点的中心B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位10.下列命题中正确的是( )A.在回归分析中,相关系数的绝对值越大,两个变量的线性相关性越强B.线性回归直线恒过样本中心C.在回归分析中,残差平方和越小,模型的拟合效果越好D.对分类变量与,它们的随机变量的观测值越小,说明“与有关系”的把握越大11.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:A.25 B.45 C.60 D.75三、填空题12.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关检验,并用回归分析方法分别求得相关系数r如下表:则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是 .13.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=≈4.844.则认为选修文科与性别有关系出错的可能性为 .14.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有 人.参考数据及公式如下:,.第II卷(非选择题)请点击修改第II卷的文字说明四、解答题15.某科研团队对例新冠肺炎确诊患者的临床特征进行了回顾性分析.其中名吸烟患者中,重症人数为人,重症比例约为;名非吸烟患者中,重症人数为人,重症比例为.(1)根据以上数据完成列联表;(2)根据(1)中列联表数据,能否在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关?附:16.2022年是中国共产主义青年团成立100周年,某校组织了团史知识测试,测试成绩分为优秀与非优秀两个等级.随机抽查了高一年级、高二年级各100名学生的测试成绩,统计如下表:高一年级成绩高二年级成绩(1)根据给出的数据,完成下面的列联表:(2)根据(1)中列联表,判断能否有的把握认为男、女生测试成绩的等级有差异?附,其中.17.年支付宝“集五福”活动从月日开始,持续到月日.用户打开支付宝最新版,通过扫描“福”字集福卡(爱国福、富强福、和谐福、友善福和敬业福).在除夕夜前集齐“五福”的用户将获得一个现金红包.为调查居民参与“集五福”活动的情况,现对某一社区的居民进行抽样调查,并按年龄(单位:岁)分成,,,,五组,得到如图所示的频率分布直方图,其中年龄在内的人数为.(1)假设未参与的视为未集齐“五福”者,请根据样本数据补充完整上述列联表,并判断是否有的把握认为是否集齐“五福”与性别相关.(2)为了解该社区居民明年是否愿意继续参与此活动,现从样本中年龄在和内的人中,采用分层抽样的方法抽取人,再从中随机抽取人进行调查,求抽取到的人中恰好有人的年龄在内的概率.参考公式:,其中.参考数据:18.佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:(1)请利用所给数据求不戴头盔人数与年度序号之间的回归直线方程,并估算该路口2022年不戴头盔的人数;(2)交警统计2018~2021年通过该路口的开电瓶车出事故的50人,分析不戴头盔行为与事故是否伤亡的关系,得到下表,能否有95%的把握认为不戴头盔行为与事故伤亡有关?参考公式:其中19.小家电指除大功率,大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,运用场景广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元),其中年份对应的代码依次为1~5.(1)由上表数据可知,可用线性回归模型拟合与的关系,请用样本相关系数加以说明(若,则线性相关程度较高,精确到0.01);(2)建立关于的经验回归方程.参考公式和数据:样本相关系数,,,,,.x0123y1357x4041424344y172175mn183x2345y2.5344.50.0500.0103.8416.635甲乙丙丁r0.820.780.690.85理科文科男1310女7200.0500.0100.0013.8416.63510.828吸烟人数非吸烟人数总计重症人数轻症人数总计≥优秀非优秀女生人数3614男生人数3218优秀非优秀女生人数446男生人数3812优秀非优秀合计女生男生合计集齐“五福”卡没有集齐“五福”卡合计男女合计年度2018201920202021年度序号1234不戴头盔人数125010501000900不戴头盔戴头盔伤亡73不伤亡1327年份代码12345市场规模(单位:千亿元)1.301.401.621.681.80参考答案:1.B【分析】相关系数的绝对值越接近于1,越具有强大相关性,相关系数,相关系数的绝对值约接近1,得到结论.【详解】变量y与x之间的样本相关系数,,接近1,样本相关系数的绝对值越大,相关性越强,∴变量y与x之间有较强的线性相关关系,故选:B.2.A【分析】根据回归直线过样本中心求解.【详解】因为,所以y与x的线性回归方程为必过点,故选:A3.C【分析】根据相关指数的性质可判断①,根据相关系数的性质可判断②,根据回归方程的性质可判断③,根据随机变量的观测值的关系可判断④.【详解】解:对于①,在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越差,故①错误;对于②,对两个变量和进行回归分析,若相关系数为r=-0.9462,即,则变量和之间具有线性相关关系,故②正确;对于③,在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位,故③错误;对于④,对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越小,故④错误.故选:C.4.D【分析】由变量间的正、负相关定义求解.【详解】由知x和y负相关,又y和z负相关,所以x和z正相关.故选:D5.B【解析】利用平均数公式求出样本中心坐标,代入回归直线方程,即可求出的值.【详解】由题意可知:,,,将,代入回归直线可得,故选:B.【点睛】本题考查平均数公式的应用以及回归直线方程的求法,考查转化思想以及计算能力,属于基础题.6.B【分析】计算的值,根据样本中心点在回归直线上,代入计算,可得答案.【详解】由散点图可得,故,故选:B7.B【分析】由样本中心在回归直线上求参数,根据已知表中数据计算出,再将点的坐标代入回归直线方程,即可求出对应的a值.【详解】,,故样本中心为(3.5,3.5),所以,可得a=1.05.故选:B8.C【分析】对A,回归直线不一定过样本数据中的点;对B,残差图中,残差分布的带状区域的宽度越窄,说明模型的拟合精度越高;对C,当时,的预测值为58.79;对D,两边取以e为底的对数即可求解.【详解】解:选项A,线性回归方程对应的直线过样本中心点,不一定过样本数据中的点,故A正确:选项B,残差图中,残差分布的带状区域的宽度越窄,说明模型的拟合精度越高,故B正确;选项C,若回归方程为,则当时,的预测值为58.79,故C错误;选项D,,则,所以,,故D正确.故选:C.9.ABD【分析】根据线性相关的定义和性质可判断.【详解】根据相关定义分析知A,B,D正确;对分类变量X与Y,随机变量的观测值k越大,则判断“X与Y有关系”的把握程度越大,故C错误.故选:ABD.10.ABC【分析】根据相关系数的概念判断A,根据回归直线方程的性质判断B,根据相关指数的概念判断C,根据独立性检验的思想判断D.【详解】对于A:在回归分析中,对于相关系数,越接近,线性相关性越强,即相关系数的绝对值越大,两个变量的线性相关性越强,故A正确;对于B:线性回归直线必过样本中心,故B正确;对于C:在回归分析中,残差平方和越小,模型的拟合效果越好,故C正确;对于D:对分类变量与,它们的随机变量的观测值越小,说明“与有关系”的把握越小,故D错误;故选:ABC11.BC【分析】设男生的人数为,列出列联表,计算出的观测值,结合题中条件可得出关于的不等式,解出的取值范围,即可得出男生人数的可能值.【详解】解:设男生的人数为,根据题意列出列联表如下表所示:则,由于有的把握认为是否喜欢抖音和性别有关,则,即,得,,则的可能取值有、、、,因此,调查人数中男生人数的可能值为、50、55或.故选:BC.12.丁同学【分析】根据相关系数的绝对值越接近于1,相关性越强即得.【详解】由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强.故答案为:丁同学.13.5%【分析】根据观测值k≈4.844以及独立性检验的基本思想即可得出结果.【详解】K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.故答案为:5%14.30【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.【详解】设男生人数为,依题意可得列联表如下:若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则,由,解得,由题知应为6的整数倍,若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则男生至少有30人,故答案为:30.15.(1)列联表见解析(2)能在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关【分析】(1)根据题目所给数据填写列联表.(2)计算的值,由此作出判断.【详解】(1)由题得:(2),所以能在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关.16.(1)列联表见解析(2)没有的把握认为男、女生测试成绩的等级有差异【分析】(1)根据高一二的表格人数,逐项相加分析即可;(2)求出卡方再对比表格判断即可【详解】(1)由表格可知,高一年级、高二年级总共优秀女生人数为,优秀男生人数为,非优秀女生人数为,非优秀男生人数为,故(2)由(1)可得,故没有的把握认为男、女生测试成绩的等级有差异17.(1)表见解析,有的把握认为是否集齐“五福”与性别相关(2)【分析】(1)由题意可知参与“集五福”活动的人数为,然后完善列联表,算出即可;(2)利用列举法求解即可.【详解】(1)由题意可知参与“集五福”活动的人数为.列联表补充如下:因为,所以有的把握认为是否集齐“五福”与性别相关.(2)由频率分布直方图可知,年龄在内的人数是,年龄在内的人数是.从中随机抽取名,年龄在内的人数是,记为;年龄在内的人数是,记为,,.从这人中随机抽取人的情况有,,,,,,共种;其中符合条件的情况有,,,共种.故所求概率.18.(1),775(2)能有95%的把握认为不戴头盔行为与事故伤亡有关,理由见解析.【分析】(1)先求出与,代入公式后求出,,得到回归直线方程;(2)代入公式求出,与比较,显然有95%的把握认为不戴头盔行为与事故伤亡有关.【详解】(1),,,,回归直线方程为时,(2),故有95%的把握认为不戴头盔行为与事故伤亡有关,19.(1)答案见解析(2)【分析】(1)由题中数据求出样本相关系数,可得答案;(2)由题中数据求出,,可得关于的经验回归方程.【详解】(1)由表知的平均数为,所以,,因为与的相关系数近似为0.98,说明与的线性相关程度较高,从而可用线性回归模型拟合与的关系.(2),,,,所以,所以关于的经验回归方程为.男生女生合计喜欢抖音不喜欢抖音合计喜欢追星不喜欢追星总计男生女生总计吸烟人数非吸烟人数总计重症人数30120150轻症人数100800900总计1309201050优秀非优秀合计女生8020100男生7030100合计15050200集齐“五福”卡没有集齐“五福”卡合计男女合计
第八章� 成对数据的统计分析章节练习卷1-2023-2024学年高二数学-(人教A版2019选择性必修三)注意事项:1.答题前填写好自己的姓名、班级、考号等信息2.请将答案正确填写在答题卡上第I卷(选择题)请点击修改第I卷的文字说明一、单选题1.若变量y与x之间的样本相关系数,则变量y与x之间( ).A.具有很弱的线性相关关系 B.具有较强的线性相关关系C.它们的线性相关关系还需要进一确定 D.不确定2.已知x与y之间的一组数据:则y与x的线性回归方程为必过( )A.(1.5,4)点 B.(1.5,0)点C.(1,2)点 D.(2,2)点3.下列命题:①在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越好;②对两个变量和进行回归分析,若相关系数为 r=-0.9462则变量和之间具有线性相关关系;③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.5个单位;④对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越大. 其中不正确命题的个数是( )A.1个 B.2个 C.3个 D.4个4.已知变量x和y满足回归方程,变量y和z负相关.下列说法正确的是( )A.x和y负相关,x和z负相关 B.x和y正相关,x和z正相关C.x和y正相关,x和z负相关 D.x和y负相关,x和z正相关5.已知一组鞋码与身高的数据(x表示鞋码,y(cm)表示身高),其中m+n=360.若用此数据由最小二乘法计算得到回归直线,则实数( )A.82.5 B.83.5 C.84.5 D.85.56.根据如图所示的散点图得出的经验回归方程为,则( ) A.2.8 B.3.2 C.3.6 D.47.已知x、y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为,则a=( )A.1.25 B.1.05 C.1.35 D.1.458.下列关于回归分析的说法中错误的是( )A.线性回归方程对应的直线不一定经过其样本数据中的点B.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越高C.若回归方程为,则当时,的值必为58.79D.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和0.3二、多选题9.下列说法正确的是( )A.回归直线过样本点的中心B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位10.下列命题中正确的是( )A.在回归分析中,相关系数的绝对值越大,两个变量的线性相关性越强B.线性回归直线恒过样本中心C.在回归分析中,残差平方和越小,模型的拟合效果越好D.对分类变量与,它们的随机变量的观测值越小,说明“与有关系”的把握越大11.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:A.25 B.45 C.60 D.75三、填空题12.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关检验,并用回归分析方法分别求得相关系数r如下表:则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是 .13.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=≈4.844.则认为选修文科与性别有关系出错的可能性为 .14.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有 人.参考数据及公式如下:,.第II卷(非选择题)请点击修改第II卷的文字说明四、解答题15.某科研团队对例新冠肺炎确诊患者的临床特征进行了回顾性分析.其中名吸烟患者中,重症人数为人,重症比例约为;名非吸烟患者中,重症人数为人,重症比例为.(1)根据以上数据完成列联表;(2)根据(1)中列联表数据,能否在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关?附:16.2022年是中国共产主义青年团成立100周年,某校组织了团史知识测试,测试成绩分为优秀与非优秀两个等级.随机抽查了高一年级、高二年级各100名学生的测试成绩,统计如下表:高一年级成绩高二年级成绩(1)根据给出的数据,完成下面的列联表:(2)根据(1)中列联表,判断能否有的把握认为男、女生测试成绩的等级有差异?附,其中.17.年支付宝“集五福”活动从月日开始,持续到月日.用户打开支付宝最新版,通过扫描“福”字集福卡(爱国福、富强福、和谐福、友善福和敬业福).在除夕夜前集齐“五福”的用户将获得一个现金红包.为调查居民参与“集五福”活动的情况,现对某一社区的居民进行抽样调查,并按年龄(单位:岁)分成,,,,五组,得到如图所示的频率分布直方图,其中年龄在内的人数为.(1)假设未参与的视为未集齐“五福”者,请根据样本数据补充完整上述列联表,并判断是否有的把握认为是否集齐“五福”与性别相关.(2)为了解该社区居民明年是否愿意继续参与此活动,现从样本中年龄在和内的人中,采用分层抽样的方法抽取人,再从中随机抽取人进行调查,求抽取到的人中恰好有人的年龄在内的概率.参考公式:,其中.参考数据:18.佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:(1)请利用所给数据求不戴头盔人数与年度序号之间的回归直线方程,并估算该路口2022年不戴头盔的人数;(2)交警统计2018~2021年通过该路口的开电瓶车出事故的50人,分析不戴头盔行为与事故是否伤亡的关系,得到下表,能否有95%的把握认为不戴头盔行为与事故伤亡有关?参考公式:其中19.小家电指除大功率,大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,运用场景广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元),其中年份对应的代码依次为1~5.(1)由上表数据可知,可用线性回归模型拟合与的关系,请用样本相关系数加以说明(若,则线性相关程度较高,精确到0.01);(2)建立关于的经验回归方程.参考公式和数据:样本相关系数,,,,,.x0123y1357x4041424344y172175mn183x2345y2.5344.50.0500.0103.8416.635甲乙丙丁r0.820.780.690.85理科文科男1310女7200.0500.0100.0013.8416.63510.828吸烟人数非吸烟人数总计重症人数轻症人数总计≥优秀非优秀女生人数3614男生人数3218优秀非优秀女生人数446男生人数3812优秀非优秀合计女生男生合计集齐“五福”卡没有集齐“五福”卡合计男女合计年度2018201920202021年度序号1234不戴头盔人数125010501000900不戴头盔戴头盔伤亡73不伤亡1327年份代码12345市场规模(单位:千亿元)1.301.401.621.681.80参考答案:1.B【分析】相关系数的绝对值越接近于1,越具有强大相关性,相关系数,相关系数的绝对值约接近1,得到结论.【详解】变量y与x之间的样本相关系数,,接近1,样本相关系数的绝对值越大,相关性越强,∴变量y与x之间有较强的线性相关关系,故选:B.2.A【分析】根据回归直线过样本中心求解.【详解】因为,所以y与x的线性回归方程为必过点,故选:A3.C【分析】根据相关指数的性质可判断①,根据相关系数的性质可判断②,根据回归方程的性质可判断③,根据随机变量的观测值的关系可判断④.【详解】解:对于①,在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越差,故①错误;对于②,对两个变量和进行回归分析,若相关系数为r=-0.9462,即,则变量和之间具有线性相关关系,故②正确;对于③,在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位,故③错误;对于④,对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越小,故④错误.故选:C.4.D【分析】由变量间的正、负相关定义求解.【详解】由知x和y负相关,又y和z负相关,所以x和z正相关.故选:D5.B【解析】利用平均数公式求出样本中心坐标,代入回归直线方程,即可求出的值.【详解】由题意可知:,,,将,代入回归直线可得,故选:B.【点睛】本题考查平均数公式的应用以及回归直线方程的求法,考查转化思想以及计算能力,属于基础题.6.B【分析】计算的值,根据样本中心点在回归直线上,代入计算,可得答案.【详解】由散点图可得,故,故选:B7.B【分析】由样本中心在回归直线上求参数,根据已知表中数据计算出,再将点的坐标代入回归直线方程,即可求出对应的a值.【详解】,,故样本中心为(3.5,3.5),所以,可得a=1.05.故选:B8.C【分析】对A,回归直线不一定过样本数据中的点;对B,残差图中,残差分布的带状区域的宽度越窄,说明模型的拟合精度越高;对C,当时,的预测值为58.79;对D,两边取以e为底的对数即可求解.【详解】解:选项A,线性回归方程对应的直线过样本中心点,不一定过样本数据中的点,故A正确:选项B,残差图中,残差分布的带状区域的宽度越窄,说明模型的拟合精度越高,故B正确;选项C,若回归方程为,则当时,的预测值为58.79,故C错误;选项D,,则,所以,,故D正确.故选:C.9.ABD【分析】根据线性相关的定义和性质可判断.【详解】根据相关定义分析知A,B,D正确;对分类变量X与Y,随机变量的观测值k越大,则判断“X与Y有关系”的把握程度越大,故C错误.故选:ABD.10.ABC【分析】根据相关系数的概念判断A,根据回归直线方程的性质判断B,根据相关指数的概念判断C,根据独立性检验的思想判断D.【详解】对于A:在回归分析中,对于相关系数,越接近,线性相关性越强,即相关系数的绝对值越大,两个变量的线性相关性越强,故A正确;对于B:线性回归直线必过样本中心,故B正确;对于C:在回归分析中,残差平方和越小,模型的拟合效果越好,故C正确;对于D:对分类变量与,它们的随机变量的观测值越小,说明“与有关系”的把握越小,故D错误;故选:ABC11.BC【分析】设男生的人数为,列出列联表,计算出的观测值,结合题中条件可得出关于的不等式,解出的取值范围,即可得出男生人数的可能值.【详解】解:设男生的人数为,根据题意列出列联表如下表所示:则,由于有的把握认为是否喜欢抖音和性别有关,则,即,得,,则的可能取值有、、、,因此,调查人数中男生人数的可能值为、50、55或.故选:BC.12.丁同学【分析】根据相关系数的绝对值越接近于1,相关性越强即得.【详解】由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强.故答案为:丁同学.13.5%【分析】根据观测值k≈4.844以及独立性检验的基本思想即可得出结果.【详解】K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.故答案为:5%14.30【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.【详解】设男生人数为,依题意可得列联表如下:若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则,由,解得,由题知应为6的整数倍,若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则男生至少有30人,故答案为:30.15.(1)列联表见解析(2)能在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关【分析】(1)根据题目所给数据填写列联表.(2)计算的值,由此作出判断.【详解】(1)由题得:(2),所以能在犯错误的概率不超过的前提下认为新冠肺炎重症与吸烟有关.16.(1)列联表见解析(2)没有的把握认为男、女生测试成绩的等级有差异【分析】(1)根据高一二的表格人数,逐项相加分析即可;(2)求出卡方再对比表格判断即可【详解】(1)由表格可知,高一年级、高二年级总共优秀女生人数为,优秀男生人数为,非优秀女生人数为,非优秀男生人数为,故(2)由(1)可得,故没有的把握认为男、女生测试成绩的等级有差异17.(1)表见解析,有的把握认为是否集齐“五福”与性别相关(2)【分析】(1)由题意可知参与“集五福”活动的人数为,然后完善列联表,算出即可;(2)利用列举法求解即可.【详解】(1)由题意可知参与“集五福”活动的人数为.列联表补充如下:因为,所以有的把握认为是否集齐“五福”与性别相关.(2)由频率分布直方图可知,年龄在内的人数是,年龄在内的人数是.从中随机抽取名,年龄在内的人数是,记为;年龄在内的人数是,记为,,.从这人中随机抽取人的情况有,,,,,,共种;其中符合条件的情况有,,,共种.故所求概率.18.(1),775(2)能有95%的把握认为不戴头盔行为与事故伤亡有关,理由见解析.【分析】(1)先求出与,代入公式后求出,,得到回归直线方程;(2)代入公式求出,与比较,显然有95%的把握认为不戴头盔行为与事故伤亡有关.【详解】(1),,,,回归直线方程为时,(2),故有95%的把握认为不戴头盔行为与事故伤亡有关,19.(1)答案见解析(2)【分析】(1)由题中数据求出样本相关系数,可得答案;(2)由题中数据求出,,可得关于的经验回归方程.【详解】(1)由表知的平均数为,所以,,因为与的相关系数近似为0.98,说明与的线性相关程度较高,从而可用线性回归模型拟合与的关系.(2),,,,所以,所以关于的经验回归方程为.男生女生合计喜欢抖音不喜欢抖音合计喜欢追星不喜欢追星总计男生女生总计吸烟人数非吸烟人数总计重症人数30120150轻症人数100800900总计1309201050优秀非优秀合计女生8020100男生7030100合计15050200集齐“五福”卡没有集齐“五福”卡合计男女合计
相关资料
更多