所属成套资源:高二数学同步精品讲义(人教A版选择性必修第三册)
第04讲 第八章 成对数据的统计分析(章末检测)-高二数学同步精品讲义(人教A版选择性必修第三册)
展开
这是一份第04讲 第八章 成对数据的统计分析(章末检测)-高二数学同步精品讲义(人教A版选择性必修第三册),文件包含第4讲章末检测-原卷版-高二数学同步精品讲义人教A版选择性必修第三册docx、第4讲章末检测-解析版-高二数学同步精品讲义人教A版选择性必修第三册docx等2份试卷配套教学资源,其中试卷共36页, 欢迎下载使用。
2021-2022学年高二数学(下)第八章成对数据的统计分析(选择性必修三)检测(时间120分钟,满分150分)参考公式:1. 相关系数: 对于变量和变量,设经过随机抽样获得的成对样本数据为,其中和的均值分别为和,则.2. 线性回归方程对于变量和变量,设经过随机抽样获得的成对样本数据为,其中和的均值分别为和,其中.3.相关指数:.4.列联表与χ22×2列联表一对分类变量X和Y,我们整理数据如表所示:,其中n=a+b+c+d.5. 下表给出了产独立性检验中几个常用的小概车值和相应的临界值选择题(1-8每小题5分,共计40分)1. 某公司年的年利润(单位:百万元)与年广告支出(单位:百万元)的统计资料如表所示:根据统计资料,则利润中位数( )A.是16,与有正线性相关关系B.是17,与有正线性相关关系C.是17,与有负线性相关关系D.是18,与有负线性相关关系【答案】B【解析】【分析】根据数据分析可直接得出结论.【详解】由题意,利润中位数是,而且随着利润的增加,支出也在增加,故与有正线性相关关系.故选:B.2. 对四组数据进行统计,获得以下散点图(如图),将四组数据相应的相关系数进行比较,正确的有( )A. B.C. D.【答案】A【解析】【分析】根据给定散点图先判断正相关、负相关,再根据点的集中程度分析相关系数大小作答.【详解】依题意,图1和图3是正相关,相关系数、大于0,图2和图4是负相关,相关系数、小于0,图1和图2中的点相对于图3和图4更加集中,则有相关性要更强些,相关系数的绝对值要大一些,所以.故选:A3. 两个变量与的回归模型中,分别选择了四个不同的模型来拟合与之间的关系,它们的相关系数如下,其中拟合效果最好的模型是( )A.模型1 B.模型2 C.模型3 D.模型4【答案】A【解析】根据相关系数越接近于1,模型的拟合效果越好,结合表格中的数据,即可求解.【详解】两个变量与的回归模型中,它们的相关系数越接近于1,这个模型的拟合效果越好,在所给的四个相关系数中0.98的绝对值最接近1,所以拟合效果最好的模型是模型1.故选:A.4. 为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图(如图),根据图中的信息,下列结论中不正确的是( )A.样本中的男生数量多于女生数量B.样本中喜欢手机支付的数量多于现金支付的数量C.样本中多数男生喜欢现金支付D.样本中多数女生喜欢手机支付【答案】C【解析】【分析】根据两幅图的信息,逐个分析判断即可【详解】解:对于A,由左图可知,样本中的男生数量多于女生数量,所以A正确;对于B,由右图可知,样本中喜欢手机支付的数量多于现金支付的数量,所以B正确;对于C,由右图可知,样本中多数男生喜欢手机支付,所以C错误;对于D,由右图可知,样本中多数女生喜欢手机支付,所以D正确,故选:C5.假设有两个变量x与y的2×2列联表如下表:对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )A. B.C. D.【答案】B【解析】【分析】当与的差距越大,两个变量有关的可能性越大,检验四个选项中所给的与的差距即可得答案【详解】解:根据观测值求解公式可知,当与的差距越大,两个变量有关的可能性越大,对于A,,对于B,,对于C,,对于D,,显然B的与的差距最大,故选:B6. 某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得经验回归方程为.若在这些样本点中任取一点,则它恰好在经验回归直线上的概率为( )A. B. C. D.【答案】B【解析】【分析】求出中心点坐标,得出,然后求回归直线方程在直线上方的点的个数后可得概率.【详解】,,∵,∴,∴经验回归方程为.(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)中只有点(4,90)在经验回归直线上,所以所求概率.故选:B.7. 在成绩统计中,我们把某个同学的某科考试成绩与该科班级平均分的差叫某科偏差.班主任为了了解学生的偏科情况,从全班40位同学中随机抽取一个容量为8的样本,对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,得到他们的两科成绩偏差数据如下:根据表格中的数据,得出y关于x的回归直线方程为,这次考试该班数学平均分为120分,物理平均分为92分,则可以预测数学成绩为126分的同学的物理成绩为( )A.122.5分 B.120分C.96分 D.94分【答案】D【解析】【分析】根据物理偏差与数学偏差满足回归直线方程即可得到结果.【详解】设该同学的物理成绩为W,则物理偏差为,而数学偏差为,又y关于x的回归直线方程为,则有,解得,故可以预测这位同学的物理成绩为94分.故选:D.8. 2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有的男生喜欢网络课程,有的女生不喜欢网络课程,且有的把握但没有的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:,其中.参考数据:A.130 B.190C.240 D.250【答案】B【解析】设男、女生的人数都为,列出列联表,计算的值,查表解不等式即可.【详解】依题意,设男、女生的人数各为,建立列联表如下所示:故,由题可知,∴,只有B符合题意.故选:B.【点睛】本题主要考查独立性检验,关键点是建立列联表代入公式计算,考查数学运算、数学建模的核心素养.多项选择题(9-12每小题5分,共计20分)9. 下面的散点图与相关系数一定不符合的是( )A. B.C. D.【答案】ACD【解析】【分析】结合散点图与相关系数的关系,逐项分析即可求出结果.【详解】对于A,C,各点散布在从左上角到右下角的区域里,所以相关系数,A,C均不符合;对于B,各点散布在从左下角到右上角的区域里,所以相关系数,B符合;对于D,各点散布在从左下角到右上角的带状区域里,所以相关系数,D不符合.故选:ACD.10. 某地建立了农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:根据上表,可得y关于x的线性回归方程为,则( )A.B.估计近5年借阅量以0.24万册/年的速度增长C.y与x的样本相关系数D.2021年的借阅量一定不少于6.12万册【答案】ABC【解析】【分析】根据回归方程过样本中心点得,可判断A;由的意义可判断BC;根据的意义可判断D.【详解】,,代入,可得,所以A正确;因为,所以估计每年借阅量的增长量为0.24万册,所以B正确;因为,所以y与x正相关,,所以C正确;把代入得,而6.12万册是预测值,不是精确值,所以D错误.故选:ABC.11. 为了调查,两种药物预防某种疾病的效果,某研究所进行了动物试验.已知参与两种药物试验的动物的品种,状态,数量均相同,图1是药物试验结果对应的等高堆积条形图,图2是药物试验结果对应的等高堆积条形图,则( )A.服用药物的动物的患病比例低于未服用药物的动物的患病比例B.服用药物对预防该疾病没有效果C.在对药物的试验中,患病动物的数量约占参与药物试验动物总数量的60%D.药物比药物预防该种疾病的效果好【答案】AD【解析】【分析】根据两个等高堆积条形图,逐个分析选项即可判断出结论.【详解】根据题中两组等高堆积条形图,可知服用药物的动物的患病比例低于未服用药物的动物的患病比例,所以正确;服用药物未患病的动物的频率明显大于未服用药物的,所以可以认为服用药物对预防该疾病有一定效果,所以B不正确;在对药物的试验中,患病动物的数量占参与药物试验动物总数量的比例为,所以C不正确;药物试验结果对应的等高堆积条形图显示未服用药与服用药动物的患病数量的差异较药物试验的大,所以药物比药物预防该种疾病的效果好,所以D正确.故选:AD.12. 为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的2×2列联表(个别数据暂用字母表示):计算得,对于下面的选项,正确的为( )A.B.C.根据小概率值的独立性检验,可以认为“阅读量多少与幸福感强弱无关”D.根据小概率值的独立性检验,可以在犯错误的概率不超过0.005的前提下认为“阅读量多少与幸福感强弱有关”【答案】AD【解析】【详解】∵,,∴,,∴A正确,B错误;∵,,,∴,,∴根据小概率值的独立性检验,可以在犯错误的概率不超过0.01的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值的独立性检验,可以在犯错误的概率不超过0.005的前提下认为“阅读量多少与幸福感强弱有关”,∴C错误,D正确.故选:AD.填空题(13-16每小题5分,共计20分)13. 某市居民年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有______相关关系.(填“正”或“负”)【答案】 正【解析】【分析】根据中位数定义和表格数据可直接得到结果;根据表格数据可得散点图,观察散点图即可得到结果.【详解】根据表中数据知:居民家庭年平均收入的中位数是万元.以家庭年平均收入作为横轴,年平均支出作为纵轴,得到如图所示的散点图.观察散点图,这些点大致分布在一条直线的附近,因此家庭年平均收入与年平均支出有较强的线性相关关系,且各点分布从左下角到右上角的区域,两变量为正相关.故答案为:;正.14. 如下是一个2×2列联表,则______.【答案】62【解析】【分析】利用2×2列联表求解.【详解】根据2×2列联表可知,解得,则,又由,解得,则,故.故答案为:6215. 某设备的使用年限x与所支出的维修费用y呈线性相关,部分统计数据如下表:根据上表可得y关于x的回归直线方程为,则_____,据此模型预测,若使用年限为16年,估计维修费用为__________万元.【答案】 -1 23【解析】求出和,代入方程可得,然后令代入计算可得预测值.【详解】由已知,,所以,解得,时,.故答案为:;23.16. 某高校《统计》课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到==4.844>3.841,所以有_____的把握判定主修统计专业与性别有关系. 附:【答案】95%【解析】【分析】根据独立性检验的基本思想,因为的观测值=4.844>3.841,参考临界值表即可得出【详解】根据表格数据得的观测值=≈4.844,所以有95%的把握判定主修统计专业与性别有关系.故答案为:95%.解答题(17-22共计70分)17.(本题10分) 某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2020级的1000名学生进行调查,收集到相关数据如下:根据以上提供的信息,完成2×2列联表,并完善等高条形图.【答案】答案见解析.【解析】【分析】根据列联表所给的数据和等高条形图即可完成列联表,进而完善等高条形图即可.【详解】根据题意填写列联表如下:等高条形图,如图所示:18. (本题10分)下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?【答案】存在正相关,相关性较强.【解析】【分析】由表中数据计算相关系数即可得出结果.【详解】设鸟的种类数为,海拔高度为,,,,当时,且时,两变量正相关,相关性较强. 所以由数据可知,鸟类的种数随海拔高度增加而增加,两者呈正相关,相关性较强.19. (本题12分)在某化学反应的中间阶段,压力保持不变,温度x(单位:)与反应结果y之间的关系如下表所示:(1)求化学反应的结果y对温度x的经验回归方程;(2)判断变量x与y之间是正相关还是负相关,并预测当温度达到8时反应结果为多少.参考数据:,.【答案】(1);(2)正相关,17.7【分析】(1)根据最小二乘法公式直接计算可得;(2)由的值可判断相关关系,直接代值可得预测值.【解析】(1)由题意,得,,∴,,∴,,∴所求的经验回归方程为.(2)∵,∴x与y之间是正相关.当时,,∴当温度达到时反应结果大约为17.7.20. (本题12分)在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)依据的独立性检验,能否认为休闲方式与性别有关?【答案】(1)表格见解析(2)认为休闲方式与性别有关【分析】(1)根据调查124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,完成列联表;(2)根据列联表中的数据,求得的值,再与临界值表对照下结论 .【解析】(1)2×2列联表如下:(2)零假设为H0:休闲方式与性别无关.,依据小概率值的独立性检验,我们推断H0不成立,即认为休闲方式与性别有关.21. (本题12分)某出版社单册图书的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:其中.(1)根据以上数据画出散点图(可借助统计软件),并根据散点图判断:与中哪一个适宜作为回归方程模型?(2)根据(1)的判断结果,试建立成本费y关于印刷册数x的回归方程.(3)利用回归方程估计印刷26000册图书的单册成本(结果保留两位小数).【答案】(1)散点图见解析,更适宜作为回归方程模型;(2);(3)印刷26000册图书的单册成本为1.81元.【分析】(1)画出散点图,由图可知;(2)利用最小二乘法可得回归方程;(3)把代入回归方程即得.【解析】(1)散点图如图,根据散点图判断,更适宜作为回归方程模型;(2)令,可设回归直线为,则,∴所求的回归方程为;(3)当时,由回归方程,可得,(元)故印刷26000册图书的单册成本为1.81元.22. (本题14分)某校高三年级进行了一次全年级的大型考试,在数学成绩优秀和非优秀的学生中,物理、化学、总分也优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【答案】有99.9%的把握认为数学优秀与物理、化学、总分优秀都有关系,但是与总分优秀关系最大,与化学优秀关系最小.【解析】【分析】分别列出数学与物理、数学与化学、数学与总分的列联表,利用独立性检验的公式,分别求得的值,进而得到结论.【详解】(1)数学与物理优秀与否的列联表如下:由表中的数据代入公式得:.(2)数学与化学优秀与否的列联表如下:由表中的数据代入公式得:.(3)数学与总分优秀与否的列联表如下:由表中的数据代入公式得:由于,因此有99.9%的把握认为数学优秀与物理、化学、总分优秀都有关系,但是与总分优秀关系最大,与化学优秀关系最小.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d0.10.050.010.0050.0012.7063.8416.6357.87910.828年份200620072008200920102011利润12.214.6161820.422.3支出0.620.740.810.8911.11模型12340.980.800.500.25abcd单价x/元456789销量y/件908483807568学生序号12345678数学偏差x20151332-5-10-18物理偏差y6.53.53.51.50.5-0.5-2.5-3.50.150.100.050.0250.0100.0052.0722.7063.8415.0246.6357.879喜欢网络课程不喜欢网络课程总计男生女生总计年份20162017201820192020年份代码x12345年借阅量y/万册4.95.15.55.75.8单位:人阅读量幸福感合计幸福感强幸福感弱阅读量多m1872阅读量少36n78合计9060150年份年平均收入年平均支出xy合计x1a3545x27bn合计m73s使用年限x(单位:年)2.53455.5维修费用y(单位:万元)245.56.57 专业性别 非统计专业统计专业男1310女720选物理不选物理总计数学成绩优秀数学成绩不优秀260总计6001000选物理不选物理总计数学成绩优秀420320740数学成绩不优秀18080260总计6004001000地区ABCDEFGHIJK海拔/m1250115810674577017316106701493762549鸟的种类/种363037111113171329415x12345y3571011单位:人性别休闲方式合计看电视运动女性432770男性213354合计6460124x123571011202530y9.025.274.063.032.592.282.211.891.801.7511.43.390.249934.40.825-139.036.196物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699物理优秀物理非优秀合计数学优秀228132360数学非优秀143737880合计3718691240化学优秀化学非优秀合计数学优秀225135360数学非优秀156724880合计3818591240总分优秀总分非优秀合计数学优秀26793360数学非优秀99781880合计3668741240