这是一份2024春高中数学章末综合测评3成对数据的统计分析练习及解析(人教A版选择性必修第三册),共14页。
章末综合测评(三) 成对数据的统计分析(时间:120分钟 满分:150分)一、选择题:本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1为变量X与Y之间的样本相关系数,r2为变量U与V之间的样本相关系数,则( )A.r2
a>4>b>1,a+b=6),则由该观测数据算得的经验回归方程可能是( )A.=0.4x+2.3 B.=2x-2.4C.=-2x+9.5 D.=-0.3x+0.444.有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮销售杯数与当天气温之间的线性关系,其经验回归方程为=-2.35x+155.47.如果某天气温为4 ℃时,那么该小卖部大约能卖出热饮的杯数是( )A.140 B.146 C.151 D.1645.随着国家三孩政策的全面放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.由χ2=得χ2=≈9.616.参照下表:下列结论正确的是( )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别有关”D.依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别无关”6.已知对某散点图作拟合曲线及其对应的决定系数R2,如下表所示:则这组数据模型的经验回归方程的最好选择应是( )A.=19.8x-463.7 B.=e0.27x-3.84C.=0.367x2-202 D.=7.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:cm),图1为选取的15名志愿者身高与臂展的折线图,图2为身高(x)与臂展(y)所对应的散点图,并求得其经验回归方程为=1.16x-30.75,则下列结论中不正确的为( )A.15名志愿者身高的极差小于臂展的极差B.15名志愿者身高和臂展成正相关关系C.可估计身高为190 cm的人臂展大约为189.65 cmD.身高相差10 cm的两人臂展都相差11.6 cm8.某初级中学在课后延时一小时开设相关课程,为了解学生选课情况,在该校全体学生中随机抽取50名学生进行问卷调查,得到数据如表所示.(附:计算得到χ2≈8.333)参考数据:根据以上数据,对该校学生情况判断不正确的是( )A.估计该校既喜欢体育又喜欢音乐的学生约占B.从这30名喜欢体育的学生中采用随机数表法抽取6人做访谈,则他们每个个体被抽到的概率为C.从不喜欢体育的20名学生中任选4人做访谈,则事件“至少有2人喜欢音乐”与“至多有1人不喜欢音乐”为对立事件D.在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系二、选择题:本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.对于样本相关系数r,下列说法不正确的是( )A.r越大,成对样本数据的线性相关程度越强B.r=0,成对样本数据没有任何相关关系C.r刻画了样本点集中于某条直线的程度D.成对样本数据相关的正负性与r的符号(正负)相同10.某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在25℃的室温下测量水温y(单位:℃)随时间x(单位:min)的变化关系,在测量了15个数据后,根据这些数据(xi,yi)(i=1,2,…,15)得到如下散点图:现需要选择合适的回归模型进行回归分析,则根据散点图,合适的回归模型有(注:c1,c2均为常数) ( )A.y=25-c1 B.y=25+C.y=25- D.y=c1(x-25)+c211.工作人员在某地区随机抽取了8对母女的身高数据,如表:下列说法正确的是( )A.8个成对样本数据呈正相关关系B.成对样本数据中变量x和变量y的样本相关系数r约为0.963C.用关于均值和为零点()平移后的成对样本数据(x1-y1-),(x2-y2-),…,(x8-y8-)与原始成对样本数据相关性一定不同D.用样本相关系数r可以估计总体两个变量的相关系数12.已知由成对样本数据(xi,yi),i=1,2,…,n求得的经验回归方程为=1.5x+0.5,且=3,现发现两个样本点(1.2,2.2)和(4.8,7.8)的残差较大,去除后重新求得的经验回归直线l的斜率为1.2,则去除后( )A.变量x与y具有正相关关系B.经验回归方程为=1.2x+1.4C.y的估计值的增加速度比原来变快D.样本点(2,3.75)的残差为0.05三、填空题:本大题共4小题,每小题5分,共20分.将答案填在题中的横线上.为y=0.3x+a,则≈________,a≈________.(精确到0.01)14.若两个分类变量X与Y的2×2列联表如下:则“X与Y之间有关系”这个结论出错的概率为________.15.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500名,女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人.则抽取的男生人数为________.16.某化工厂产生的废气经过过滤后排放,以模型y=ce-kt(其中e为自然对数的底数)去拟合过滤过程中废气的污染物浓度y mg/L与时间t h之间的一组数据,为求出线性回归方程,设z=ln y,经变换后得到线性回归方程为z=-t+3+ln 15,则当经过4 h后,预报废气的污染物浓度为____________mg/L.四、解答题:本大题共6小题,共70分.解答时应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)期中考试后,对某班60名学生的成绩优秀和不优秀与学生近视和不近视的情况做了调查,其中成绩优秀的36名学生中,有20人近视,另外24名成绩不优秀的学生中,有6人近视.(1)请列出列联表并画出等高堆积条形图,并判断成绩优秀与患近视是否有关系.(2)能否在犯错误的概率不超过0.05的前提下认为成绩优秀与患近视之间有关系?附:χ2=18.(本小题满分12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).附:相关系数r=≈1.377.19.(本小题满分12分)网购已成为当今消费者最喜欢的购物方式之一,某机构对A,B,C,D四家同类运动服装网店的关注人数x(单位:千人)与其商品销售件数y(单位:百件)进行统计对比,得到表格:由散点图得知,可以用经验回归方程=x+来近似刻画它们之间的关系.(1)试建立y关于x的经验回归方程;(2)在(1)的回归模型中,请用R2说明销售件数的差异有多大程度是由关注人数引起的.(精确到0.01)20.(本小题满分12分)某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下对应数据:(1)画出散点图并说明y与x是否具有线性相关关系?如果有,求出经验回归方程(方程的斜率保留一个有效数字);(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.21.(本小题满分12分)已知某校5名学生的数学成绩和物理成绩如下表:(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归方程;(3)利用残差分析经验回归方程的拟合效果,若残差和在(-0.1,0.1)范围内,则称经验回归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?参考数据和公式:,其中=,=22.(本小题满分12分)为研究某种图书每册的成本费y(元)与印刷册数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.(1)根据散点图判断:y=a+bx与y=c+哪一个更适宜作为每册成本费y(元)与印刷册数x(千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01).(3)若该图书每册书定价为10元,则至少应该印刷多少千册才使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v1)(ω2,v2),…,(ωn,vn),其经验回归方程=+ω的斜率和截距的最小二乘估计分别为章末综合测评(三)1.B [由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量X与Y正相关,因此r1>0;由变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),可得变量U与V负相关,因此r2<0.故r2<06.635=x0.01,所以依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别有关”,故选C.]6.B [∵R2越大,拟合效果越好,∴应选择=e0.27x-3.84.]7.D [对于A,身高极差大约为20,臂展极差大约为25,故A正确;对于B,很明显根据散点图以及经验回归直线得到,身高矮一些,臂展就可能短一些,身高高一些,臂展就可能长一些,故B正确;对于C,身高为190cm,代入经验回归方程可得到臂展的预测值为189.65cm,但是不是准确值,故C正确;对于D,身高相差10cm的两人臂展的预测值相差11.6cm,但并不是准确值,经验回归方程上的点并不都是准确的样本点,故D不正确.]8.C [对A选项,估计该校既喜欢体育又喜欢音乐的学生约占,A正确;对B选项,每个个体被抽到的概率为,B正确;对C选项,“至少有2人喜欢音乐”与“至多有1人喜欢音乐”为对立事件,C错误;对D选项,由χ2≈8.333>7.879,则在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系,D正确.故选C.]9.AB [样本相关系数r是用来衡量两个变量之间的线性相关程度的,r是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,所以A不正确;样本相关系数为0说明两个变量不存在线性相关关系,但这并不意味着两个变量之间不存在其他类型的关系,所以B不正确;C,D的阐述均正确.故选AB.]10.AC [题中散点图的特点是y随x的增长而增长,增长的速度越来越慢,且y<25.对于A,当c1>0,c2>0时符合题意;对于B,y=25+≥25,不符合题意;对于C,当c1>0,c2>0时符合题意;对于D,y=c1(x-25)+c2的增长速度保持不变,不符合题意.故选AC.]11.ABD [由成对样本数据可得,×(154+157+158+159+160+161+162+163)=159.25,×(155+156+159+162+161+164+165+166)=161,∴r=≈0.963,B正确;由r≈0.963>0,8个成对样本数据呈正相关关系,A正确;对于选项C,平移后的成对样本数据所对应平面直角坐标系中的散点图与原始的成对样本数据所对应的散点图形状完全一致,故相关性完全相同,C错误;根据统计学思想,D正确.]12.AB [∵=3,去除前的经验回归方程为=1.5x+0.5,∴=5.设重新求得的经验回归直线l的方程为x,则=1.2,∴变量x与y具有正相关关系,故A正确.设新的成对样本数据为(xi',yi'),i=1,2,…,n-2,xi'的平均值为',yi'的平均值为',则(n-2)'=n-(1.2+4.8)=3n-6=3(n-2),(n-2)'=n-(2.2+7.8)=5n-10=5(n-2),故'=3,'=5,∴'-'=5-1.2×3=1.4.故新的经验回归方程为=1.2x+1.4,故B正确.因为1.2<1.5,所以去除后y的估计值的增长速度比原来变慢,故C错误.把x=2代入新的经验回归方程中,得=3.8,3.75-3.8=-0.05,故D错误.故选AB.]13.46.36 5.55 [由题意得所以=0.3×≈5.55.]14.0.01 [由列联表数据,可求得χ2=≈7.227>6.635=x0.01,所以“X与Y之间有关系”出错的概率为0.01.]15.15 [根据等高堆积条形图可知,喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为×23=15.]16. [当t=4时,z=-1+ln15=ln,∴y=ez=.]17.解:(1)列联表如下:等高堆积条形图如图所示,由图知成绩优秀与患近视有关.(2)由列联表中的数据得到χ2=≈5.475>3.841.因此,在犯错误的概率不超过0.05的前提下认为成绩优秀与患近视有关.18.解:(1)样本中10棵这种树木的根部横截面积的平均值=0.06,样本中10棵这种树木的材积量的平均值=0.39.据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,平均一棵的材积量为0.39m3.==≈≈0.97.19.解:(1)由表中数据可得=5,=15,==2,所以==15-2×5=5,故经验回归方程为=2x+5.说明销售件数的差异有74%程度是因关注人数引起的.20.解:(1)散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系.设经验回归方程为x,由题意知=42.5,=34,则求得≈-3,=34-(-3)×42.5=161.5.所以=-3x+161.5.(2)依题意有:P=(-3x+161.5)(x-30)=-3x2+251.5x-4 845=-3+-4 845.所以当x=≈42时,P有最大值.所以当x=≈42时,P有最大值.即预测销售单价约为42元时,能获得最大日销售利润.21.解:(1)记事件A为“恰有2名学生的物理成绩是自己的实际成绩”,则P(A)=.(2)因为=70.=66,=66-0.36×70=40.8.所以经验回归方程为=0.36x+40.8.(3)x1=80,=69.6.x2=75,=67.8.x3=70,=66.x4=65,=64.2.x5=60,=62.4.=(70-69.6)+(66-67.8)+(68-66)+(64-64.2)+(62-62.4)=0.4+(-1.8)+2-0.2-0.4=0.因为0∈(-0.1,0.1),所以该方程为“优拟方程”.22.解:(1)由散点图判断,y=c+适宜作为每册成本费y(元)与印刷册数x(千册)的回归方程.(2)令u=,先建立y关于u的经验回归方程,由于=≈8.96,∴=3.63-8.96×0.269≈1.22,∴y关于u的经验回归方程为=1.22+8.96u,从而y关于x的回归方程为=1.22+.(3)假设印刷x千册,依题意:10x-x78.840.即8.78x87.8,解得x10,∴至少印刷10千册才能使销售利润不低于78840元.x12345y6.5a4b1是否愿生城市非一线一线合计愿生452065不愿生132235合计5842100α0.050.010.001xα3.8416.63510.828拟合曲线直线指数曲线抛物线二次曲线y与x回归方程=19.8x-463.7=e0.27x-3.84=0.367x2-202=决定系数R20.7460.9960.9020.002项目喜欢音乐不喜欢音乐喜欢体育2010不喜欢体育515α0.050.0250.010.0050.001xα3.8415.0246.6357.87910.828母亲身高x/cm154157158159160161162163女儿身高y/cm155156159162161164165166xy合计y1y2x1101525x2401656合计503181α0.10.050.010.005xα2.7063.8416.6357.879样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9网店ABCD关注人数x/千人3467销售件数y/百件11122017单价x/元35404550日销售y/台56412811学生的编号i12345数学成绩xi8075706560物理成绩yi7066686462是否近视合计近视不近视成绩优秀201636成绩不优秀61824合计263460