这是一份2024春高中数学第八章成对数据的统计分析章末检测(人教A版选择性必修第三册),共13页。
第八章章末检测(时间:120分钟,满分:150分)参考公式及数据:(1)经验回归方程 eq \o(y,\s\up6(^))= eq \o(b,\s\up6(^))x+ eq \o(a,\s\up6(^))中斜率和截距的最小二乘估计公式分别为 eq \o(b,\s\up6(^))= eq \f(\i\su(i=1,n, )(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n, )(xi-\x\to(x))2)= eq \f(\i\su(i=1,n,x)iyi-\x\to(nx) \x\to(y),\i\su(i=1,n,x) eq \o\al(2,i)-\x\to(nx)2), eq \o(a,\s\up6(^))= eq \o(y,\s\up6(-))- eq \o(b,\s\up6(^)) eq \x\to(x).(2)样本相关系数r= eq \f(\i\su(i=1,n, )(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n, )(xi-\x\to(x))2\i\su(i=1,n, )(yi-\x\to(y))2)).(3)R2=1- eq \f(\i\su(i=1,n, )(yi-\o(y,\s\up6(^))i)2,\i\su(i=1,n, )(yi-\x\to(y))2).(4)χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.若经验回归方程为y=2-3.5x,则变量x增加一个单位,变量y平均( )A.减少3.5个单位 B.增加2个单位C.增加3.5个单位 D.减少2个单位【答案】A 【解析】由经验回归方程可知 eq \o(b,\s\up6(^))=-3.5,则变量x增加一个单位,y减少3.5个单位,即变量y平均减少3.5个单位.2.某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=( )A.40 B.42C.44 D.46【答案】C 【解析】由题意得a+b+d+6=50,所以a+b+d=50-6=44.3.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图: 根据图中信息,在下列各项中,说法最佳的一项是( )A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【答案】B 【解析】从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.4.(2023年保定期末)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中:已知该产品的色度y和色差x之间满足线性相关关系,且 eq \o(y,\s\up6(^))=0.8x+ eq \o(a,\s\up6(^)),现有一对测量数据为(30,23.6),则该数据的残差为( )A.-0.96 B.0.96C.-0.8 D.0.8【答案】D 【解析】 eq \x\to(x)= eq \f(21+23+25+27,4)=24, eq \x\to(y)= eq \f(15+18+19+20,4)=18,将(24,18)代入 eq \o(y,\s\up6(^))=0.8x+ eq \o(a,\s\up6(^)),得18=0.8×24+ eq \o(a,\s\up6(^)),解得 eq \o(a,\s\up6(^))=-1.2,所以 eq \o(y,\s\up6(^))=0.8x-1.2.当x=30时, eq \o(y,\s\up6(^))=0.8×30-1.2=22.8,所以该数据的残差为23.6-22.8=0.8.5.某学校开展研究性学习活动,某同学获得一组试验数据如下表所示:对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( )A.y=2x-2 B.y= eq \f(1,2)(x2-1)C.y=log2x D.y= eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2))) eq \s\up12(x)【答案】B 【解析】根据表中的数据,可验证y= eq \f(1,2)(x2-1)拟合程度最好.6.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线(如图),以下结论正确的是( )A.直线l过点( eq \x\to(x), eq \x\to(y))B.x和y的样本相关系数为直线l的斜率C.x和y的样本相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同【答案】A 【解析】由样本的中心( eq \x\to(x), eq \x\to(y))落在经验回归直线上可知A正确;x和y的样本相关系数表示x与y之间的线性相关程度,不表示直线l的斜率,故B错误;x和y的样本相关系数应在-1到1之间,故C错误;分布在经验回归直线两侧的样本点的个数并不绝对平均,跟样本点个数是奇数还是偶数无关,故D错误.7.根据某班学生数学、外语成绩得到的列表如下:那么χ2约等于( )A.10.3 B.8C.4.25 D.9.3【答案】C 【解析】由公式得χ2= eq \f(85×(34×19-17×15)2,51×34×49×36)≈4.25.8.(2022年大同模拟)右图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程 eq \o(y,\s\up6(^))= eq \o(b,\s\up6(^))1x+ eq \o(a,\s\up6(^))1,样本相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程 eq \o(y,\s\up6(^))= eq \o(b,\s\up6(^))2x+ eq \o(a,\s\up6(^))2,样本相关系数为r2.以下对r1,r2的大小关系判断正确的是( )A.0
0,所以这10名志愿者的身高和臂展呈正相关关系,B错误;因为这10名志愿者身高的平均值为176 cm,所以这10名志愿者臂展的平均值为1.2×176-34=177.2(cm),C错误;若一个人的身高为160 cm,则由经验回归方程 eq \o(u,\s\up6(^))=1.2v-34,可得这个人的臂展的估计值为158 cm,D正确.12.有甲、乙两个班级进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下所示的2×2列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为 eq \f(2,7),则( )A.表中b的值为35B.表中c的值为20C.根据表中的数据,若依据α=0.05的独立性检验,能认为“成绩与班级有关系”D.根据表中的数据,在犯错误的概率不超过0.05的前提下,能认为“成绩与班级有关系”【答案】BCD 【解析】由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,A错误,B正确.根据列联表中的数据,χ2= eq \f(105×(10×30-20×45)2,55×50×30×75)≈6.109>3.841,因此依据α=0.05的独立性检验,认为“成绩与班级有关系”,即在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”,C,D正确.三、填空题:本题共4小题,每小题5分,共20分.13.已知x,y的取值如下表所示:从散点图分析y与x具有线性相关关系,且经验回归方程为 eq \o(y,\s\up6(^))=1.02x+ eq \o(a,\s\up6(^)),则 eq \o(a,\s\up6(^))=________.【答案】0.92 【解析】由题意得 eq \x\to(x)=4, eq \x\to(y)=5,又因为点( eq \x\to(x), eq \x\to(y))在直线y=1.02x+ eq \o(a,\s\up6(^))上,所以 eq \o(a,\s\up6(^))=5-1.02×4=0.92.14.(2023年遵义期中)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分,下表是2023年某企业的前5个月碳酸锂的价格与月份的统计数据:根据表中数据,得出y关于x的经验回归方程为 eq \o(y,\s\up6(^))=0.28x+ eq \o(a,\s\up6(^)),根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________.【答案】1.4 【解析】由1.5- eq \o(y,\s\up6(^))=1.5-(0.28×5+ eq \o(a,\s\up6(^)))=-0.06,得 eq \o(a,\s\up6(^))=0.16.又因为 eq \x\to(x)= eq \f(1+2+3+4+5,5)=3, eq \x\to(y)= eq \f(0.5+0.6+1+m+1.5,5)= eq \f(3.6+m,5),所以0.28×3+0.16= eq \f(3.6+m,5),解得m=1.4.15.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:则χ2=________(精确到小数点后三位),依据概率值α=0.05的独立性检验,该实验________(填“拒绝”或“支持”)该年龄段的学生在注意力的稳定性上对于性别没有显著差异.【答案】0.538 支持 【解析】由表中数据可知χ2= eq \f((29+7+33+5)×(29×5-33×7)2,(29+33)×(33+5)×(7+5)×(29+7))≈0.538<6.635=x0.01,所以没有充分证据认为学生在注意力的稳定性上与性别有关,即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.16.若一组观测值(x1,y1),(x1,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.【答案】1 【解析】由ei=0,得经验回归方程为 eq \o(y,\s\up6(^))=bx+a,故 eq \o(y,\s\up6(^))i=yi,所以R2=1- eq \f(\i\su(i=1,n, )(yi-\o(y,\s\up6(^))i)2,\i\su(i=1,n, )(yi-\x\to(y))2)=1.四、解答题:本题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤.17.(10分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,依据α=0.05的独立性检验,能否认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?解:零假设为H0:南方学生和北方学生在选用甜品的饮食习惯方面无差异.χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))= eq \f(100×(60×10-20×10)2,70×30×80×20)= eq \f(100,21)≈4.762.由于4.762>3.841=x0.05,依据α=0.05的独立性检验,我们推断H0不成立,即认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.18.(12分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料,依据α=0.1的独立性检验,能否认为“体育迷”与性别有关?解:(1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.“非体育迷”人数为75,则据题意完成2×2列联表:零假设为H0:“体育迷”与性别无关.将2×2列联表的数据代入公式计算,得χ2= eq \f(100×(30×10-45×15)2,75×25×45×55)≈3.030>2.706=x0.1.所以依据α=0.1的独立性检验,推断H0不成立,即能认为“体育迷”与性别有关.19.(12分)第十六届“中国芯”集成电路产业促进大会以“链上中国芯,成就中国造”为主题,共同探讨中国半导体产业风向,为国内集成电路企业实现关键技术突破提供了驱动力.某科技公司拟对手机芯片进行科技升级.根据市场调研与模拟,得到科技升级投入x(亿元)与科技升级直接纯收益y(亿元)的数据统计如下:(1)若用线性回归模型拟合y与x关系,求y关于x的经验回归方程(精确到0.01);(2)利用(1)得到的经验回归方程预测该科技公司科技升级投入30亿元时的直接纯收益.参考数据: eq \i\su(i=1,7,y)i=294, eq \i\su(i=1,7,x)iyi=2 784, eq \i\su(i=1,7,x) eq \o\al(2,i)=630.解:(1)设y关于x的经验回归方程为 eq \o(y,\s\up6(^))= eq \o(b,\s\up6(^))x+ eq \o(a,\s\up6(^)),由题意可知, eq \x\to(x)= eq \f(1+3+5+7+11+13+16,7)=8, eq \x\to(y)= eq \f(1,7) eq \i\su(i=1,7,y)i= eq \f(1,7)×294=42,因为 eq \i\su(i=1,7,x)iyi=2 784, eq \i\su(i=1,7,x) eq \o\al(2,i)=630,所以 eq \o(b,\s\up6(^))= eq \f(\i\su(i=1,7,x)iyi-7\x\to(x) \x\to(y),\i\su(i=1,7,x) eq \o\al(2,i)-7\x\to(x)2)= eq \f(2 784-7×8×42,630-7×82)= eq \f(432,182)≈2.374,所以 eq \o(a,\s\up6(^))= eq \x\to(y)- eq \o(b,\s\up6(^)) eq \x\to(x)=42-2.374×8≈23.01,所以y关于x的经验回归方程为 eq \o(y,\s\up6(^))=2.37x+23.01.(2)由(1)知, eq \o(y,\s\up6(^))=2.37x+23.01,当x=30亿元时, eq \o(y,\s\up6(^))=2.37×30+23.01=94.11(亿元),所以该科技公司科技升级投入30亿元时的直接纯收益约为94.11亿元.20.(12分)(2023年梧州模拟)为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表(单位:人):(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关?解:(1)由题意知,在A组中抽取的人数为16× eq \f(75,120)=10.在B组中抽取的人数为16× eq \f(45,120)=6.(2)零假设为H0:对“绿色消费”意义的认知情况与年龄无关.由题意,得χ2= eq \f(200×(75×55-25×45)2,120×80×100×100)=18.75>10.828=x0.001,故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关.21.(12分)(2023年无锡模拟)某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程.(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α=0.1的独立性检验,分析两个店的顾客下单率有无差异.解:(1) eq \x\to(x)= eq \f(2+3+4+5+6,5)=4, eq \x\to(y)= eq \f(2.5+3+4+4.5+6,5)=4, eq \i\su(i=1,5,x)iyi=2×2.5+3×3+4×4+5×4.5+6×6=88.5, eq \i\su(i=1,5,x) eq \o\al(2,i)=22+32+42+52+62=90,设y关于x的经验回归方程为 eq \o(y,\s\up6(^))= eq \o(b,\s\up6(^))x+ eq \o(a,\s\up6(^)),则 eq \o(b,\s\up6(^))= eq \f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x) eq \o\al(2,i)-5\x\to(x)2)= eq \f(88.5-5×4×4,90-5×42)=0.85, eq \o(a,\s\up6(^))= eq \x\to(y)- eq \o(b,\s\up6(^)) eq \x\to(x)=4-0.85×4=0.6,∴y关于x的经验回归方程为 eq \o(y,\s\up6(^))=0.85x+0.6.(2)零假设为H0:两个店的顾客下单率无差异,由题意可知2×2列联表如表所示:χ2= eq \f(110×(25×20-5×60)2,30×80×85×25)= eq \f(44,51)≈0.863<2.706=x0.1,根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即两个店的顾客下单率无差异.22.(12分)某二手车经销商对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:下面是z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用样本相关系数r加以说明.(2)求y关于x的非线性回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少( eq \o(b,\s\up6(^)), eq \o(a,\s\up6(^))小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的非线性回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.参考数据: eq \i\su(i=1,6,x)iyi=187.4, eq \i\su(i=1,6,x)izi=47.64, eq \i\su(i=1,6,x) eq \o\al(2,i)=139, eq \r(\i\su(i=1,6, )(xi-\o(x,\s\up6(-)))2)≈4.18, eq \r(\i\su(i=1,6, )(yi-\o(y,\s\up6(-)))2)≈13.96, eq \r(\i\su(i=1,6, )(zi-\x\to(z))2)≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.解:(1)因为 eq \x\to(x)= eq \f(1,6)×(2+3+4+5+6+7)=4.5, eq \o(z,\s\up6(-))= eq \f(1,6)×(3+2.48+2.08+1.86+1.48+1.10)=2,且 eq \i\su(i=1,6,x)izi=47.64, eq \r(\i\su(i=1,6, )(xi-\x\to(x))2)≈4.18, eq \r(\i\su(i=1,6, )(zi-\x\to(z))2)≈1.53,所以r= eq \f(\i\su(i=1,6, )(xi-\x\to(x))(zi-\x\to(z)),\r(\i\su(i=1,6, )(xi-\x\to(x))2\i\su(i=1,6, )(zi-\x\to(z))2))≈ eq \f(47.64-6×4.5×2,4.18×1.53)≈-0.99.所以|r|≈0.99,说明z与x的线性相关程度很高.(2) eq \o(b,\s\up6(^))= eq \f(\i\su(i=1,6,x)izi-6\x\to(x) \x\to(z),\i\su(i=1,6,x) eq \o\al(2,i)-6\x\to(x)2)= eq \f(47.64-6×4.5×2,139-6×4.52)≈-0.36,所以 eq \o(a,\s\up6(^))= eq \x\to(z)- eq \o(b,\s\up6(^)) eq \x\to(x)=2+0.36×4.5=3.62.所以z与x的经验回归方程是 eq \o(z,\s\up6(^))=-0.36x+3.62.又因为z=ln y,所以y关于x的非线性经验回归方程是 eq \o(y,\s\up6(^))=e-0.36x+3.62.令x=9,得 eq \o(y,\s\up6(^))=e-0.36×9+3.62≈1.46,即预测某辆A型号二手车当使用年数为9年时售价约1.46万元.(3)当 eq \o(y,\s\up6(^))≥0.711 8时,e-0.36x+3.62≥0.711 8=eln 0.711 8=e-0.34,所以-0.36x+3.62≥-0.34,解得x≤11.因此预测在收购该型号二手车时车辆的使用年数不得超过11年.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828项目会外语不会外语合计男ab20女6d合计1850色差x21232527色度y15181920x1.99345.16.12y1.54.047.51218.01外语成绩数学成绩合计优差优341751差151934合计493685x13610y8a42班级成绩合计优秀非优秀甲班10b乙班c30合计x2356y2.74.36.16.9月份代码x12345碳酸锂价格y/(万元/kg)0.50.61m1.5性别注意力稳定注意力不稳定男生297女生335新生饮食习惯合计喜欢甜品不喜欢甜品南方学生602080北方学生101020合计7030100性别观众合计非体育迷体育迷男女1055合计性别观众合计非体育迷体育迷男301545女451055合计7525100序号1234567x1357111316y19304044505358年龄段认知情况合计知晓不知晓A组(90后与00后)7525100B组(70后与80后)4555100合计12080200x/个23456y/十万元2.5344.56项目不下单下单合计分店一25530分店二602080合计8525110使用年数x234567售价y201286.44.43z=ln y3.002.482.081.861.481.10