终身会员
搜索
    上传资料 赚现金

    2023版步步高新高考人教A版一轮复习讲义第九章 §9.3 成对数据的统计分析

    立即下载
    加入资料篮
    2023版步步高新高考人教A版一轮复习讲义第九章 §9.3 成对数据的统计分析第1页
    2023版步步高新高考人教A版一轮复习讲义第九章 §9.3 成对数据的统计分析第2页
    2023版步步高新高考人教A版一轮复习讲义第九章 §9.3 成对数据的统计分析第3页
    还剩21页未读, 继续阅读
    下载需要5学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2023版步步高新高考人教A版一轮复习讲义第九章 §9.3 成对数据的统计分析

    展开
    §9.3 成对数据的统计分析考试要求 1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析.知识梳理1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关.2.样本相关系数(1)r=eq \f(\i\su(i=1,n, )xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n, )xi-\x\to(x)2)\r(\i\su(i=1,n, )yi-\x\to(y)2)).(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)我们将eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))称为Y关于x的经验回归方程,其中eq \b\lc\{\rc\ (\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n, )xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n, )xi-\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))(2)残差:观测值减去预测值,称为残差.4.列联表与独立性检验(1)关于分类变量X和Y的抽样数据的2×2列联表:(2)计算随机变量χ2=eq \f(nad-bc2,a+bc+da+cb+d),利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.常用结论1.经验回归直线过点(eq \x\to(x),eq \x\to(y)).2.求eq \o(b,\s\up6(^))时,常用公式eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\to(x) \x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)散点图是判断两个变量相关关系的一种重要方法和手段.( √ )(2)经验回归直线eq \o(y,\s\up6(^)) =eq \o(b,\s\up6(^)) x+eq \o(a,\s\up6(^)) 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( × )(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( √ )(4)若分类变量X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( × )教材改编题1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的经验回归方程为(  )A.eq \o(y,\s\up6(^))=x+1 B.eq \o(y,\s\up6(^))=x+2C.eq \o(y,\s\up6(^))=2x+1 D.eq \o(y,\s\up6(^))=x-1答案 A解析 由已知可得eq \x\to(x)=eq \f(1,4)×(1+2+3+4)=2.5,eq \x\to(y)=eq \f(1,4)×(2+3+4+5)=3.5,所以经验回归直线过点(2.5,3.5),所以把点(2.5,3.5)代入四个选项中验证,可得只有eq \o(y,\s\up6(^))=x+1成立.2.(多选)下列关于成对样本数据的统计分析的判断中正确的有(  )A.若样本相关系数r=0,则说明成对样本数据没有相关性B.样本相关系数r越大,成对样本数据的线性相关性越强C.用最小二乘法求得的一元线性回归模型的残差和一定是0D.决定系数R2越大,残差平方和越小,模型的拟合效果越好答案 CD解析 对于A,当r=0时,只表明成对样本数据间没有线性相关关系,但是不排除它们之间有其他相关关系,故A错误;对于B,样本相关系数|r|越大,成对样本数据的线性相关性越强,故B错误;对于C,残差和为eq \i\su(i=1,n, )(yi-eq \o(y,\s\up6(^))i)=eq \i\su(i=1,n,[)yi-(eq \o(b,\s\up6(^))xi+eq \o(a,\s\up6(^)))]=eq \i\su(i=1,n,y)i-eq \o(b,\s\up6(^))eq \i\su(i=1,n,x)i-eq \i\su(i=1,n, )eq \o(a,\s\up6(^))=neq \x\to(y)-neq \o(b,\s\up6(^))eq \x\to(x)-neq \o(a,\s\up6(^))=n(eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x)-eq \o(a,\s\up6(^)))=0,故C正确;对于D,决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.3.(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下所示的2×2列联表(个别数据暂用字母表示):计算得:χ2≈12.981,参照下表:对于下面的选项,正确的为(  )A.根据小概率值α=0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无关”B.m=54C.根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”D.n=52答案 BC解析 ∵ χ2≈12.981>7.879>6.635,∴根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,∴A错,C对,∵m+36=90,18+n=60,∴m=54,n=42,∴B对,D错.题型一 成对数据的相关性例1 (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图2.由这两个散点图可以判断(  )图1        图2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案 C解析 由题图可得两组数据均线性相关,且图1的经验回归直线的斜率为负,图2的经验回归直线的斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.(2)(多选)下列有关经验回归分析的说法中正确的有(  )A.经验回归直线必过点(eq \x\to(x),eq \x\to(y))B.经验回归直线就是散点图中经过样本数据点最多的那条直线C.当样本相关系数r>0时,两个变量正相关D.如果两个变量的相关性越弱,则|r|就越接近于0答案 ACD解析 对于A,经验回归直线必过点(eq \x\to(x),eq \x\to(y)),故A正确;对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;对于C,当样本相关系数r>0时,则两个变量正相关,故C正确;对于D,如果两个变量的相关性越弱,则|r|就越接近于0,故D正确.教师备选1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq \f(1,2)x+1上,则这组样本数据的样本相关系数为(  )A.-1 B.0 C.eq \f(1,2) D.1答案 D解析 所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1.2.(多选)下列选项中正确的是(  )A.经验回归分析中,R2的值越大,说明残差平方和越小B.若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1C.经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D.画残差图时,纵坐标为残差,横坐标一定是编号答案 ABC解析 对于A,经验回归分析中,R2的值越大,说明模型的拟合效果越好,则残差平方和越小,A对;对于B,若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1,B对;对于C,经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,C对;对于D,残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重的估计值等,D错.思维升华 判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)经验回归方程:当eq \o(b,\s\up6(^))>0时,正相关;当eq \o(b,\s\up6(^))<0时,负相关.跟踪训练1 (1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关答案 C解析 因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=eq \o(b,\s\up6(^))y+eq \o(a,\s\up6(^)),eq \o(b,\s\up6(^))>0,则z=eq \o(b,\s\up6(^))y+eq \o(a,\s\up6(^))=-0.1eq \o(b,\s\up6(^))x+eq \o(b,\s\up6(^))+eq \o(a,\s\up6(^)),故x与z负相关.(2)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是(  )A.r20,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2Req \o\al(2,乙)=0.893.∴甲建立的回归模型拟合效果更好.②由①知,甲建立的回归模型拟合效果更好.设20.3x+3.7≥100,解得0.3x+3.7≥log2100=2+2log25,解得x≥9.7.∴科技投入的费用至少要9.7百万元,下一年的收益才能达到1亿元.教师备选1.(2022·湖北九师联盟联考)下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表.由上表可得经验回归方程eq \o(y,\s\up6(^))=0.81x+eq \o(a,\s\up6(^)),若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为(  )A.7 B.8 C.9 D.10答案 D解析 由表格,得eq \x\to(x)=eq \f(1,5)×(2+3+4+5+6)=4,eq \x\to(y)=eq \f(1,5)×(3.4+4.2+5.1+5.5+6.8)=5,因为经验回归直线恒过点(eq \x\to(x),eq \x\to(y)),所以5=0.81×4+eq \o(a,\s\up6(^)),解得eq \o(a,\s\up6(^))=1.76,所以经验回归方程为eq \o(y,\s\up6(^))=0.81x+1.76,由y≤10,得0.81x+1.76≤10,解得x≤eq \f(824,81)≈10.17,由于x∈N*,所以据此模型预测,该设备使用年限的最大值约为10.2.用模型y=cekx拟合一组数据时,为了求出经验回归方程,设z=ln y,其变换后得到经验回归方程为z=0.5x+2,则c等于(  )A.0.5 B.e0.5 C.2 D.e2答案 D解析 因为y=cekx,两边取对数得,ln y=ln(cekx)=ln c+ln ekx=kx+ln c,则z=kx+ln c,而z=0.5x+2,于是得ln c=2,即c=e2.思维升华 求经验回归方程的步骤跟踪训练2 为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导.根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下.(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);(2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?参考数据:eq \r(10)≈3.16.解 (1)由已知数据可得eq \x\to(x)=eq \f(2+4+5+6+8,5)=5,eq \x\to(y)=eq \f(300+400+400+400+500,5)=400,所以eq \i\su(i=1,5, )(xi-eq \x\to(x))(yi-eq \x\to(y))=(-3)×(-100)+(-1)×0+0×0+1×0+3×100=600,eq \r(\i\su(i=1,5, )xi-\x\to(x)2)=eq \r(-32+-12+02+12+32)=2eq \r(5),eq \r(\i\su(i=1,5, )yi-\x\to(y)2)=eq \r(-1002+02+02+02+1002)=100eq \r(2),所以样本相关系数r=eq \f(\i\su(i=1,5, )xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,5, )xi-\x\to(x)2) \r(\i\su(i=1,5, )yi-\x\to(y)2))=eq \f(600,2\r(5)×100\r(2))=eq \f(3,\r(10))≈0.95.因为|r|>0.75,所以可用经验回归模型拟合y与x的关系.(2)eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,5, )xi-\x\to(x)yi-\x\to(y),\i\su(i=1,5, )xi-\x\to(x)2)=eq \f(600,20)=30,eq \o(a,\s\up6(^))=400-5×30=250,所以经验回归方程为eq \o(y,\s\up6(^))=30x+250.当x=15时,eq \o(y,\s\up6(^))=30×15+250=700,即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克.题型三 列联表与独立性检验例4 (2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差异?解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是eq \f(150,200)=0.75,乙机床生产的产品中一级品的频率是eq \f(120,200)=0.6.(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异.根据2×2列联表,可得χ2=eq \f(nad-bc2,a+bc+da+cb+d)=eq \f(400×150×80-50×1202,270×130×200×200)≈10.256>6.635=x0.01.根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.教师备选1.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:则a-b-c等于(  )A.7 B.8 C.9 D.10答案 C解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.2.(多选)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表1.(表1)(表2)则下列说法中正确的是(  )A.χ2≈8.35B.P(χ2≥6.635)≈0.001C.依据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗有关系D.依据小概率值α=0.001的独立性检验,我们认为免疫与注射疫苗有关系答案 AC解析 由表中数据,得χ2=eq \f(60×10×34-6×102,20×40×16×44)≈8.352≈8.35,所以A正确;因为P(χ2≥6.635)≈0.01,所以B错误;χ2≈8.352>6.635=x0.01,依据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗有关系,所以C正确;χ2≈8.352<10.828=x0.001,依据小概率值α=0.001的独立性检验,我们认为免疫与注射疫苗没有关系,故D错误.思维升华 独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式χ2=eq \f(nad-bc2,a+ba+cb+dc+d)计算.(3)比较χ2与临界值的大小关系,作统计推断.跟踪训练3 (2022·太原模拟)为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:μg/m3),整理数据得到下表:若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率;(2)完成下面的2×2列联表,(3)根据(2)中的列联表,依据小概率值α=0.01的独立性检验,能否据此推断该市一天的空气质量与当天SO2的浓度有关?解 (1)由表格可知,该市一天的空气质量好,且SO2的浓度不超过150的天数为28+6+5+7=46,则“该市一天的空气质量好,且SO2的浓度不超过150”的概率P=eq \f(46,100)=0.46.(2)由表格数据可得列联表如下,(3)零假设为H0:该市一天的空气质量与当天SO2的浓度无关.由(2)知χ2=eq \f(100×46×20-24×102,70×30×56×44)≈8.936>6.635=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该市一天的空气质量与当天SO2的浓度有关.课时精练1.如表是2×2列联表,则表中的a,b的值分别为(  )A.27,38 B.28,38 C.27,37 D.28,37答案 A解析 a=35-8=27,b=a+11=27+11=38.2.(2022·湘豫名校模拟)根据如表样本数据:得到的经验回归方程为eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^)),则(  )A.eq \o(a,\s\up6(^))>0,eq \o(b,\s\up6(^))>0 B.eq \o(a,\s\up6(^))>0,eq \o(b,\s\up6(^))<0 C.eq \o(a,\s\up6(^))<0,eq \o(b,\s\up6(^))>0 D.eq \o(a,\s\up6(^))<0,eq \o(b,\s\up6(^))<0答案 B解析 由表中的数据可得,变量y随着x的增大而减小,则eq \o(b,\s\up6(^))<0,eq \x\to(x)=eq \f(2+3+4+5+6,5)=4,eq \x\to(y)=eq \f(4+2.5-0.5-2-3,5)=0.2,又经验回归方程eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))经过点(4,0.2),可得eq \o(a,\s\up6(^))>0.3.某种产品的广告费支出x与销售额y(单位:万元)之间的关系如表:y与x的经验回归方程为eq \o(y,\s\up6(^))=6.5x+17.5,当广告支出6万元时,随机误差的残差为(  )A.-5 B.-5.5C.-6 D.-6.5答案 D解析 由题意结合经验回归方程的预测作用可得,当x=6时,eq \o(y,\s\up6(^))=6.5×6+17.5=56.5,则随机误差的残差为50-56.5=-6.5.4.(2022·泉州模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程eq \o(y,\s\up6(^))=0.25x+k,则下列说法不正确的是(  )A.k的值是20B.变量x,y呈正相关关系C.若x的值增加1,则y的值约增加0.25D.当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5 ℃答案 D解析 由题意,得eq \x\to(x)=eq \f(1,5)×(20+30+40+50+60)=40,eq \x\to(y)=eq \f(1,5)×(25+27.5+29+32.5+36)=30,则k=eq \x\to(y)-0.25eq \x\to(x)=30-0.25×40=20,故A正确;由经验回归方程可知,eq \o(b,\s\up6(^))=0.25>0,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.25,故C正确;当x=52时,eq \o(y,\s\up6(^))=0.25×52+20=33,故D不正确.5.(多选)下列说法正确的是(  )A.设有一个经验回归方程eq \o(y,\s\up6(^))=3-5x,变量x增加一个单位时,y平均增加5个单位B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高D.在一元线性回归模型中,决定系数R2越接近于1,说明回归的效果越好答案 CD解析 A选项,因为eq \o(y,\s\up6(^))=3-5x,所以变量x增加一个单位时,y平均减少5个单位,故A错误;B选项,线性相关性具有正负,相关性越强,则样本相关系数r的绝对值越接近于1,故B错误;C选项,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故C正确;D选项,在一元线性回归模型中,决定系数R2越接近于1,说明模型拟合的精度越高,即回归的效果越好,故D正确.6.(多选)2021年5月18日,《佛山市第七次全国人口普查公报》发布.公报显示,佛山市常住人口为9 498 863人.为了进一步分析数据特征,某数学兴趣小组先将近五次人口普查数据作出散点图(横坐标为人口普查的序号,第三次普查记为1,…,第七次普查记为5,纵坐标为当次人口普查佛山市人口数(单位:万人),再利用不同的函数模型作出回归分析,如图,以下说法正确的是(  )A.佛山市人口数与普查序号呈正相关关系B.散点的分布呈现出很弱的线性相关特征C.经验回归方程2的拟合效果更好D.应用经验回归方程1可以预测第八次人口普查时佛山市人口会超过1 400万人答案 AC解析 对于A,散点图中的点的分布从左下方至右上方,故呈正相关关系,故A正确;对于B,利用模型1,样本点基本分布在直线的两侧,故具有较强的线性相关特征,故B错误;对于C,因为0.979 4>0.972 6,所以经验回归方程2的拟合效果更好,故C正确;对于D,利用模型1,当x=6时,y=183.5×6-1.7=1 099.3<1 400,故D错误.7.(2022·广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:若用最小二乘法求得经验回归方程为eq \o(y,\s\up6(^))=0.67x+54.9,则a的值为________.答案 68解析 由已知eq \x\to(x)=eq \f(10+20+30+40+50,5)=30,eq \x\to(y)=eq \f(62+a+75+81+89,5)=61+eq \f(2+a,5),所以61+eq \f(2+a,5)=0.67×30+54.9,解得a=68.8.(2022·青岛模拟)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d;答案 0.025解析 由题意可得列联表如下,χ2=eq \f(105×45×20-10×302,55×50×75×30)≈6.109>5.024=x0.025.9.(2022·河南九师联盟联考)机动车行经人行横道时,应当减速慢行:遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.如表是某市一主干路口监控设备所抓拍的1-5月份驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求违章人数y与月份x之间的经验回归方程eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^)),并预测该路口10月份的不“礼让行人”违章驾驶员人数;(2)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,如表所示:依据小概率值α=0.1的独立性检验,能否据此判断“礼让行人”行为与驾龄有关?解 (1)由表中的数据可知,eq \x\to(x)=eq \f(1+2+3+4+5,5)=3,eq \x\to(y)=eq \f(120+105+100+95+80,5)=100,所以eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,5,x)iyi-5\x\to(x) \x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq \f(1 410-1 500,55-45)=-9,故eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x)=100-(-9)×3=127,所以所求的经验回归方程为eq \o(y,\s\up6(^))=-9x+127;令x=10,则eq \o(y,\s\up6(^))=-9×10+127=37.(2)零假设为H0:“礼让行人”行为与驾龄无关,由表中的数据可得χ2=eq \f(70×24×14-16×162,40×30×40×30)=eq \f(14,45)≈0.311<2.706=x0.1,根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即依据小概率值α=0.1的独立性检验,不能判断“礼让行人”行为与驾龄有关.10.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:根据最小二乘法估计公式求得经验回归方程为eq \o(y,\s\up6(^))=3.2x-151.8.(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值eq \o(e,\s\up6(^))8;(2)请先求出一元线性回归模型eq \o(y,\s\up6(^))=3.2x-151.8的决定系数R2(精确到0.000 1);若根据非线性回归模型y=267.76ln x-1 069.2求得解释变量(物流成本)对于响应变量(利润)的决定系数Req \o\al(2,0)=0.905 7,请说明以上两种模型哪种模型拟合效果更好?(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.附(修正前的参考数据):eq \i\su(i=1,8,x)iyi=78 880,eq \i\su(i=1,8,x)eq \o\al(2,i)=56 528,eq \x\to(x)=84,eq \i\su(i=1,8, )(yi-eq \x\to(y))2=904.解 (1)因为eq \o(y,\s\up6(^))=3.2x-151.8,eq \x\to(x)=84,所以eq \x\to(y)=3.2×84-151.8=117,114+116+106+122+132+114+m+132=117×8,解得m=100,所以8月份对应的残差值eq \o(e,\s\up6(^))8=132-3.2×86.5+151.8=7.(2)由已知公式得eq \i\su(i=1,8, )(yi-eq \o(yi,\s\up6(^)))2=0.22+0.62+1.82+(-3)2+(-1)2+(-4.6)2+(-1)2+72=84.8,R2=1-eq \f(\i\su(i=1,8, )yi-\o(yi,\s\up6(^))2,\i\su(i=1,8, )yi-\x\to(y)2)=1-eq \f(84.8,904)≈0.906 2>Req \o\al(2,0),所以一元线性回归模型eq \o(y,\s\up6(^))=3.2x-151.8拟合效果更好.(3)第八组数据的利润应为116万元,此时eq \i\su(i=1,8,x)iyi=78 880-86.5×16=77 496,又eq \i\su(i=1,8,x)eq \o\al(2,i)=56 528,eq \x\to(x)=84,eq \x\to(y)=117-eq \f(16,8)=115,所以eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,8,x)iyi-8\x\to(x) \x\to(y),\i\su(i=1,8,x)\o\al(2,i)-8\x\to(x)2)=eq \f(77 496-8×84×115,56 528-8×842)=2.7,eq \o(a,\s\up6(^))=115-2.7×84=-111.8,所以重新采集数据后,经验回归方程为eq \o(y,\s\up6(^))=2.7x-111.8.11.某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表,则下列说法正确的是(  )A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高C.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别无关D.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别有关答案 C解析 对于A,物理类的学生中选择政治的比例为eq \f(80,220)=eq \f(4,11),历史类的学生中选择政治的比例为eq \f(50,80)=eq \f(5,8),因为eq \f(4,11)<eq \f(5,8),故选项A不正确;对于B,物理类的学生中选择地理的比例为eq \f(100,220)=eq \f(5,11),历史类的学生中选择地理的比例为eq \f(45,80)=eq \f(9,16),因为eq \f(5,11)<eq \f(9,16),故选项B不正确;对于C和D,零假设为H0:选择生物与选考类别无关.根据已知数据可得2×2列联表如表:所以χ2=eq \f(300×115×45-105×352,150×150×80×220)=eq \f(75,44)≈1.705<2.706=x0.1,根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为选择生物与选考类别无关,故选项C正确,选项D不正确.12.已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为eq \o(y,\s\up6(^))=ebx-1.若eq \o(y,\s\up6(^))=e13,则x等于(  )A.6 B.7 C.8 D.9答案 B解析 由eq \o(y,\s\up6(^))=ebx-1,得ln eq \o(y,\s\up6(^))=bx-1,令z=ln y,则eq \o(z,\s\up6(^))=bx-1,由题意知,eq \x\to(x)=eq \f(1+2+3+4,4)=2.5,eq \x\to(z)=eq \f(2+3+5+6,4)=4,因为(eq \x\to(x),eq \x\to(z))满足eq \o(z,\s\up6(^))=bx-1,所以4=b×2.5-1,解得b=2,所以eq \o(z,\s\up6(^))=2x-1,所以eq \o(y,\s\up6(^))=e2x-1,令e2x-1=e13,解得x=7.13.(多选)(2022·武汉联考)下列选项中,正确的是(  )A.对于回归分析,样本相关系数r的绝对值越小,说明拟合效果越好B.以模型y=c·ekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程eq \o(z,\s\up6(^))=0.3x+4,则c,k的值分别是e4和0.3C.经验回归方程eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))中,eq \o(b,\s\up6(^))的符号和样本相关系数r的符号一致D.通过经验回归直线eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))及回归系数eq \o(b,\s\up6(^)),可以精确反映变量的取值和变化趋势答案 BC解析 对于A,回归分析中,样本相关系数绝对值越大,拟合效果越好,A不正确;对于B,由y=c·ekx两边取对数得ln y=kx+ln c,依题意,k=0.3,ln c=4,即c=e4,B正确;对于C,由公式知,C正确.对于D,经验回归直线eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))及回归系数eq \o(b,\s\up6(^)),不能精确反映变量的取值和变化趋势,D不正确.14.(2022·漳州模拟)根据下面的数据:求得y关于x的经验回归方程为eq \o(y,\s\up6(^))=19.2x+12,则这组数据相对于所求的经验回归方程的4个残差的方差为________.(注:残差是指实际观测值与预测值之间的差)答案 3.2解析 把x=1,2,3,4依次代入经验回归方程eq \o(y,\s\up6(^))=19.2x+12,所得预测值依次为eq \o(y,\s\up6(^))1=31.2,eq \o(y,\s\up6(^))2=50.4,eq \o(y,\s\up6(^))3=69.6,eq \o(y,\s\up6(^))4=88.8,对应的残差依次为0.8,-2.4,2.4,-0.8,它们的平均数为0,所以4个残差的方差为s2=eq \f(0.82+-2.42+2.42+-0.82,4)=3.2.15.(多选)已知由样本数据(xi,yi),i=1,2,3,4,5,6求得的经验回归方程为eq \o(y,\s\up6(^))=2x+1,且eq \x\to(x)=3.现发现一个样本数据(8,12)误差较大,去除该数据后重新求得的经验回归直线l的纵截距依然是1,则下列说法正确的是(  )A.去除前变量x每增加1个单位,变量y一定增加2个单位B.去除后剩余样本数据中x的平均数为2C.去除后的经验回归方程为eq \o(y,\s\up6(^))=2.5x+1D.去除后样本相关系数r变大答案 BCD解析 当eq \x\to(x)=3时,eq \x\to(y)=2×3+1=7,则eq \i\su(i=1,6,x)i=6eq \x\to(x)=18,eq \i\su(i=1,6,y)i=6eq \x\to(y)=42,去除样本数据(8,12)后的新数据,eq \x\to(x′)=eq \f(18-8,5)=2,eq \x\to(y′)=eq \f(42-12,5)=6,设去除样本数据(8,12)后重新求得的经验回归方程为eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))x+1,则2eq \o(a,\s\up6(^))+1=6,解得eq \o(a,\s\up6(^))=2.5,故去除后的经验回归方程为eq \o(y,\s\up6(^))=2.5x+1,C正确;对于A选项,去除前变量x每增加1个单位,变量y大约增加2个单位,A错误;对于B选项,去除后剩余样本数据中x的平均数为2,B正确;对于D选项,去除了误差较大的样本数据后,线性相关性变强,因为y关于x为正相关,则r>0,所以,样本相关系数r变大,D正确.16.(2022·梅州模拟)某市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1日~9月9日连续9天的呼吸机日生产量为yi(单位:百台,i=1,2,…,9),数据作了初步处理,得到如图所示的散点图.注:图中日期代码1~9分别对应9月1日~9月9日;表中zi=,eq \x\to(z)=eq \f(1,9)eq \i\su(i=1,9,z)i.(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线y=ln(bt+a)的附近,求y关于t的方程y=ln(bt+a),并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考数据:e5≈148.4.解 (1)由散点图知,不高于300台的样本点有5个,其中高于200台的样本点有4个,则在2个样本点的生产量都不高于300台的条件下,2个样本点都高于200台的概率为P=eq \f(C\o\al(2,4),C\o\al(2,5))=eq \f(3,5).(2)y=ln(bt+a)⇔z=ey=bt+a,则由经验回归方程系数求解公式知,eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,9,t)izi-9\x\to(t) \x\to(z),\i\su(i=1,9,t)\o\al(2,i)-9\x\to(t)2)=eq \f(1 095-9×5×19,285-9×52)=4,eq \o(a,\s\up6(^))=eq \x\to(z)-eq \o(b,\s\up6(^))eq \x\to(t)=19-4×5=-1,故y=ln(4t-1),y=ln(4t-1)>5⇒4t-1>e5≈148.4⇒t>37.35,所以需要38天呼吸机日生产量可超过500台. XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+dα0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828幸福感强幸福感弱合计阅读量多m1872阅读量少36n78合计9060150α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828年份2016年2017年2018年2019年2020年年份代号x12345经济收入y(单位:百万元)59141720科技投入x1234567收益y19202231405070eq \x\to(z)eq \i\su(i=1,7,x)eq \o\al(2,i)eq \i\su(i=1,7,x)iyieq \i\su(i=1,7,x)izieq \i\su(i=1,7, )(yi-eq \x\to(y))2eq \i\su(i=1,7, )(yi-eq \o(yi,\s\up6(^)))251401 2391492 134130x23456y3.44.25.15.56.8x(千克)24568y(千克)300400400400500一级品二级品合计甲机床15050200乙机床12080200合计270130400男女合计爱好ab73不爱好c25合计74免疫不免疫合计注射疫苗101020未注射疫苗63440合计164460α0.100.0500.0100.001xα2.7063.8416.63510.828     SO2的浓度空气质量等级[0,50](50,150](150,475]1(优)28622(良)5783(轻度污染)3894(中度污染)11211    SO2的浓度空气质量[0,150](150,475]合计空气质量好空气质量不好合计    SO2的浓度空气质量[0,150](150,475]合计空气质量好461056空气质量不好242044合计7030100y1y2合计x1a835x2113445合计b4280x23456y42.5-0.5-2-3x24568y3040605070x(次数/分钟)2030405060y(℃)2527.52932.536零件数x(个)1020304050加工时间y(min)62a758189α0.050.0250.0100.001xα3.8415.0246.63510.828集中培训分散培训合计一次考过453075一次未考过102030合计5550105月份12345违章驾驶员人数1201051009580不礼让行人礼让行人驾龄不超过1年2416驾龄1年以上1614月份12345678物流成本x8383.58086.58984.57986.5利润y114116106122132114m132残差eq \o(ei,\s\up6(^))=yi-eq \o(yi,\s\up6(^))0.20.61.8-3-1-4.6-1选择科目选考类别思想政治地理化学生物物理类80100145115历史类50453035α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828选生物不选生物合计物理类115105220历史类354580合计150150300x1234ye2e3e5e6x1234y32487288eq \x\to(y)eq \x\to(z)eq \x\to(t)eq \i\su(i=1,9,t)eq \o\al(2,i)eq \i\su(i=1,9,t)izi2.731952851 095
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map