所属成套资源:新教材2023版高中数学新人教A版选择性必修第三册课时作业(23份)
新教材2023版高中数学第八章成对数据的统计分析章末过关检测新人教A版选择性必修第三册
展开
这是一份新教材2023版高中数学第八章成对数据的统计分析章末过关检测新人教A版选择性必修第三册,共13页。
章末过关检测(三) 成对数据的统计分析一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.[2022·湖北部分市州高二期末]在下列所示的四个图中,两个变量间具有较强线性相关关系的是( ) 2.[2022·山东菏泽高二期末]关于线性回归的描述,下列命题错误的是( )A.回归直线一定经过样本点的中心B.残差平方和越小,拟合效果越好C.决定系数R2越接近1,拟合效果越好D.残差平方和越小,决定系数R2越小3.[2022·湖北武汉高二期末]为大力提倡“厉行节约,反对浪费”,某大学通过随机询问100名学生能否做到“光盘”行动,得到如下列联表:单位:人经计算:χ2≈3.04,得到的正确结论是( )A.依据α=0.05的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”B.依据α=0.01的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”C.依据α=0.1的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”D.依据α=0.1的独立性检验,认为“该校学生能否做到‘光盘’行动与性别无关”4.[2022·江苏南通高二期末]根据样本点A(0,2.2),B(2,4.4),C(4,n)绘制的散点图知,样本点呈直线趋势,且经验回归方程为eq \o(y,\s\up6(^))=0.65x+2.5,则n=( )A.6.6B.5.1C.4.8D.3.85.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为则X与Y的关系最弱时整数m取( )A.8B.9C.14D.196.[2022·福建泉州高二期末]色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中:已知该产品的色度y和色差x之间满足线性相关关系,且eq \o(y,\s\up6(^))=0.8x+eq \o(a,\s\up6(^)),现有一对测量数据为(30,23.6),则该数据的残差为( )A.-0.96B.-0.8C.0.8D.0.967.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有eq \f(1,6)的男大学生“不看”,有eq \f(1,3)的女大学生“不看”,若有99%的把握认为性别与是否看营养说明之间有关,则调查的总人数可能为( )A.150B.170C.240D.1758.[2022·河北石家庄高二期末]对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8)其经验回归方程是eq \o(y,\s\up6(^))=eq \f(1,3)x+eq \o(a,\s\up6(^)),且x1+x2+…+x8=2(y1+y2+…+y8)=6,则当x=-eq \f(3,4)时,y的估计值为( )A.-eq \f(1,8)B.eq \f(1,8)C.-eq \f(1,4)D.eq \f(1,4)二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.[2022·江苏泰州高二期末]下列说法中正确的是( )A.公式LW=8中的L和W具有相关关系B.回归直线eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))恒过样本点的中心(eq \o(x,\s\up6(-)),eq \o(y,\s\up6(-)))C.相关系数r的绝对值越接近1,则两个变量的相关性越强D.对分类变量x与y的随机变量χ2来说,χ2越小,判断“x与y有关系”的把握越大10.[2022·福建莆田高二期末]为预测某电子商务平台2022年的销售额(单位:亿元),建立了年销售额y与年份代码x的两个回归模型,根据该平台2012年至2021年的数据(年份代码x的值依次为1,2,…,10)作出散点图,建立模型①:eq \o(y,\s\up6(^))=493x+eq \o(a,\s\up6(^))和模型②:eq \o(y,\s\up6(^))=7x3-60x2+400x-205,如下图,则下列说法正确的是( )A.模型②更适合作为回归模型B.年销售额y与年份代码x呈正相关关系C.根据模型②计算得,当x=11时,eq \o(y,\s\up6(^))=6252,可预测该平台2022年的年销售额为6252亿元D.若模型①过样本中心,该平台2012年至2021年间年销售额的平均值为1845亿元,则eq \o(a,\s\up6(^))=-62011.[2022·山东济南高二期末]某同学将收集到的六对数据制作成散点图如下,得到其经验回归方程为l1:eq \o(y,\s\up6(^))=0.68x+eq \o(a,\s\up6(^)),计算其相关系数为r1,决定系数为R eq \o\al(\s\up1(2),\s\do1(1)) .经过分析确定点F为“离群点”,把它去掉后,再利用剩下的五对数据计算得到经验回归方程为l2:eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+0.68,相关系数为r2,决定系数为R eq \o\al(\s\up1(2),\s\do1(2)) .下列结论正确的是( )A.r2>r1>0B.R eq \o\al(\s\up1(2),\s\do1(1)) >R eq \o\al(\s\up1(2),\s\do1(2)) C.00).他先设y′=eq \f(y,x),将表中数据进行转换,得到新的成对数据(xi,y′i)(i=1,2,3,4,5),再用一元线性回归模型y′=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))拟合;乙根据数据得到线性回归方程为y=8.7x-37.2.(1)列出新的数据表(xi,y′i)(i=1,2,3,4,5),并求y′=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^));(2)在统计学中,我们通常计算不同回归模型的残差平方和(残差平方和v2=eq \i\su(i=1,n,)(yi-eq \o(y,\s\up6(^))i)2)来判断拟合效果,v2越小,拟合效果越好.乙同学计算出其模型的残差平方和为143.6,请你计算甲同学模型y=c1x2+c2x的残差平方和,并比较拟合效果.章末过关检测(三)1.解析:对于A,散点落在某条曲线上,两个变量具有函数关系;对于B,散点落在某条直线附近,这两个变量具有线性相关关系;对于C,散点落在某条曲线附近,这两个变量具有非线性相关关系;对于D,散点杂乱无章,无规律可言,这两个变量无相关性,不具有相关关系.故选B.答案:B2.解析:对A,回归直线一定经过样本点的中心,正确;对B,残差平方和越小,拟合效果越好,正确;对C,决定系数R2越接近1,拟合效果越好,正确;对D,残差平方和越小,拟合效果越好,决定系数R2越接近1,故D错误.故选D.答案:D3.解析:由题意得χ2≈3.04>2.706=x0.1,所以依据α=0.1的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”.故选C.答案:C4.解析:由已知得eq \o(x,\s\up6(-))=2,eq \o(y,\s\up6(-))=eq \f(6.6+n,3),而eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))eq \o(x,\s\up6(-)),所以2.5=eq \f(6.6+n,3)-0.65×2 , 解得n=4.8.故选C.答案:C5.解析:在两个分类变量的列联表中,当|ad-bc|的值越小时,认为两个分类变量有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.故选C.答案:C6.解析:由题意可知,eq \o(x,\s\up6(-))=eq \f(21+23+25+27,4)=24,eq \o(y,\s\up6(-))=eq \f(15+18+19+20,4)=18,将(24,18)代入eq \o(y,\s\up6(^))=0.8x+eq \o(a,\s\up6(^)),即18=0.8×24+eq \o(a,\s\up6(^)),解得eq \o(a,\s\up6(^))=-1.2,所以eq \o(y,\s\up6(^))=0.8x-1.2,当x=30时,eq \o(y,\s\up6(^))=0.8×30-1.2=22.8,所以该数据的残差为23.6-22.8=0.8.故选C.答案:C7.解析:设男女大学生各有m人,根据题意画出2×2列联表,如下:所以χ2=eq \f(2m\b\lc\(\rc\)(\a\vs4\al\co1(\f(5,6)m×\f(1,3)m-\f(1,6)m×\f(2,3)m))\s\up12(2),\f(3,2)m×\f(1,2)m×m×m)=eq \f(2m,27),因为有99%的把握认为性别与对产品是否满意有关,所以eq \f(2m,27)>6.635,解得2m>179.145,所以总人数2m可能为240.故选C.答案:C8.解析:因为x1+x2+…+x8=2(y1+y2+…+y8)=6,所以eq \o(x,\s\up6(-))=eq \f(x1+x2+…+x8,8)=eq \f(6,8)=eq \f(3,4),eq \o(y,\s\up6(-))=eq \f(y1+y2+…+y8,8)=eq \f(3,8),因为回归直线方程是eq \o(y,\s\up6(^))=eq \f(1,3)x+eq \o(a,\s\up6(^)),所以eq \o(y,\s\up6(-))=eq \f(1,3)eq \o(x,\s\up6(-))+eq \o(a,\s\up6(^)),所以eq \f(3,8)=eq \f(1,3)×eq \f(3,4)+eq \o(a,\s\up6(^)),解得:eq \o(a,\s\up6(^))=eq \f(1,8),所以eq \o(y,\s\up6(^))=eq \f(1,3)x+eq \f(1,8),所以当x=-eq \f(3,4)时,y的估计值为eq \o(y,\s\up6(^))=eq \f(1,3)×eq \b\lc\(\rc\)(\a\vs4\al\co1(-\f(3,4)))+eq \f(1,8)=-eq \f(1,8).故选A.答案:A9.解析:对于A,公式LW=8中,L和W关系明确,属于函数关系,不是相关关系,相关关系是一种非确定的关系,故A错误;对于B,回归直线eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^))恒过样本点的中心(eq \o(x,\s\up6(-)),eq \o(y,\s\up6(-))),故B正确;对于C,相关系数r的绝对值越接近1,则两个变量的相关性越强,故C正确;对于D,对分类变量x与y,它们的随机变量χ2越大,判断“x与y有关系”的把握越大,故D错误.故选BC.答案:BC10.解析:由散点图可知年销售额y与年份代码x呈正相关关系;模型②更适合作为回归模型,故选项A,B正确.当x=11时,eq \o(y,\s\up6(^))=7×113-60×112+400×11-205=6252;当x=11时,对应的年份为2022,可预测该平台2022年的年销售额为6252亿元,故选项C正确.eq \o(x,\s\up6(-))=eq \f(1+2+3+……+10,10)=5.5,1845=493×5.5+eq \o(a,\s\up6(^)),解得eq \o(a,\s\up6(^))=-866.5,故选项D不正确.故选ABC.答案:ABC11.解析:由图可知两变量呈现正相关,故r1>0,r2>0,去掉“离群点”后,相关性更强,所以r110.828=x0.001,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为用药与A疾病康复有关联,此推断犯错误的概率不大于0.001.(2)由题意,乙组未用药而康复的频率为eq \f(5,30)=eq \f(1,6),所以患有A疾病的自愈概率为eq \f(1,6),随机变量X的可能取值为0,1,2,3,4,由题意得,随机变量X~B(4,eq \f(1,6)),所以X的分布列为P(X=k)=C eq \o\al(\s\up1(k),\s\do1(4)) eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,6)))eq \s\up12(k)(1-eq \f(1,6))4-k,k=0,1,2,3,4,所以X的数学期望E(X)=np=4×eq \f(1,6)=eq \f(2,3).22.解析:(1)新数据对(xi,y′i)(i=1,2,3,4,5)如下表:因此eq \o(x,\s\up6(-))=eq \f(4+6+8+10+12,5)=8,eq \o(y,\s\up6(-))′=eq \f(1+2+3+5+6,5)=3.4,则eq \o(b,\s\up6(^))==eq \f(26,40)=0.65,eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))eq \o(x,\s\up6(-))=3.4-0.65×8=-1.8,所以y′=0.65x-1.8.(2)由(1)得:y=0.65x2-1.8x,当x1=4时,eq \o(y,\s\up6(^))1=4(0.65×4-1.8)=3.2,当x2=6时,eq \o(y,\s\up6(^))2=6(0.65×6-1.8)=12.6,当x3=8时,eq \o(y,\s\up6(^))3=8(0.65×8-1.8)=27.2,当x4=10时,eq \o(y,\s\up6(^))4=10(0.65×10-1.8)=47,当x5=12时,eq \o(y,\s\up6(^))5=12(0.65×12-1.8)=72,yi,eq \o(y,\s\up6(^))i对应值表为因此v2=0.82+0.62+3.22+32+02=20.24,显然143.6>20.24,所以模型y=c1x2+c2x拟合效果好.YXy1y2总计x1101828x2m26m+26总计m+1044m+54色差x21232527色度y15181920年份20172018201920202021年份编号x12345销量y/十万辆2.534m5x1234yee3e4e6男女合计了解70125不了解45合计α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828年份2017年2018年2019年2020年2021年年份代码x12345销售量y(万辆)1718202223满意不满意男顾客10女顾客15年份20172018201920202021年份代号x12345年环保投资额y(万元)1220354855康复未康复单位甲组乙组合计x4681012y412245072看不看合计男 eq \f(5,6)m eq \f(1,6)mm女 eq \f(2,3)m eq \f(1,3)mm合计 eq \f(3,2)m eq \f(1,2)m2m冰雪运动的喜好性别合计男性女性喜欢140120260不喜欢6080140合计200200400x1234yee3e4e6z1346男女合计了解7055125不了解304575合计100100200满意不满意合计男顾客401050女顾客351550合计7525100康复未康复合计甲组201030乙组52530合计253560x4681012y′12356y412245072 eq \o(y,\s\up6(^)) 3.212.627.24772