年终活动
搜索
    上传资料 赚现金
    英语朗读宝

    考点11.5 变量间的相关关系、统计案例(解析版)练习题

    考点11.5 变量间的相关关系、统计案例(解析版)练习题第1页
    考点11.5 变量间的相关关系、统计案例(解析版)练习题第2页
    考点11.5 变量间的相关关系、统计案例(解析版)练习题第3页
    还剩13页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    考点11.5 变量间的相关关系、统计案例(解析版)练习题

    展开

    这是一份考点11.5 变量间的相关关系、统计案例(解析版)练习题,共16页。
    11.5 变量间的相关关系、统计案例【基础集训】考点一 变量间的相关关系1.已知x与y之间的一组数据如下表:x1234y0.53.24.87.5若y关于x的线性回归方程为=x+,,则的值为(  )A.1.25   B.-1.25   C.1.65   D.-1.65【答案】 D2.已知某产品的销售额y(万元)与广告费用x(万元)之间的关系如下表:x(单位:万元)01234y(单位:万元)1015203035若求得其线性回归方程为=6.5x+,则预计当广告费用为6万元时的销售额为(  )A.42万元   B.45万元   C.48万元   D.51万元【答案】 C3.下列说法错误的是(  )A.回归直线过样本点的中心(,)B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1C.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位D.对于分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小【答案】 D4.已知下表所示数据的回归直线方程为=4x+242,则实数a=    . x23456y251254257a266【答案】 2625.某学校为倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱.现统计了连续5天的售出和收益情况,如下表:售出水量x(单位:箱)76656收益y(单位:元)165142148125150 (1)若x与y线性相关,则某天售出8箱水时,预计收益为多少元;(2)期中考试以后,学校决定将诚信用水的收益以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级201~500名,获二等奖学金300元;考入年级501名以后的特困生将不获得奖学金.甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.①在学生甲获得奖学金的条件下,求他获得一等奖学金的概率;②已知甲、乙两名学生获得哪个等级的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X(元)的分布列及数学期望.附:=,=-.【解析】 (1)∵==6,==146,===20,则=-=146-20×6=26,=20x+26,当x=8时,=20×8+26=186,故某天售出8箱水时,预计收益是186元.(2)①设事件A为“学生甲获得奖学金”,事件B为“学生甲获得一等奖学金”,则P(B|A)===,即在学生甲获得奖学金的条件下,他获得一等奖学金的概率为.②X的可能取值(单位:元)为0,300,500,600,800,1 000,P(X=0)=×=,P(X=300)=××=,P(X=500)=××=,P(X=600)==,P(X=800)=××=,P(X=1 000)==.X的分布列为X03005006008001 000PE(X)=0×+300×+500×+600×+800×+1 000×=600(元).考点二 独立性检验6.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表. 非一线城市一线城市总计愿生452065不愿生132235总计5842100附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828由K2=算得,K2=≈9.616,参照附表,得到的正确结论是(  )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”【答案】 C7.假设有两个分类变量X和Y的2×2列联表: y1y2总计x1a10a+10x2c30c+30总计6040100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为(  )A.a=45,c=15     B.a=40,c=20C.a=35,c=25     D.a=30,c=30【答案】 A8.为调查了解某省属师范大学师范类毕业生参加工作后从事的工作与教育是否有关的情况,随机调查了该校80位性别不都相同的2019年师范类毕业大学生,得到具体数据如下表: 与教育有关与教育无关合计30104035540合计651580 (1)能否在犯错误的概率不超过5%的前提下,认为“师范类毕业生从事与教育有关的工作与性别有关”?(2)求这80位师范类毕业生从事与教育有关工作的频率;(3)以(2)中的频率作为概率,从该校近几年毕业的2 000名师范类大学生中随机选取4名,记这4名毕业生从事与教育有关工作的人数为X,求X的数学期望E(X).参考公式:K2=(n=a+b+c+d).附表:P(K2≥k0)0.500.400.250.150.100.050.0250.010k00.4550.7081.3232.0722.7063.8415.0246.635【解析】 (1)根据题意得K2=≈2.051 3,因为K2<3.841,所以在犯错误的概率不超过5%的前提下,不能认为“师范类毕业生从事与教育有关的工作与性别有关”.(2)由题表知这80位师范类毕业生从事与教育有关工作的频率为=.(3)由题意知X~B,得E(X)=4×=.【综合集训】考法一 线性回归分析的应用1.某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:气温(℃)181310-1用电量(千瓦时)24343864 由表中数据得回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量为(  )A.68千瓦时   B.67千瓦时   C.65千瓦时   D.64千瓦时【答案】 A2.已知变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是(  )x681012y6m32A.变量x,y之间呈负相关关系B.可以预测,当x=20时,=-3.7C.m=4D.该回归直线必过点(9,4)【答案】 C3.根据下表中的数据,得到的回归方程为=x+9,则=(  )x45678y54321A.2   B.1   C.0   D.-1【答案】 D4.在“一带一路”的建设中,中石化集团获得了某地深海油田区块的开采权,集团在该地区随机初步勘探了几口井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:井号i123456坐标(x,y)(km)(2,30)(4,40)(5,60)(6,50)(8,70)(1,y)钻探深度(km)2456810出油量(L)407011090160205(1)在散点图中,1~6号旧井的位置大致分布在一条直线附近,借助前5组数据求得回归直线方程为y=6.5x+a,求a,并估计y的预报值;(2)现准备勘探新井7(1,25),若通过1、3、5、7号井计算出的,的值(,精确到0.01)与(1)中b,a的值的差不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井;参考公式和计算结果:=,=-,=94,x2i-1·y2i-1=945(3)设出油量与钻探深度的比值k不低于20的勘探井称为优质井,那么在原有6口井中任意勘探4口井,求勘探优质井数X的分布列与数学期望.【解析】 (1)利用前5组数据得到=×(2+4+5+6+8)=5,=×(30+40+60+50+70)=50,∵y=6.5x+a,∴a=50-6.5×5=17.5,∴回归直线方程为y=6.5x+17.5.当x=1时,y=6.5+17.5=24,∴y的预报值为24.(2)利用1、3、5、7号井的数据得==4,==46.25,=94,x2i-1y2i-1=945,∴==≈6.83,又∵=-,∴=46.25-6.83×4=18.93,又b=6.5,a=17.5,∴≈5%,≈8%,均不超过10%,∴可使用位置最接近的已有旧井6(1,24).(3)由题意知,1、3、5、6这4口井是优质井,2,4这两口井是非优质井,∴勘探优质井数X的可能取值为2,3,4,由P(X=k)=(k=2,3,4),可得P(X=2)=,P(X=3)=,P(X=4)=.∴X的分布列为X234PE(X)=2×+3×+4×=.考法二 独立性检验的应用5.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是(  )A.若K2的观测值k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B.由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D.以上三种说法都不正确【答案】 C6.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不都相同的高中生是否爱好游泳运动得到如下2×2列联表: 总计爱好402060不爱好203050总计6050110由K2=并参照附表,得到的正确结论是 (  )附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”【答案】 A7.为了实现文化脱贫,某高校鼓励即将毕业的大学生到西部偏远山区去支教,校学生就业部针对即将毕业的男女生是否愿意到西部支教进行问卷调查,得到的情况如下表所示: 愿意去支教不愿意去支教总计女生 20 男生40  总计70 100 (1)完成上述列联表;(2)根据表中的数据,试通过计算,判断是否有95%的把握说明是否愿意去西部支教与性别有关;(3)若在接受调查的所有男生中按照“是否愿意去支教”进行分层抽样,随机抽取10人,再从10人中抽取3人进行面谈,记面谈的男生中,不愿意去支教的人数为ξ,求ξ的分布列及数学期望.参考数据及公式如下:P(K2≥k0)0.0500.0100.001k03.8416.63510.828K2=,其中n=a+b+c+d.【解析】 (1)所求列联表如下: 愿意去支教不愿意去支教总计女生302050男生401050总计7030100 (2)因为K2的观测值k0==≈4.762>3.841.所以有95%的把握说明是否愿意去西部支教与性别有关.(3)由题意,抽取的10人中有8人愿意去西部支教,2人不愿意去西部支教,于是ξ=0,1,2.P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,∴ξ的分布列为 ξ012P∴Eξ=0×+1×+2×=.8.通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下2×2列联表: 男生女生总计挑同桌304070不挑同桌201030总计5050100 (1)从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率;(2)根据以上2×2列联表,判断是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关.下面的临界值表供参考:P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828【解析】 (1)根据分层抽样方法可知抽取容量为5的样本中,挑同桌的有3人,记为A、B、C,不挑同桌的有2人,记为d、e;从这5人中随机选取3人,基本事件为ABC,ABd,ABe,ACd,ACe,Ade,BCd,BCe,Bde,Cde,共10种,这3名学生中至少有2名要挑同桌的基本事件为ABC,ABd,ABe,ACd,ACe,BCd,BCe,共7种,故所求的概率P=.(2)根据2×2列联表,计算K2=≈4.761 9>3.841,对照临界值表知,有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关.思路分析 (1)根据分层抽样原理求出样本中挑同桌的有3人,不挑同桌的有2人,利用列举法求出基本事件数,从而求概率;(2)根据2×2列联表计算K2,对照临界值表得出结论.题组一考点一 变量间的相关关系1.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为(  )A.160   B.163   C.166   D.170【答案】 C2.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为(  )A.11.4万元     B.11.8万元           C.12.0万元     D.12.2万元【答案】 B3.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.方法总结 利用直线方程进行预测是对总体的估计,此估计值不是准确值;利用回归方程进行预测(把自变量代入回归直线方程)是对因变量的估计,此时,需要注意自变量的取值范围.4.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(xi-)2(wi-)2(xi-)(yi-)(wi-)(yi-)46.65636.8289.81.61 469108.8(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=- .【解析】 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)(2)令w=,先建立y关于w的线性回归方程.由于===68,=- =563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分)(3)(i)由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2-49=66.32.(9分)(ii)根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(12分)思路分析 (1)根据散点图中点的分布趋势进行判断.(2)先设中间量w=,建立y关于w的线性回归方程,进而得y关于x的回归方程.(3)(i)将x=49代入回归方程求出y的预报值,进而得z的预报值,(ii)求出z关于x的回归方程,进而利用函数方法求最大值.考点二 独立性检验5.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表: 超过m不超过m第一种生产方式  第二种生产方式   (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,P(K2≥k)0.0500.0100.001k3.8416.63510.828.【解析】 (1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知m==80.列联表如下: 超过m不超过m第一种生产方式155第二种生产方式515 (3)由于 K2==10>6.635,所以有99%的把握认为两种生产方式的效率有差异.思路分析 (1)根据茎叶图中的数据大致集中在哪个茎,作出判断;(2)通过茎叶图确定数据的中位数,按要求完成2×2列联表;(3)根据(2)中的列联表,将有关数据代入公式计算得K2的值,查表作出统计推断.解后反思 独立性检验问题的常见类型及解题策略(1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出判断;(2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据概率统计的相关知识求解.6.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50 kg箱产量≥50 kg旧养殖法  新养殖法   (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:P(K2≥k)0.0500.0100.001k3.8416.63510.828,K2=.【解析】 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.62×0.66=0.409 2.(2)根据箱产量的频率分布直方图得列联表 箱产量<50 kg箱产量≥50 kg旧养殖法6238新养殖法3466K2=≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+≈52.35(kg).解后反思 解独立性检验问题的关注点:(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确理解K2. 

    相关试卷

    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例:

    这是一份艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例,共13页。试卷主要包含了相关关系,散点图,正相关与负相关,回归直线方程,相关系数,独立性检验等内容,欢迎下载使用。

    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例:

    这是一份艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例,共13页。试卷主要包含了相关关系,散点图,正相关与负相关,回归直线方程,相关系数,独立性检验等内容,欢迎下载使用。

    (新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版):

    这是一份(新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版),共11页。试卷主要包含了变量间的相关关系,两个变量的线性相关,独立性检验等内容,欢迎下载使用。

    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map