开学活动
搜索
    上传资料 赚现金

    2020版新一线高考文科数学(北师大版)一轮复习教学案:第9章第4节 变量间的相关关系、统计案例

    2020版新一线高考文科数学(北师大版)一轮复习教学案:第9章第4节 变量间的相关关系、统计案例第1页
    2020版新一线高考文科数学(北师大版)一轮复习教学案:第9章第4节 变量间的相关关系、统计案例第2页
    2020版新一线高考文科数学(北师大版)一轮复习教学案:第9章第4节 变量间的相关关系、统计案例第3页
    还剩10页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2020版新一线高考文科数学(北师大版)一轮复习教学案:第9章第4节 变量间的相关关系、统计案例

    展开

    第四节 变量间的相关关系、统计案例[考纲传真] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及简单应用.1相关性(1)线性相关若两个变量xy的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.(2)非线性相关若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.(3)不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2最小二乘估计(1)最小二乘法如果有n个点(x1y1)(x2y2)(xnyn)可以用下面的表达式来刻画这些点与直线yabx的接近程度:[y1(abx1)]2[y2(abx2)]2[yn(abxn)]2.使得上式达到最小值的直线yabx就是我们所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1y1)(x2y2)(xnyn)的线性回归方程,其中ab是待定参数.3回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1y1)(x2y2)(xnyn)中,()称为样本点的中心.(3)相关系数rrr>0时,称两个变量正相关r<0时,称两个变量负相关r0时,称两个变量线性不相关4独立性检验若一个2×2列联表为:    B A    B1B2总计A1ababA2cdcd总计acbdnabcd则统计量χ2为:χ2.(1)χ22.706时,可以认为变量AB没有关联的;(2)χ2>2.706时,有90%的把握判定变量AB有关联;(3)χ2>3.841时,有95%的把握判定变量AB有关联;(4)χ2>6.635时,有99%的把握判定变量AB有关联.1线性回归方程ybxa一定过样本点的中心()2由回归直线求出的数据是估算值,不是精确值.[基础自测]1(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)名师出高徒可以解释为教师的教学水平与学生的水平成正相关关系. (  )(2)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程y=-2.352x147.767,则气温为2时,一定可卖出143杯热饮. (  )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验. (  )(4)若事件AB关系越密切,则由观测数据计算得到的χ2的值越小. (  )[答案] (1) (2)× (3)× (4)×2.(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(  )A.回归分析    B.均值与方差C.独立性检验 D.概率C [近视性别是两类变量,其是否有关,应用独立性检验判断.]3(教材改编)已知变量xy正相关,且由观测数据算得样本平均数33.5,则由该观测数据算得的线性回归方程可能是(  )Ay0.4x2.3 By2x2.4Cy=-2x9.5 Dy=-0.3x4.4A [因为变量xy正相关,排除选项CD.又样本中心(3,3.5) 在回归直线上,排除B,选项A满足.]4.下面是2×2列联表:则表中ab的值分别为(  ) y1y2合计x1a2173x2222547合计b46120A94,72 B52,50C52,74 D74,52C [a2173a52.a22bb74.]5.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ27.069,则所得到的统计学结论是:有多少的把握认为学生性别与支持该活动有关系”.              (  )附:P(χ2x0)0.1000.0500.0250.0100.001x02.7063.8415.0246.63510.828A0.1%   B1%  C99%   D99.9%C [因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有10.0100.9999%的把握认为学生性别与支持该活动有关系”.]相关关系的判断1.已知变量xy满足关系y=-0.1x1,变量yz正相关.下列结论中正确的是(  )Axy正相关,xz负相关Bxy正相关,xz正相关Cxy负相关,xz负相关Dxy负相关,xz正相关C [因为y=-0.1x1的斜率小于0,故xy负相关.因为yz正相关,可设zbyab0,则zbya=-0.1bxba,故xz负相关.]2(2019·广州模拟)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的条形统计图.  以下结论不正确的是(  )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效    C2006年以来我国二氧化硫年排放量呈减少趋势    D2006年以来我国二氧化硫年排放量与年份正相关D [2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;  2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确;2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,  故选D]3(2019·日照模拟)变量XY相对应的一组数据为(10,1)(11.3,2)(11.8,3)(12.5,4)(13,5),变量UV相对应的一组数据为(10,5)(11.3,4)(11.8,3)(12.5,2)(13,1)r1表示变量YX之间的线性相关系数,r2表示变量VU之间的线性相关系数,则(  )参考公式:线性相关系数rAr2r10   B0r2r1Cr20r1 Dr1r2C [由己知中的数据可知:第一组数据正相关,则相关系数大于零,第二组数据负相关,则相关系数小于零,故选C][规律方法] 判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r0时,负相关.(3)线性回归方程中:b>0时,正相关;b<0时,负相关. 线性回归分析及应用 【例1】 (2018·全国卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,217)建立模型y=-30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,27)建立模型y9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.[] (1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为y=-30.413.5×19226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为y9917.5×9256.5(亿元)(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.[规律方法] 线性回归分析问题的类型及解题方法(1)求线性回归方程:利用公式,求出回归系数ba.待定系数法:利用回归直线过样本点中心求系数.(2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b. (2016·全国卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20082014(1)由折线图看出,可用线性回归模型拟合yt的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi9.32tiyi40.170.552.646.参考公式:相关系数r回归方程yabt中斜率和截距的最小二乘估计公式分别为:bab.[] (1)由折线图中数据和附注中参考数据得4 (ti)2280.55 (ti)(yi)tiyiyi40.174×9.322.89r0.99.因为yt的相关系数近似为0.99,说明yt的线性相关程度相当高,从而可以用线性回归模型拟合yt的关系.(2)1.331(1)b0.103ab1.3310.103×40.92.所以,y关于t的回归方程为y0.920.10t.2016年对应的t9代入回归方程得y0.920.10×91.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨. 独立性检验及应用 【例2】 (2017·全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:    (1)A表示事件旧养殖法的箱产量低于50 kg,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50 kg箱产量50 kg旧养殖法  新养殖法  (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(χ2x0)0.0500.0100.001x03.8416.63510.828χ2.[] (1)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)×50.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表 箱产量<50 kg箱产量50 kg旧养殖法6238新养殖法3466χ215.705.由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)50 kg55 kg之间,旧养殖法的箱产量平均值(或中位数)45 kg50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[规律方法] 独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式χ2,计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断. (2019·合肥质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关? 选择自然科学类选择社会科学类合计男生   女生   合计   附:χ2,其中nabcd. P(χ2x0)0.5000.4000.2500.1500.1000.0500.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 [] (1)从高一年级学生中随机抽取1人,抽到男生的概率约为.(2)根据统计数据,可得2×2列联表如下: 选择自然科学类选择社会科学类合计男生6045105女生304575合计9090180χ25.142 95.024所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.(2018·全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表: 超过m不超过m第一种生产方式  第二种生产方式  (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:χ2P(χ2x0)0.0500.0100.001x03.8416.63510.828[] (1)第二种生产方式的效率更高.理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.)(2)由茎叶图知m80.列联表如下: 超过m不超过m第一种生产方式155第二种生产方式515(3)由于χ210>6.635,所以有99%的把握认为两种生产方式的效率有差异. 

    英语朗读宝
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map