|学案下载
终身会员
搜索
    上传资料 赚现金
    2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例
    立即下载
    加入资料篮
    2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例01
    2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例02
    2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例03
    还剩9页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例

    展开

    第四节变量间的相关关系、统计案例

    1.变量间的相关关系

    (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.

    (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.

    2.两个变量的线性相关

    (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.

    (2)回归方程为x,其中.

    (3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.

    (4)相关系数:

    r0时,表明两个变量正相关;当r0时,表明两个变量负相关.

    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

    3.独立性检验

     

    y1

    y2

    总计

    x1

    a

    b

    ab

    x2

    c

    d

    cd

    总计

    ac

    bd

    abcd

    假设有两个分类变量XY,它们的取值分别为{x1x2}{y1y2},其样本频数列联表称为2×2列联表

    K2(其中nabcd为样本容量).

    相关关系与函数关系异同点

    共同点:二者都是指两个变量间的关系.

    不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.

    回归直线x必过样本点的中心(),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.

    r的符号表明两个变量是正相关还是负相关;|r|的大小表示线性相关性的强弱.

    独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.

    [小题查验基础]

    一、判断题(对的打,错的打“×”)

    (1)散点图是判断两个变量是否相关的一种重要方法和手段.(  )

    (2)回归直线方程x至少经过点(x1y1)(x2y2)(xnyn)中的一个点.(  )

    (3)若事件XY关系越密切,则由观测数据计算得到的K2的观测值越小.(  )

    (4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.(  )

    答案:(1) (2)× (3)× (4)

    二、选填题

    1.已知变量xy之间具有线性相关关系,其散点图如图所示,回归直线l的方程为x,则下列说法正确的是(  )

    A.00

    B.00

    C.00

    D.00

    解析:D 由题图可知,回归直线的斜率是正数,即0;回归直线在y轴上的截距是负数,即0,故选D.

    2.为了考察两个变量xy之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是(  )

    A.l1l2必定平行

    B.l1l2必定重合

    C.l1l2一定有公共点(st)

    D.l1l2相交,但交点不一定是(st)

    解析:C 注意到回归直线必经过样本中心点.

    3.下面是2×2列联表:

     

    y1

    y2

    总计

    x1

    a

    21

    73

    x2

    22

    25

    47

    总计

    b

    46

    120

    则表中ab的值分别为________________.

    解析:a2173a52,又a22bb74.

    答案:52 74

    4.已知xy的取值如下表,从散点图可以看出yx具有线性相关关系,且回归方程为0.95x,则________.

    x

    0

    1

    3

    4

    y

    2.2

    4.3

    4.8

    6.7

     

    解析:回归直线必过样本点的中心(),又24.5,代入回归方程,得2.6.

    答案:2.6

    [题组练透]

    1.两个变量的相关关系有正相关,负相关,不相关,则下列散点图从左到右分别反映的变量间的相关关系是(  )

    A.①②③        B.②③①

    C.②①③ D.①③②

    解析:D 第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.

    2.已知变量xy满足关系y=-0.1x1,变量yz正相关.下列结论中正确的是(  )

    A.xy正相关,xz负相关

    B.xy正相关,xz正相关

    C.xy负相关,xz负相关

    D.xy负相关,xz正相关

    解析:C 因为y=-0.1x1的斜率小于0

    xy负相关.因为yz正相关,可设zy0,则zy=-0.1x,故xz负相关.

    3.在一组样本数据(x1y1)(x2y2)(xnyn)(n2x1x2xn不全相等)的散点图中,若所有样本点(xiyi)(i1,2n)都在直线yx1上,则这组样本数据的样本相关系数为(  )

    A.1 B.0

    C. D.1

    解析:D 所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1,故选D.

    4.变量XY相应的一组数据为(10,1)(11.3,2)(11.8,3)(12.5,4)(13,5);变量UV相对应的一组数据为(10,5)(11.3,4)(11.8,3)(12.5,2)(13,1).r1表示变量YX之间的线性相关系数,r2表示变量VU之间的线性相关系数,则(  )

    A.r2r10 B.0r2r1

    C.r20r1 D.r2r1

    解析:C 对于变量YX而言,YX的增大而增大,故YX正相关,即r10;对于变量VU而言,VU的增大而减小,故VU负相关,即r20,故选C.

    [名师微点]

    判断相关关系的2种方法

    (1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.

    (2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.

    [典例精析]

    下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.

    (1)由折线图看出,可用线性回归模型拟合yt的关系,请用相关系数加以说明;

    (2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.

    参考数据:i9.32iyi40.17, 0.552.646.

    参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为 .

    [] (1)由折线图中的数据和附注中的参考数据得

    4(ti)228, 0.55

    (ti)(yi)iyii40.174×9.322.89

    r0.99.

    因为yt的相关系数近似为0.99,说明yt的线性相关程度相当大,从而可以用线性回归模型拟合yt的关系.

    (2)1.331(1)

    0.103.

    1.3310.103×40.92.

    所以y关于t的回归方程为0.920.10t.

    2019年对应的t9代入回归方程得0.920.10×91.82.

    所以,预测2019年我国生活垃圾无害化处理量约为1.82亿吨.

    [解题技法]

    1.线性回归分析问题的类型及解题方法

    (1)求线性回归方程

    利用公式,求出回归系数.

    待定系数法:利用回归直线过样本点的中心求系数.

    (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.

    (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数.

    (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.

    2.模型拟合效果的判断

    (1)残差平方和越小,模型的拟合效果越好.

    (2)相关指数R2越大,模型的拟合效果越好.

    (3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.

     

    [过关训练]

    1.(2019·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的对应数据为如图所示的折线图.

    (1)依据折线图计算相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合yx的关系.(|r|0.75,则线性相关程度很高,可用线性回归模型拟合)

    (2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:

    周光照量X/小时

    30X50

    50X70

    X70

    光照控制仪运行台数

    3

    2

    1

     

    对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.

    参考数据:0.550.95.

    解:(1)由已知数据可得5

    4.

    因为(xi)(yi)(3)×(1)0003×16

    2

    所以相关系数r0.95.

    因为|r|0.75,所以可用线性回归模型拟合yx的关系.

    (2)由条件可得在过去50周里,

    X70时,共有10周,此时只有1台光照控制仪运行,

    每周的周总利润为1×3 0002×1 0001 000().

    50X70时,共有35周,此时有2台光照控制仪运行,

    每周的周总利润为2×3 0001×1 0005 000().

    30X50时,共有5周,此时3台光照控制仪都运行,

    每周的周总利润为3×3 0009 000().

    所以过去50周的周总利润的平均值为

    4 600()

    所以商家在过去50周的周总利润的平均值为4 600.

    2.某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.

    (xi)2

    (xi)(yi)

    (ui)2

    (ui)(yi)

    15.25

    3.63

    0.269

    2 085.5

    230.3

    0.787

    7.049

    表中uii.

    (1)根据散点图判断:yabxyc哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)

    (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01).

    (3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)

    附:对于一组数据(ω1υ1)(ω2υ2)(ωnυn),其回归直线ω的斜率和截距的最小二乘估计分别为.

    解:(1)由散点图判断,yc更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程.

    (2)u,先建立y关于u的线性回归方程,

    由于8.9578.96

    ·3.638.957×0.2691.22

    y关于u的线性回归方程为1.228.96u

    y关于x的回归方程为1.22.

    (3)假设印刷x千册,

    依题意得10xx78.840

    解得x10

    至少印刷10 000册才能使销售利润不低于78 840.

    [典例精析]

    (2019·河北名校联考)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:

    甲厂:

    分组

    [29.86,29.90)

    [29.90,29.94)

    [29.94,29.98)

    [29.98,30.02)

    频数

    12

    63

    86

    182

     

    分组

    [30.02,30.06)

    [30.06,30.10)

    [30.10,30.14]

     

    频数

    92

    61

    4

     

    乙厂:

    分组

    [29.86,29.90)

    [29.90,29.94)

    [29.94,29.98)

    [29.98,30.02)

    频数

    29

    71

    85

    159

     

    分组

    [30.02,30.06)

    [30.06,30.10)

    [30.10,30.14]

     

    频数

    76

    62

    18

     

     

    (1)试分别估计两个分厂生产的零件的优质品率;

    (2)由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为两个分厂生产的零件的质量有差异.

    甲厂

    乙厂

    总计

    优质品

     

     

    非优质品

     

     

    总计

     

     

     

    [] (1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为×100%72%

    乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为×100%64%.

    (2)完成的2×2列联表如下:

     

    甲厂

    乙厂

    总计

    优质品

    360

    320

    680

    非优质品

    140

    180

    320

    总计

    500

    500

    1 000

     

    由表中数据计算得,

    K27.3536.635

    所以有99%的把握认为两个分厂生产的零件的质量有差异.

    [解题技法]

    独立性检验的一般步骤

    (1)根据样本数据列出2×2列联表.

    (2)计算随机变量K2的观测值k,查下表确定临界值k0

    P(K2k0)

    0.50

    0.40

    0.25

    0.15

    0.10

    k0

    0.455

    0.708

    1.323

    2.072

    2.706

     

    P(K2k0)

    0.05

    0.025

    0.010

    0.005

    0.001

    k0

    3.841

    5.024

    6.635

    7.879

    10.828

    (3)如果kk0,就推断XY有关系,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断XY有关.

    [过关训练]

    (2018·全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:

    (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.

    (2)40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:

     

    超过m

    不超过m

    第一种生产方式

     

     

    第二种生产方式

     

     

     

    (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?

    附:K2

    解:(1)第二种生产方式的效率更高.

    理由如下:

    ()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间高于80 min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间低于79 min.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.

    (以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)

    (2)由茎叶图知m80.

    列联表如下:

     

    超过m

    不超过m

    第一种生产方式

    15

    5

    第二种生产方式

    5

    15

     

    (3)因为K2106.635,所以有99%的把握认为两种生产方式的效率有差异.

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        2020版高考理科数学(人教版)一轮复习讲义:第十一章第四节变量间的相关关系、统计案例
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map