![7.2 成对数据的线性相关性 精品课时练习 高中数学新北师大版选择性必修第一册(2022学年)第1页](http://img-preview.51jiaoxi.com/3/3/12933479/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![7.2 成对数据的线性相关性 精品课时练习 高中数学新北师大版选择性必修第一册(2022学年)第2页](http://img-preview.51jiaoxi.com/3/3/12933479/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![7.2 成对数据的线性相关性 精品课时练习 高中数学新北师大版选择性必修第一册(2022学年)第3页](http://img-preview.51jiaoxi.com/3/3/12933479/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
高中数学第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性巩固练习
展开
这是一份高中数学第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性巩固练习,共9页。试卷主要包含了939,0,下列说法中正确的是 等内容,欢迎下载使用。
7.2.1 相关系数7.2.2 成对数据的线性相关性分析1.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑同学分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则( ) A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱【答案】D【解析】甲、乙、丙三组数据的线性相关系数分别为0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.故选D.2.(2020江西高二期中)某相关变量X,Y的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据分析,可得到线性回归方程Y=X+,样本相关系数为r1;方案二:剔除点(10,32),根据剩下数据分析,可得到线性回归方程Y=X+,样本相关系数为r2.则( ) A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0【答案】A【解析】由题中散点图可知,变量X和Y成正相关,故0<r1<1,0<r2<1,在剔除点(10,32)之后,可看出线性回归直线Y=X+的线性相关程度更强,故r1<r2.所以0<r1<r2<1.故选A.3.(2020陕西西安高三模拟)北极冰融是近年来最引人注目的气候变化现象之一,白色冰面融化变成颜色相对较暗的海冰,被称为“北极变暗”现象.21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.若北极年平均海冰面积(单位:106 km2)与年平均CO2(单位:ppm)浓度图如图所示,则下列说法正确的是 ( )A.北极年海冰面积逐年减少B.北极年海冰面积减少速度不断加快C.北极年海冰面积与年平均二氧化碳浓度大体成负相关D.北极年海冰面积与年平均二氧化碳浓度大体成正相关【答案】C【解析】由统计图可知北极年海冰面积既有增加又有减少,故选项A,B错误;由统计图可知随着年平均二氧化碳浓度增加,北极年海冰面积总体呈下降趋势,所以北极年海冰面积与年平均二氧化碳浓度大体成负相关,故选项C正确,选项D错误.故选C.4.现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩X与入学后第一次考试的数学成绩Y如下表:学生号12345678910X12010811710410311010410599108Y84648468696869465771 请问:这10名学生的两次数学成绩是否具有线性相关关系?解因为(120+108+…+108)=107.8,(84+64+…+71)=68,=1202+1082+…+1082=116 584,=842+642+…+712=47 384,xiyi=120×84+108×64+…+108×71=73 796.所以样本相关系数为r===≈0.750 6.由此可看出这10名学生的两次数学成绩线性相关.5.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”Y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度X(单位:g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度/(g/L)18202224262830缩醛化度/克分子%26.8628.3528.7528.8729.7530.0030.36 (1)画散点图;(2)求线性回归方程;(3)求相关系数r.解(1)散点图如图.(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算ixiyixiyi11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80∑168202.944 1444 900.16 =24,,=≈0.264 3,-0.264 3×24≈22.648,∴线性回归方程为Y=22.648+0.264 3X.(3)5 892,r==≈0.96.6.如图,有6组数据,去掉哪组数据后(填字母代号),剩下的5组数据的线性相关性最大( )A.A B.B C.C D.D【答案】C【解析】根据题意,由散点图可得A,B,D,E,F五个点都分布在一条直线的附近且贴近某一条直线,则去掉C点后剩下的5组数据的线性相关性最大.7.设(x1,y1),(x2,y2),…,(xn,yn)是变量X和Y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A.直线l过点()B.X和Y的相关系数为直线l的斜率C.X和Y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同【答案】A【解析】由样本的中心()落在回归直线上可知A正确;X和Y的相关系数表示为X与Y之间的线性相关程度,不表示直线l的斜率,故B错;X和Y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,分布在l两侧的样本点的个数都不一定相同,故D错.8.下列说法中正确的是 (填序号). ①相关关系是一种确定性关系;②变量间的线性相关系数r的取值范围为[-1,1];③变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低;④相关系数r与线性回归方程的系数始终同号.【答案】②③④【解析】根据题意,依次分析四个说法:对于①,在回归分析中,变量间的关系非函数关系,是一种不确定的关系,①错误;对于②,相关系数r满足|r|≤1,即相关系数r的取值范围为[-1,1],②正确;对于③,根据相关系数的性质:|r|≤1,|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小,则③正确;对于④,相关系数r为正,表示正相关,线性回归方程上升,线性回归方程的系数为正;r为负,表示负相关,线性回归方程下降,线性回归方程的系数为负,即相关系数r与线性回归方程的系数始终同号,则④正确,故②③④正确.9.某学校开展研究性学习活动,一组同学获得了下面的一组试验数据:X1.99345.18Y0.991.582.012.353.00 现有如下5个模拟函数:①Y=0.58X-0.16;②Y=2X-3.02;③Y=X2-5.5X+8;④Y=log2X;⑤Y=+1.74.请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选 .(填序号) 【答案】④【解析】画出散点图如图所示.由图可知上述散点大体分布在函数Y=log2X的图象的附近,故选择Y=log2X可以近似地反映这些数据的规律.故填④.10.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差X/℃101113128发芽数Y/颗2325302616 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出Y关于X的线性回归方程Y=X+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解(1)设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则表示“选取的数据恰好是相邻2天的数据”.样本点总数为10,事件包含的样本点数为4.∴P()=,∴P(A)=1-P()=(2)=12,=27,xiyi=977,=434,=2.5,=27-2.5×12=-3,∴Y=2.5X-3.(3)由(2)知:当X=10时,Y=22,误差不超过2颗;当X=8时,Y=17,误差不超过2颗.故所求得的线性回归方程是可靠的.11.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.它主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感的小朋友按照年龄X与人数Y统计,得到如下数据:年龄X23456患病人数Y2222171410 (1)求Y关于X的线性回归方程;(2)计算样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?(若|r|∈[0.75,1],则X,Y相关性很强;若|r|∈[0.3,0.75),则X,Y相关性一般;若|r|∈[0,0.25],则X,Y相关性较弱.)参考数据:5.477.参考公式:,样本相关系数r= .解(1)由题意可得=4,=17,==-3.2,=17+3.2×4=29.8.故Y关于X的线性回归方程为Y=-3.2X+29.8.(2)r=-0.97,由r<0,可知X,Y负相关.又因为|r|∈[0.75,1],所以X,Y相关性很强.因此,可以认为该幼儿园去年春季患流感人数与年龄负相关很强.12.(2020黑龙江铁人中学高三模拟)为了防控疫情,某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原料成本及非原料成本组成,每件产品的非原料成本Y(单位:元)与生产该产品的数量X(单位:千件)有关,根据已经生产的统计数据,绘制了如下的散点图:观察散点图,两个变量不具有线性相关关系,现考虑用函数Y=a+对两个变量的关系进行拟合.参考数据如下其中ui=:yiuiyi0.410.168 11.49230620 858.44173.850.39 (1)求Y关于X的回归方程,并求Y关于U的样本相关系数(精确到0.01);(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为30元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元?请说明理由.参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其线性回归方程V=α+βU的斜率和截距的最小二乘估计分别为,相关系数r= .解(1)令U=,则Y=a+可转化为Y=a+bU.因为=51,所以=100.所以=51-100×0.41=10.所以Y=10+100U.所以Y关于X的回归方程为Y=10+Y关于U的样本相关系数为r==0.96.(2)①若产品单价为80元,记企业利润为X(单位:元).当订单为9千件时,每件产品的成本为10++30=(元),企业的利润为80-40+×9 000=260 000(元).当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(80-50)×10 000=300 000(元).所以企业利润X的分布列为X260 000300 000P0.70.3 EX=260 000×0.7+300 000×0.3=272 000(元).②若产品单价为70元,记企业利润为Y(单位:元).当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(70-50)×10 000=200 000(元).当订单为11千件时,每件产品的成本为10++30=(元),企业的利润为70-40+×11 000=230 000(元).所以企业利润Y的分布列为Y200 000230 000P0.30.7 EY=200 000×0.3+230 000×0.7=221 000(元).所以EX>EY,故企业要想获得更高利润,产品单价应选择80元.
相关试卷
这是一份高中数学北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性精练,共10页。试卷主要包含了1 相关系数 2等内容,欢迎下载使用。
这是一份高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性当堂检测题,共8页。试卷主要包含了下列两个变量具有正相关关系的是,对变量x,y由观测数据得散点图,下面的变量之间具有相关关系的是等内容,欢迎下载使用。
这是一份北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性测试题
![文档详情页底部广告位](http://img.51jiaoxi.com/images/257d7bc79dd514896def3dc0b2e3f598.jpg)