山东2022-2023学年数学高二下学期期末统计分析专项复习(原卷版+解析版)
展开一、样本相关系数
1. 样本相关系数:r= i=1n (xi−x)(yi−y)i=1n (xi−x)2i=1n (yi−y)2,r为变量x和变量y的样本相关系数,有时也称样本线性相关系数.
2. 样本相关系数r的特征
(1)r∈[-1,1].
(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本
数据的线性相关程度越弱.
2. 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征.
二、一元线性回归模型
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:方程eq \(y,\s\up7(^))=x+eq \(a,\s\up7(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq \(a,\s\up7(^)),是待定参数.
三、残差
(1)残差:观测值减去预测值,称为残差
对于样本点(x1,y1)、(x2,y2)、…、(xn,yn),其回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),用eq \(y,\s\up6(^))作为回归模型eq \b\lc\{\rc\ (\a\vs4\al\c1(y=bx+a+e,Ee=0,De=σ2))中bx+a的估计值,随机误差ei=yi-bxi-a的估计值eq \(e,\s\up6(^))i=yi-eq \(b,\s\up6(^))xi-eq \(a,\s\up6(^))(i=1,2,…,n),称为相应于点(xi,yi)的残差.
(2)残差图
以残差为纵坐标,样本编号(或身高数据,或体重的估计值等)为横坐标作出的图形,称为残差图.
四、分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的__不同类别__,像这样的变量称为分类变量.
(2)列联表:
①列出两个分类变量的频数表,称为列联表.
②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
五、独立性检验的基本思想
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)公式:K2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
(3)独立性检验的具体做法:
①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.
②利用公式计算随机变量K2的观测值k.
③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”
一、单选题
1.(22-23高二下·山东威海·期末)某新能源汽车企业基于领先技术的支持,从某年起改进并生产新车型,设改进后该企业第年的生产利润为(单位:亿元),现统计前年的数据为, ,,,根据该组数据可得关于的回归直线方程为,且,预测改进后该企业第年的生产利润为( )
A.亿元B.亿元
C.亿元D.亿元
【答案】D
【分析】根据样本中心点求得,进而求得预测值.
【详解】,,
所以,所以,
当时,亿元.
故选:D
2.(22-23高二下·山东菏泽·期末)对四组数据进行统计,获得如下散点图,将四组数据相应的相关系数进行比较,正确的是( )
A.B.C.D.
【答案】A
【分析】根据题目给出的散点图,先判断是正相关还是负相关,然后根据点的集中程度分析相关系数的大小.
【详解】由给出的四组数据的散点图可以看出,
图1和图3是正相关,相关系数大于0,
图2和图4是负相关,相关系数小于0,
图1和图2的点相对更加集中,所以相关性要强,所以接近于1,接近于,
由此可得.
故选:A.
3.(22-23高二下·山东德州·期末)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
通过计算有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为( )
附:,其中.
A.15B.65C.16D.66
【答案】D
【分析】根据独立性检验公式列出不等式,进而求解即可.
【详解】因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,
即,
因为函数在时单调递增,
且,,,
所以的最小值为16,
所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故选:D.
4.(22-23高二下·山东枣庄·期末)在对一组成对样本数据进行分析时,从已知数据了解到预报变量随着解释变量的增大而减小,且大致趋于一个确定的值.则下列拟合函数中符合条件的是( )
A.B.
C.D.
【答案】D
【分析】逐项判断各选项中函数的单调性,以及当时,各函数的函数值的变化情况,可得出合适的选项.
【详解】当时,函数为增函数,、、均为减函数,
且当,,,,
故选:D.
5.(22-23高二下·山东青岛·期末)某工厂经过节能降耗技术改造后,在生产其产品的过程中记录的产量x(吨)与相应的生产能耗y(吨)的一些数据如下表所示:
已知根据所给数据得到的y关于x的经验回归方程为,对应的经验回归直线为l.现发现表中有个数据看不清,且用m来表示,则下列说法正确的为( )
A.看不清的数据
B.l过点
C.据该模型可以预测:产量为8吨时,相应的生产能耗为33.2吨
D.l的斜率5.3可以解释为:产量每增加1吨,相应的实际生产能耗就一定能增加5.3吨
【答案】B
【分析】根据经验回归的概念和性质逐项分析判断.
【详解】对于选项A:由题意可得:,则,
可得,解得,故A错误;
对于选项B:因为经验回归直线l过样本中心点,即,故B正确;
对于选项C:令时,则,
所以据该模型可以预测:产量为8吨时,相应的生产能耗为34.2吨,故C错误;
对于选项D:l的斜率5.3可以解释为:产量每增加1吨,相应的实际生产能耗大约增加5.3吨,并不是一定,故D错误;
故选:B.
二、多选题
6.(22-23高二下·山东聊城·期末)年月日,搭载神舟十六号载人飞船的长征二号F遥十六运载火箭在酒泉卫星发射中心发射升空,航天员乘组状态良好,发射取得圆满成功.某学校调查学生对神舟十六号的关注与性别是否有关,随机抽样调查了名学生,进行独立性检验,计算得到,依据表中给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
A.零假设对神舟十六号的关注与性别独立
B.根据小概率值的独立性检验,可以认为对神舟十六号的关注与性别无关
C.根据小概率值的独立性检验,可以认为对神舟十六号的关注与性别不独立,此推断犯错误的概率不大于
D.根据小概率值的独立性检验,可以认为对神舟十六号的关注与性别独立
【答案】ACD
【分析】根据独立性检验逐项判断,可得出合适的选项.
【详解】因为,对于A选项,零假设对神舟十六号的关注与性别独立,A对;
对于B选项,因为,
根据小概率值的独立性检验,可以认为对神舟十六号的关注与性别不独立,此推断犯错误的概率不大于,B错C对;
对于D选项,因为,
根据小概率值的独立性检验,可以认为对神舟十六号的关注与性别独立,D对.
故选:ACD.
7.(2023高二下·山东·期末)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
附表:
经计算得到,下列对地区A天气的判断正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”时夜晚下雨的概率约为
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
【答案】ABC
【分析】根据古典概型的概率公式判断A、B,根据独立性检验的思想判断C、D;
【详解】解:用频率估计概率可得,夜晩下雨的概率约为,所以A正确;
未出现“日落云里走”时夜晚下雨的概率约为,所以B正确;
由,可得有99.9%的把握认为“‘日落云里走’是否出现”
与“当晚是否下雨”有关,所以C正确,D错误.
故选:ABC.
8.(22-23高二下·山东济宁·期末)下列结论中正确的是( )
A.样本相关系数的绝对值越接近1,则成对样本数据的线性相关程度越强
B.样本相关系数的绝对值越接近0,则成对样本数据的线性相关程度越弱
C.已知变量,具有线性相关关系,在获取的成对样本数据,,…,中,,,…,和,,…,的均值分别为和,则点必在其经验回归直线上
D.在残差图中,残差点分布的水平带状区域越宽,说明模型的拟合效果越好
【答案】ABC
【分析】A, B选项根据样本相关系数的意义判断即可;C选项根据样本中心点在经验回归直线上判断;D选项由残差点分布的水平带状区域宽窄说明模型的拟合效果判断.
【详解】选项A,B,由样本相关系数的意义可知,
样本相关系数的绝对值越接近1时,成对样本数据的线性相关程度越强,
样本相关系数的绝对值越接近0,则成对样本数据的线性相关程度越弱
故选项A,B正确;
点必在其经验回归直线上, 故选项C正确;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合效果越好,故选项D错误;
故选:ABC.
9.(22-23高二下·山东泰安·期末)研究变量x,y得到一组样本数据,进行回归分析,以下说法正确的是( )
A.经验回归直线至少经过点,,中的一个
B.若所有样本点都在直线,则这组样本数据的样本相关系数为1
C.在经验回归方程中,当解释变量每增加1个单位时,响应变量平均增加2个单位
D.用决定系数来比较两个模型的拟合效果,越小,模型的拟合效果越差
【答案】BD
【分析】根据成对数据的线性相关关系的样本相关系数和决定系数的定义以及回归方程的概念求解.
【详解】对A,经验回归直线可以不经过点,,中的任意一个,A错误;
对B,因为所有样本点都在直线,
所以样本相关系数为1,B正确;
对C,在经验回归方程中,当解释变量每增加1个单位时,响应变量平均减少2个单位,C错误;
对D,用决定系数来比较两个模型的拟合效果,越小,模型的拟合效果越差,D正确;
故选:BD.
10.(22-23高二下·山东枣庄·期末)下列结论正确的是( )
A.经验回归直线恒过样本点的中心,且在经验回归直线上的样本点越多,拟合效果越好
B.在一个列联表中,由计算得的值,那么的值越大,判断两个变量间有关联的把握就越大
C.若散点图中所有点都在直线上,则相关系数
D.根据分类变量x与y的成对样本数据,计算得.依据的独立性检验,则变量x与y独立
【答案】BD
【分析】根据案例分析的相关知识逐项分析判断.
【详解】对于选项A:经验回归直线恒过样本点的中心,
拟合效果是整体效果,与在经验回归直线上的样本点的多少无关,
如果在经验回归直线上的样本点增多,但其他点偏离程度增大,相应的残差的平方和仍可能会增大,拟合效果也会变差,故A错误;
对于选项B:对于可知:的值越大,判断两个变量间有关联的把握就越大,故B正确;
对于选项C:因为越接近于1,线性相关性越强,
若散点图中所有点都在直线上,则,
但此时为负相关,所以,故C错误;
对于选项D:因为,
依据的独立性检验可知,没有足够的把握认为变量x与y有关,所以变量x与y独立,故D正确;
故选:BD.
三、填空题
11.(22-23高二下·山东菏泽·期末)根据下面的数据:
求得关于的回归直线方程为,则这组数据相对于所求的回归直线方程的4个残差的方差为 .
【答案】0.105/
【分析】分别计算出四个数据的估计值,即可求得残差,继而求得残差的平均数,根据方差公式即可求得答案.
【详解】根据,分别将代入求得分别为:,
则4个残差为,残差的平均数为0,
故残差的方差为,
故答案为:0.105
12.(22-23高二下·山东枣庄·期末)已知变量x和y的统计数据如下表:
若由表中数据得到经验回归直线方程为,则时的残差为 .
【答案】/
【分析】根据数表,求出样本的中心点,进而求出及残差作答.
【详解】依题意,,
于是,即,
当时,,所以时的残差为.
故答案为:
四、解答题
13、(22-23高二下·山东东营·期末)2021年4月7日,“学习强国”上线“强国医生”功能,提供智能导诊、疾病自查、疾病百科、健康宣传等多种医疗健康服务.
(1)为了解“强国医生”使用次数的多少与性别之间的关系,某调查机构调研了200名“强国医生”的使用者,得到表中数据,根据所给数据完成上述表格,并判断是否有 99.9%的把握认为“强国医生”的使用次数与性别有关;
(2)该机构统计了“强国医生”上线7天内每天使用该服务的女性人数,“强国医生”上线的第x天,每天使用“强国医生”的女性人数为y,得到以下数据:
通过观察散点图发现样本点集中于某一条曲线的周围,求y关于x的回归方程,并预测“强国医生”上线第12天使用该服务的女性人数.
附:随机变量
其中参考公式:对于一组数据其回归直线 的斜率和截距的最小二乘估计公式分别为
【答案】(1)表格见解析,有99.9%的把握认为“强国医生”的使用次数与性别有关
(2),3980人
【分析】(1)根据已知数据完成表格,计算出与附表中值作比较可得答案;
(2)将两边同时取常用对数,设,则,求出,可得y关于x的回归方程,把代入回归方程,可得答案.
【详解】(1)
,
所以有99.9%的把握认为“强国医生”的使用次数与性别有关;
(2)将两边同时取常用对数得
,
设,则,
因为,
所以,
所以,
所以y关于x的回归方程为
把代入回归方程,得,
所以“强国医生”上线第12天,使用该服务的女性约有3980人.
14、(22-23高二下·山东威海·期末)某大学在一次调查学生是否有自主创业打算的活动中,获得了如下数据.
(1)若,,根据调查数据判断,是否有的把握认为该校学生有无自主创业打算与性别有关;
(2)若,,从这些学生中随机抽取一人.
(ⅰ)若已知抽到的人有自主创业打算,求该学生是男生的概率;
(ⅱ)判断“抽到的人无自主创业打算”与“抽到的人是男生”是否独立.
附:.
【答案】(1)有的把握认为该校学生有无自主创业打算与性别有关
(2)(ⅰ);(ⅱ)“抽到的人无自主创业打算”与“抽到的人是男生”独立.
【分析】(1)计算卡方,与6.635比较后得到结论;
(2)(ⅰ)设出事件,利用条件概率公式进行求解;
(ⅱ)法一:计算出,得到结论;法二:计算出,得到结论;法三:计算得到,得到结论;法四:计算出卡方为0,从而得到结论.
【详解】(1),
所以有的把握认为该校学生有无自主创业打算与性别有关
(2)(ⅰ)记为“抽到的人有自主创业打算”,为“抽到的人是男生”.
,,
所以(或).
(ⅱ)记为“抽到的人无自主创业打算”,为“抽到的人是男生”,
法一:,又,所以,
所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.
法二:,又,所以,
所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.
法三:,,
,所以,所以,
所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.
法四:,
所以该校学生有无自主创业打算与性别无关,
所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.
15、(22-23高二下·山东聊城·期末)天气越来越热,某冷饮店统计了近六天每天的用电量和对应的销售额,目的是了解二者之间的关系,数据如下表:
(1)该冷饮店做了一次摸奖促销活动,在一个口袋里放有大小、质地完全相同的个红色雪花片和个白色雪花片.若有放回地从口袋中每次摸取个雪花片,连续摸两次,两次摸到的雪花片颜色不同定为一等奖,两次摸到的雪花片颜色相同定为二等奖,试比较中一等奖和中二等奖的概率的大小.
(2)已知两个变量与之间的样本相关系数,请用最小二乘法求出关于的经验回归方程,据此能否预测明年同时期用电量为千瓦时的销售额?如果能,计算出结果;如果不能,请说出理由.
参考公式:,.
相关数据:,.
【答案】(1)中二等奖的概率大
(2),不能,理由见解析
【分析】(1)计算出两次摸到的雪花片颜色不同的概率和两次摸到的雪花片颜色相同的概率,比较大小后可得出结论;
(2)根据相关系数公式结合参考数据可求得,进而可求得的值,根据可求得的值,可得出,由此可得出回归直线方程,再结合经验回归方程有时效性可得出结论.
【详解】(1)解:两次摸到的雪花片颜色不同的概率为,
两次摸到的雪花片颜色相同的概率为,
显然,所以中二等奖的概率大.
(2)解:依题意可得,
所以,
由于,
所以,所以,
因为,,
所以,则,
所以,所以,回归方程为.
因为经验回归方程有时效性,即冷饮受温度影响较大,明年的这个时期的温度不一定和现在相同,
故不能用今年求出的经验回归方程估算明年的情况.
16、(22-23高二下·山东菏泽·期末)电商的兴起,促进了我市经济的发展.已知某电商平台对其牌下一家专营店在2022年3月至7月的营业收入(单位:万元)进行统计,得到以下数据:
(1)依据表中给出的数据,用样本相关系数说明营业收入与月份的相关程度;
(2)试用最小二乘法求出营业收入与月份的一元线性回归方程,并预测当时该专营店的营业收入.
(,)
,.以上各式仅供参考)
【答案】(1),营业收入与月份的相关程度很强
(2)线性回归方程为,当时该专营店的营业收入为万元
【分析】(1)计算出、,、、,代入可得答案;
(2)用最小二乘法求出营业收入与月份的一元线性回归方程,并代入可得答案.
【详解】(1),,
,
,
,
所以,
因为,说明营业收入与月份的相关程度很强,可用线性回归模型拟合与的关系;
(2)由(1),,,
所以关于的线性回归方程为,当时该专营店的营业收入为万元.
17.(22-23高二下·山东德州·期末)2020年11月,国务院办公厅印发《新能源汽车产业发展规划(2021-2035年)》,要求深入实施发展新能源汽车国家战略,推动中国新能源汽车产业高质量可持续发展,加快建设汽车强国.同时为了推广新能源替代传统非绿色能源,除了财政补贴、税收优惠等激励性政策外,可间接通过前期技术研发支持等政策引导能源发展方向.某企业多年前就开始进行新能源汽车方面的研发,现对近10年的年技术创新投入和每件产品成本(,2,3,…,10)的数据进行分析,得到如下散点图,
并计算得:,,,,.
(1)根据散点图可知,可用函数模型拟合y与x的关系,试建立y关于x的回归方程;
(2)已知该产品的年销售额m(单位:千万元)与每件产品成本y的关系为.该企业的年投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入x为何值时,年利润的预报值最大?(注:年利润年销售额年投入成本)
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【答案】(1)
(2)当年技术创新投入为40千万元时,年利润的预报值取最大值
【分析】(1)令,可得出关于的线性回归方程为,利用最小二乘法可求出、的值,即可得出关于的回归方程;
(2)由可得,可计算出年利润关于的函数关系式,结合二次函数的基本性质可求得的最大值及其对应的值.
【详解】(1)令,则y关于u的线性回归方程为,
由题意可得,
,
则,
所以,y关于x的回归方程为.
(2)由可得,
年利润,
当时,年利润M取得最大值,此时,
所以,当年技术创新投入为40千万元时,年利润的预报值取最大值
18.(22-23高二下·山东济宁·期末)为研究在校学生每天玩手机时间是否大于1小时和学生近视之间的关联性,某视力研究机构采取简单随机抽样的方法,调查了2000名在校学生,得到成对样本观测数据,样本中有的学生近视,有的学生每天玩手机超过1小时,而每天玩手机超过1小时的学生近视率为.
(1)根据上述成对样本观测数据,完成如下列联表,并依据小概率值的独立性检验,分析每天玩手机时间是否超过1小时会不会影响视力.
(2)从近视的学生中随机抽取8人,其中每天玩手机时间超过1小时的2人,不超过1小时的6人,现从8人中随机选出3人,设3人中每天玩手机时间超过1小时的学生人数为,求随机变量的分布列.
参考公式:
参考数据:下表是独立性检验中几个常用的小概率值和相应的临界值.
【答案】(1)列联表见解析,长时间(每天超过1小时)玩手机与视力情况有关联
(2)分布列见解析
【分析】(1)先列出列联表,根据独立性检验公式求解即可;
(2)由离散型随机变量的分布列求解.
【详解】(1)
根据列联表中的数据,经计算得到
根据小概率值的独立性检验,我们认为长时间(每天超过1小时)玩手机与视力情况有关联.
(2)随机变量的可能取值为0,1,2.
则,,,
所以的分布列为
19.(22-23高二下·山东泰安·期末)某水果店对某个新品种水果进行试销,需了解试销价(单位:元)对销售量y(单位:件)的影响情况,现得到5组销售数据,并对得到的数据进行初步处理,得到下面的散点图.
(1)由散点图看出,可用线性回归模型拟合y与的关系,请用样本相关系数加以说明;(精确到0.01)
(2)求关于的经验回归方程.
参考公式:经验回归方程中的斜率和截距的最小二乘估计公式分别为:,,样本相关系数,
参考数据:
【答案】(1)答案见解析
(2)
【分析】(1)根据题意计算相关系数,判断y与的相关关系;
(2)利用最小二乘估计公式求出和,即可得到关于的经验回归方程.
【详解】(1),,
,,,
,
由样本相关系数,可以推断y与这两个变量负线性相关,且相关程度很强,从而可以用线性回归模型拟合与的关系.
(2),
, ∴.
20.(22-23高二下·山东泰安·期末)攀岩是一项集健身,娱乐,竞技于一身的极限运动,被称为“峭壁上的芭蕾”.某攀岩俱乐部为了解攀岩爱好者对此项运动的了解程度,进行了一次攀岩知识竞赛(满分10分),为得分在6分以上(含6分)的爱好者颁发了荣誉证书.已知参加本次竞赛的攀岩爱好者共有50人,其中获得荣誉证书的女攀岩爱好者有24人,所有男攀岩爱好者的竞赛成绩如下:
10,5,9,8,6,7,4,8,3,4,8,7,5,9,2,10,8,9,7,8,9,10
(1)根据所给数据,完成下面列联表;
(2)依据小概率值的独立性检验,能否认为获得荣誉证书与性别有关联?
(3)如果把(1)中列联表中所有数据扩大到原来的10倍,在相同的检验标准下,再用独立性检验推断获得荣誉证书与性别之间的关联性,结论还一样吗?请说明理由.
附:,其中.
【答案】(1)表格见解析
(2)不能
(3)结论不一样,原因是每个数据都扩大为原来的10倍,相当于变大为原来的10倍,导致推断结论发生了变化.
【分析】(1)根据已知条件填写列联表;
(2)根据独立性检验原理,先假设,再计算,由此得出结论;
(3)先求出再根据数表判断相关性,对比两次的值可以得出结论说明原因.
【详解】(1)
(2)零假设为:获得荣誉证书与性别无关联.
根据列联表中的数据,经计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为获得荣誉证书与性别无关联.
(3)列联表中所有数据都扩大到原来的10倍后,
,
根据小概率值的独立性检验,推断不成立,即认为获得荣誉证书与性别关联,此推断犯错误的概率不大于.
所以结论不一样,原因是每个数据都扩大为原来的10倍,会导致变大为原来的10倍,导致推断结论发生了变化.
21.(22-23高二下·山东青岛·期末)近年来,各种类型的网约车服务在我国各城市迅速发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在某地的发展情况,某调查机构从该地抽取了6个城市,分别收集和分析了网约车的A,B两项指标数x,y,经过统计分析,它们满足最小二乘法,且y关于x的经验回归方程为.
(1)预测当A指标数为52时,B指标数的估计值.
(2)试求y与x之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系(若,则线性相关程度较强).
附:参考数据:.
相关系数.
【答案】(1)B指标数的估计值为103
(2)0.88,y与x具有较强的线性相关关系
【分析】(1)把代入求解即可;
(2)由求得,再根据相关系数公式即可求解,从而可以判断y与x具有较强的线性相关关系.
【详解】(1)当时,,
当A指标数为52时,B指标数的估计值为103.
(2)因为,所以,
所以相关系数,
因为r>0.75,所以y与x具有较强的线性相关关系.
22.(22-23高二下·山东青岛·期末)某儿童医院用甲、乙两种疗法治疗小儿消化不良,为了检验甲、乙两种疗法的效果差异,采用有放回简单随机抽样的方法抽取了100名患者,部分统计数据如下表: Y
X
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
支持
不支持
男生
女生
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
x
2
3
4
5
6
y
5
6
m
19
25
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
夜晚天气
“日落云里走”
下雨
未下雨
出现的天数
25
5
未出现的天数
25
45
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
1
2
3
4
31.6
52.5
72
91.9
9
9.5
10
10.5
11
11
10
8
6
5
男
女
总计
使用次数多
40
使用次数少
30
总计
90
200
x
1
2
3
4
5
6
7
y
6
11
21
34
66
100
195
0.05
0.02
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
61.9
1.6
51.8
2522
3.98
男
女
总计
使用次数多
40
80
120
使用次数少
50
30
80
总计
90
110
200
男生/人
女生/人
有自主创业打算
无自主创业打算
用电量(千瓦时)
4
7
8
9
14
12
销售额(百元)
月份
3
4
5
6
7
营业收入
10
12
11
12
20
每天玩手机时间
视力情况
合计
近视
不近视
超过1小时
不足1小时
合计
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
每天玩手机时间
视力情况
合计
近视
不近视
超过1小时
200
200
400
不足1小时
600
1000
1600
合计
800
1200
2000
0
1
2
性别
荣誉证书
合计
未获得
获得
男
女
合计
α
0.1
0.01
0.001
性别
荣誉证书
合计
未获得
获得
男
6
16
22
女
4
24
28
合计
10
40
50
高二数学苏教版-期末押题卷01(原卷版+解析版): 这是一份高二数学苏教版-期末押题卷01(原卷版+解析版),文件包含期末押题卷01原卷版docx、期末押题卷01解析版docx等2份试卷配套教学资源,其中试卷共23页, 欢迎下载使用。
浙南名校联盟2022-2023学年高二下学期期末联考数学试题(原卷版+解析版): 这是一份浙南名校联盟2022-2023学年高二下学期期末联考数学试题(原卷版+解析版),共31页。
新教材2022-2023学年高二下学期期末数学试题(原卷版+解析版): 这是一份新教材2022-2023学年高二下学期期末数学试题(原卷版+解析版),共31页。