2025高考数学一轮复习-9.3-成对数据的统计分析【课件】
展开
这是一份2025高考数学一轮复习-9.3-成对数据的统计分析【课件】,共60页。PPT课件主要包含了知识诊断基础夯实,变量的相关关系,一条直线,样本相关系数,-11,一元线性回归模型,BCD,考点突破题型剖析,角度1线性回归分析,年利润z的预报值等内容,欢迎下载使用。
ZHISHIZHENDUANJICHUHANGSHI
(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在__________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:
(2)相关系数r的性质①当r>0时,称成对样本数据____相关;当r6.635=x0.01,∴认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.
3.某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算χ2=7.069,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过( )A.0.1% B.1% C.99% D.99.9%
由此散点图,在10 ℃至40 ℃之间,下面四个经验回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x
4.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
解析 由散点图可以看出,这些点大致分布在对数型函数的图象附近.
5.(易错题)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.
根据小概率值α=0.01的独立性检验,可以得到的结论是_______________________________.
生育意愿与城市级别有关
6.若某商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表所示的对应数据:
∴样本中心为(5,54),
KAODIANTUPOTIXINGPOUXI
根据表中数据,下列说法正确的是( )A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系
1.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
解析 由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.
解析 观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.
2.下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
解析 在两个变量y与x的回归模型中,它们的决定系数R2越接近1,模型拟合效果越好,在四个选项中A的决定系数最大,所以拟合效果最好的是模型1.
4.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数R2如下,其中拟合效果最好的模型是( )A.模型1的决定系数R2为0.98B.模型2的决定系数R2为0.80C.模型3的决定系数R2为0.50D.模型4的决定系数R2为0.25
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);
例1 (2021·广州模拟)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示:
∴可用线性回归模型拟合y与x的关系.
(2)求y关于x的经验回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少.附:相关系数
∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.
例2 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
角度2 非线性回归分析
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
解 ①由(2)知,当x=49时,年销售量y的预报值
②根据(2)的结果知,年利润z的预报值
故年宣传费为46.24千元时,年利润的预报值最大.
训练1 下图是某地区2005年至2021年环境基础设施投资额y(单位:亿元)的折线图.
利用模型②,该地区2023年的环境基础设施投资额的预测值为
(1)分别利用这两个模型,求该地区2023年的环境基础设施投资额的预测值;
(ⅰ)从折线图可以看出,2005年至2021年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2005年至2021年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解 利用模型②得到的预测值更可靠.理由如下:
(ⅱ)从计算结果看,相对于2021年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
例3 某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
解 由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
解 一天中到该公园锻炼的平均人次的估计值为
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,能否在犯错误的概率不超过0.05的前提下,认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
零假设为H0:一天中到该公园锻炼的人次与该市当天的空气质量无关.根据列联表得
解 根据所给数据,可得2×2列联表:
根据小概率值α=0.050的χ2独立性检验,可推断H0不成立,所以在犯错误的概率不超过0.05的前提下,可认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
训练2 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
解 需假设H0为:甲机床的产品质量与乙机床的产品质量无差异.根据题表中的数据可得
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.此推断犯错误的概率不大于0.01.
FENCENGXUNLIAN GONGGUTISHENG
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是( )
解析 观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.
则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?( )A.甲 B.乙 C.丙 D.丁
2.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r与残差平方和m,如下表:
解析 r越大,m越小,线性相关性越强.
A.4.2亿元 B.4.4亿元C.5.2亿元 D.5.4亿元
3.某公司在2015~2019年的收入与支出情况如下表所示:
解析 由-0.7<0,得变量x,y之间成负相关关系,故A正确;
6.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算χ2≈4.762,则可以推断出( )
因为χ2≈4.762>3.841=x0.05,认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过0.05,故C正确,D错误.
8.某市物价部门对本市的5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元/件)和销售量y(件)的数据如下表所示:
又m+n=20,所以m=10,n=10.
解析 χ2≈3.918≥3.841=x0.05,所以认为“这种血清能起到预防感冒的作用”,这种推断犯错误的概率不超过0.05.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
9.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知x0.05=3.841.则下列结论中,正确结论的序号是________.①认为“这种血清能起到预防感冒的作用”犯错误的概率不超过0.05;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
10.某城市地铁将于2023年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:
解 “赞成定价者”的月平均收入为
(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
“认为价格偏高者”的月平均收入为
∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).
(2)由以上统计数据填下面2×2列联表,依据小概率值α=0.01的独立性检验,可否认为“月收入以55百元为分界点对地铁定价的态度有差异”.
解 根据条件可得2×2列联表如下:
∴根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为“月收入以55百元为分界点对地铁定价的态度没有差异”.
零假设为H0:月收入以55百元为分界点对地铁定价的态度无差异.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
解 样本(xi,yi)(i=1,2,…,20)的相关系数为
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
解 分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
12.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( )A.若χ2=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B.由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D.以上三种说法都不正确
解析 独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误.
解析 令t=x2,则曲线的经验回归方程变为线性的经验回归方程,
根据数据特点,甲认为样本点分布在指数型曲线y=2bx+a的周围,据此他对数据进行了一些初步处理.如下表:
14.《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入x(百万元)与收益y(百万元)的数据统计如下:
相关课件
这是一份2025版高考数学全程一轮复习第九章统计与成对数据的统计分析第三节成对数据的统计分析课件,共60页。PPT课件主要包含了课前自主预习案,课堂互动探究案,正相关,负相关,预测值,是否独立,答案C,答案A,答案73,答案D等内容,欢迎下载使用。
这是一份2025年高考数学一轮复习-成对数据的统计分析【课件】,共47页。PPT课件主要包含了基础知识·诊断,变量的相关关系,样本相关系数,一元线性回归模型,题组1走出误区,题组2走进教材,题组3走向高考,考点聚焦·突破等内容,欢迎下载使用。
这是一份2025年高考数学一轮复习-7.3-统计与成对数据的统计分析【课件】,共60页。PPT课件主要包含了基础知识过关,PARTONE,核心素养例析,PARTTWO,课时作业,PARTTHREE等内容,欢迎下载使用。