新教材2022届高考数学人教版一轮复习课件:10.2 成对数据的统计分析
展开【教材回扣】1.变量间的相关关系(1)如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________的趋势,我们称这两个变量正相关.(2)如果当一个变量的值增加时,另一个变量的相应值呈现________的趋势,则称这两个变量负相关.(3)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,称这两个变量线性相关.
2.样本相关系数r=当r>0时,成对样本数据______相关.当r<0时,成对样本数据______相关.当|r|越接近1时,成对样本数据的线性相关程度_____.当|r|越接近0时,成对样本数据的线性相关程度_____.
4.列联表与独立性检验(1)分类变量:以区别不同的现象或性质的随机变量,称为分类变量.(2)列联表列出成对分类变量数据的_____________,称为2×2列联表.关于分类变量X和Y的2×2列联表:
利用χ2= 的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
题组二 教材改编1.变量x与y的成对样本数据的散点图如下图所示,据此可以推断变量x与y之间( )A.很可能存在负相关 B.一定存在正相关C.很可能存在正相关 D.一定不存在负相关
2.根据分类变量x与y的成对样本数据,计算得到χ2=2.974.依据α=0.05的独立性检验,结论为( )A.变量x与y不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.05C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.05
解析:由题意知χ2=2.974<3.841=x0.05所以认为X和Y独立,这个结论犯错误的概率不超过0.05,故选D.
解析:当x=175时,y=0.81×175+25.25=167(cm).
题组三 易错自纠1.某医疗机构通过抽样调查(样本容量n=1 000),利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关.计算得χ2=4.453,经查阅临界值表知χ2=4.453>3.841=x0.05,现给出四个结论,其中正确的是( )A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”
解析:由题意知在犯错误的概率不超过0.05的前提下认为患肺病与吸烟有关,故有95%的把握认为患肺病与吸烟有关.故选C.
题型一 变量的相关关系的判断 [例1] (1)某商家2020年上半年各月的人均销售额(单位:千元)与利润率统计表如下.
根据表中数据,下列说法正确的是( )A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系
解析:由统计表可得利润率与人均销售额不是正比例函数关系,也不是反比例函数关系,排除C和D,其属于正相关关系,A正确,B错误,故选A.
解析:由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以经验回归直线的斜率应为正数,且从散点图观察经验回归直线的斜率应该比y=x的斜率要小一些,综上可知应选B.
巩固训练1:(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关
解析:由散点图可得两组数据均线性相关,且图①的经验回归方程斜率为负.图②的经验回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.故选C.
(2)变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A.r2
题型二 经验回归方程及应用[例2] [2021·山东济南外国语学校检测]我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱;(已知:0.75≤|r|≤1,则认为y与x的线性相关性很强;0.3≤|r|<0.75,则认为y与x的线性相关性一般;|r|≤0.25,则认为y与x的线性相关性较弱)(2)求y关于x的经验回归方程,并预测该地区2020年足球特色学校的个数(精确到个).
巩固训练2:某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 015,z=y-5得到下表2:
题型三 独立性检验[例3] [2020·新高考Ⅰ卷]为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
(3)根据(2)的列联表得χ2=≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
类题通法应用独立性检验解决实际问题的环节(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
巩固训练3:[2021·山东青岛检测]2020年1月22日,国新办发布消息:新型冠状病毒来源于武汉一家海鲜市场非法销售的野生动物,专家通过全基因组比对发现此病毒与2003年的非典冠状病毒以及此后的中东呼吸综合征冠状病毒,分别达到70%和40%的序列相似性.这种新型冠状病毒对人们的健康生命带来了严重威胁.因此,某生物疫苗研究所加紧对新冠病毒疫苗进行实验,并将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如表:
附:χ2= ,n=a+b+c+d.
[预测1] 核心素养——数据分析、数学运算某工厂生产某种型号的农机具零配件,为了预测今年7月份该型号农机具零配件的市场需求量,以合理安排生产,工厂对本年度1月份至6月份该型号农机具零配件的销售量及销售单价进行了调查,销售单价x(单位:元)和销售量y(单位:千件)之间的6组数据如下表所示:(1)根据1至6月份的数据,求y关于x的经验回归方程(系数精确到0.01);
(2)结合(1)中的经验回归方程,假设该型号农机具零配件的生产成本为每件3元,那么工厂如何制定7月份的销售单价,才能使该月利润达到最大?(计算结果精确到0.1)
解析:根据折线图可知15名志愿者身高的极差小于臂展的极差,故A正确;根据散点图以及回归方程得到,15名志愿者身高和臂展成正相关关系,故B正确;将x=190代入回归方程中可得到臂展估计值为189.65厘米,故C正确;身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,样本点并不一定都在回归直线上,故D不正确.故选ABC.
状 元 笔 记 非线性回归直线方程的求解回归分析中,依据描述自变量与因变量之间因果关系的函数表达式是线性的,还是非线性的,分为线性回归分析和非线性回归分析.通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题处理.
[典例] 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
2025高考数学一轮复习-9.3-成对数据的统计分析【课件】: 这是一份2025高考数学一轮复习-9.3-成对数据的统计分析【课件】,共60页。PPT课件主要包含了知识诊断基础夯实,变量的相关关系,一条直线,样本相关系数,-11,一元线性回归模型,BCD,考点突破题型剖析,角度1线性回归分析,年利润z的预报值等内容,欢迎下载使用。
2025年高考数学一轮复习-成对数据的统计分析【课件】: 这是一份2025年高考数学一轮复习-成对数据的统计分析【课件】,共47页。PPT课件主要包含了基础知识·诊断,变量的相关关系,样本相关系数,一元线性回归模型,题组1走出误区,题组2走进教材,题组3走向高考,考点聚焦·突破等内容,欢迎下载使用。
2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件: 这是一份2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件,共60页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,样本相关系数,2经验回归方程,2独立性检验,答案C,典例突破等内容,欢迎下载使用。