考点30 相关性、回归分析及独立性检验10种常见考法归类-2023-2024学年高二数学期末导与练(人教A版选择性必修第三册)
展开1、函数关系与相关关系的异同点
2、两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
3、样本相关系数
(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,
现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.
①样本相关系数r的取值范围为[-1,1].
②当r>0时,称成对数据正相关;当r<0时,称成对数据负相关.
③ |r|越接近于1,两个变量的线性相关性越强;
|r|接近于0时,两个变量之间几乎不存在线性相关关系.
注:通常|r|大于0.75时,认为两个变量有很强的线性相关性.
4、一元线性回归模型
(1)一元线性回归模型
称eq \b\lc\{\rc\ (\a\vs4\al\c1(Y=bx+a+e,,Ee=0,De=σ2))为Y关于x的一元线性回归模型.其中Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,如果e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述.
(2)随机误差
在线性回归模型中,和为模型的未知参数,是与之间的误差,通常为随机变量,称为随机误差.它的均值,方程.
线性回归模型的完整表达式为 , 在此模型中,随机误差的方差越小,用预报真实值的精度越高.
5、最小二乘法
将eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的eq \(b,\s\up6(^)),eq \(a,\s\up6(^))叫做b,a的最小二乘估计,其中
,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
①经验回归直线一定过点,点通常称为样本点的中心;
6、残差与残差分析
(1)残差
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq \(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.
(2)残差分析
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为0,方差为σ2的随机变量的观测值.
(3)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
(4)残差平方和法
残差平方和越小,模型的拟合效果越好.
(5)R2法
在回归分析中,可以用来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.
模型的拟合效果用相关指数来表示,,表达式中,与经验回归方程无关,残差平方和与经验回归方程有关,因此,越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差
注:决定系数与相关系数的联系与区别
①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果.
②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为.
③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好.
7、2×2列联表
(1)2×2列联表给出了成对分类变量数据的交叉分类频数.
(2)定义一对分类变量X和Y,我们整理数据如下表所示:
像这种形式的数据统计表称为2×2列联表.
最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
注:分类变量与列联表的实际应用
利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq \f(a,a+b)与eq \f(c,c+d)eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
8、独立性检验
(1)定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
(2)χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
注:①卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.
②当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.
(3)有关“相关的检验”
用χ2进行“相关的检验”步骤
①零假设:即先假设两变量间没关系.
②计算χ2:套用χ2的公式求得χ2值.
③查临界值:结合所给小概率值α查得相应的临界值xα.
④下结论:比较χ2与xα的大小,并作出结论.
(4)有关“无关的检验”
运用独立性检验的方法
①列出2×2列联表,根据公式计算χ2.
②比较χ2与xα的大小作出结论.
(5)独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
③根据检验规则得出推断结论.
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
注:独立性检验和反证法:反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
(6)下表给出了产独立性检验中几个常用的小概率值和相应的临界值
(7)临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
考点一 相关系数的计算
考点二 样本中心的计算及应用
考点三 求线性回归方程
考点四 线性回归分析
(一)残差分析
(二)求相关指数
考点五 求非线性回归方程
考点六 等高堆积条形图的应用
考点七 独立性检验
考点八 独立性检验与频率分布直方图交汇
考点九 独立性检验与相关系数交汇
考点十 独立性检验与概率交汇
考点一 相关系数的计算
1.【多选】(2023春·山西太原·高二统考期中)对于样本相关系数,下列说法正确的是( )
A.的取值范围是
B.越大,相关程度越弱
C.越接近于0,成对样本数据的线性相关程度越强
D.越接近于1,成对样本数据的线性相关程度越强
2.【多选】(2023秋·辽宁辽阳·高二校联考期末)已知关于变量x,y的4组数据如表所示:
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )
A.B.变量x,y正相关C.D.
3.(2023秋·河南开封·高三统考期末)某加工工厂加工产品A,现根据市场调研收集到需加工量X(单位:千件)与加工单价Y(单位:元/件)的四组数据如下表所示:
根据表中数据,得到Y关于X的线性回归方程为,其中.
(1)若某公司产品A需加工量为1.1万件,估计该公司需要给该加工工厂多少加工费;
(2)通过计算线性相关系数,判断Y与X是否高度线性相关.
参考公式: ,时,两个相关变量之间高度线性相关.
4.(2023秋·四川凉山·高二宁南中学校考期末)已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据:,,,.
参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为
,.
考点二 样本中心的计算及应用
5.(2023春·天津和平·高二天津市第二南开中学校考期中)如果记录了,的几组数据分别为,,,,那么y关于x的经验回归直线必过点( )
A.B.C.D.
6.(2023秋·江西宜春·高二校考期末)已知两个变量和之间存在线性相关关系,某兴趣小组收集了一组,的样本数据如下表所示:
根据表中数据利用最小二乘法得到的回归方程是( )
A.B.
C.D.
7.(2023春·天津南开·高二天津四十三中校考期中)已知变量x和y的统计数据如表:
根据上表可得回归直线方程,据此可以预测当时,( ).
A.9.2B.9.5C.9.9D.10.1
8.(2023秋·广西河池·高三统考期末)近年来,“考研热”持续升温,2022年考研报考人数官方公布数据为457万,相比于2021年增长了80万之多,增长率达到21%以上.考研人数急剧攀升原因较多,其中,本科毕业生人数增多、在职人士考研比例增大,是两大主要因素.据统计,某市各大高校近几年的考研报考总人数如下表:
根据表中数据,可求得y关于x的线性回归方程为,则m的值为___________.
9.(2023秋·四川成都·高二校考期末)根据某市有关统计公报显示,随着“一带一路”经贸合作持续深化,该市对外贸易近几年持续繁荣,2017年至2020年每年进口总额x(单位:千亿元)和出口总额y(单位:千亿元)之间的一组数据如下:
若每年的进出口总额x,y满足线性相关关系,则______;若计划2022年出口总额达到5千亿元,预计该年进口总额为______千亿元
10.【多选】(2023·广东深圳·统考二模)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):
假设经验回归方程为,则( )
A.
B.当时,y的预测值为2.2
C.样本数据y的40%分位数为0.8
D.去掉样本点后,x与y的样本相关系数r不变
考点三 求线性回归方程
11.(2023秋·四川巴中·高二统考期末)为助力四川新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
(1)根据以上数据,求y关于x的线性回归方程;
(2)若该产品成本是4元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?
(参考公式:回归方程,其中,).
12.(2023春·四川成都·高二成都七中校考期中)某企业生产的某种乳制品的蛋白质含量x(%)与生产成本y(元)之间的数据如下表:
已知生产成本y与产品蛋白质含量x之间具有线性相关关系.
(1)求生产成本y关于蛋白质含量x的回归方程;
(2)根据(1)的结果,若公司准备将生产成本提高到60至70元,则判断生产的乳制品蛋白质含量的取值范围.(精确到小数点后两位)
参考公式:.
参考数据:,,.
13.(2023春·山西太原·高二统考期中)随着时代的不断发展,社会对高素质人才的需求不断扩大,我国本科毕业生中考研人数也不断攀升,2020年的考研人数是341万人,2021年考研人数是377万人.某中学数学兴趣小组统计了本省15所大学2022年的毕业生人数及考研人数(单位:千人),经计算得:,,,.
(1)利用最小二乘估计建立关于的线性回归方程;
(2)该小组又利用收集的数据建立了关于的线性回归方程,并把这两条拟合直线画在同一坐标系下,横坐标,纵坐标的意义与毕业人数和考研人数一致.
①比较前者与后者的斜率与的大小;
②求这两条直线公共点的坐标.
附:关于的回归方程中,斜率和截距的最小二乘估计公式分别为:,;
相关系数:.
14.(2023春·河南焦作·高二统考期中)研究表明,过量的碳排放会导致全球气候变暖等环境问题,减少碳排放具有深远的意义.中国明确提出节能减排的目标与各项措施,工业和信息化部在2022年新能源汽车推广应用中提出了财政补贴政策后,某新能源汽车公司的销售量逐步提高,如图是该新能源汽车公司在2022年1~5月份的销售量y(单位:万辆)与月份x的折线图.
(1)依据折线图计算x,y的相关系数r,并据此说明可用线性回归模型拟合y与x的关系;(若,则线性相关程度很强,可用线性回归模型拟合)
(2)请建立y关于x的线性回归方程,并预测2022年8月份的销售量.
参考数据及公式:,相关系数,
在线性回归方程中,.
15.(2023春·江苏南京·高二南京师范大学附属中学江宁分校校考期中)人类命运共同体的提法讲中国梦融入世界梦,充分展现了中国的大国担当,中国在第届联合国大会上承诺,将采取更加有力的政策和措施,力争于年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用为了解某一地区纯电动汽车销售情况,一机构调查了该地区某家企业近个月的产值情况,如下表,由散点图知,产值(亿元)与月份代码线性相关.
(1)求与的线性回归方程,并预测明年月份该企业的产值;
(2)该机构还调查了该地区位购车车主的性别与购车种类情况,得到的数据如下表:
以样本的频率估计概率,从该地区所有购车车主中随机选取位,设为人中购买非电动车的男性人数,求的概率分布和数学期望.
参考公式:,.
考点四 线性回归分析
(一)残差分析
16.(2023秋·浙江宁波·高三期末)已知变量x和y的统计数据如下表:
如果由表中数据可得经验回归直线方程为,那么,当时,残差为______.(注:残差=观测值-预测值)
17.(2023春·山西太原·高二统考期中)已知回归方程,而试验中的一组数据是,,,则其残差平方和是______.
18.(2023秋·江苏南通·高三统考期末)经验表明,树高与胸径具有线性关系,为了解回归方程的拟合效果,利用下列数据计算残差,用来绘制残差图.
则残差的最大值和最小值分别是( )
A.0.4,-1.8B.1.8,-0.4C.0.4,-0.7D.0.7,-0.4
19.(2023秋·辽宁·高二辽河油田第二高级中学校考期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为,则表中m的值为__________.
20.【多选】(2023春·湖南张家界·高二慈利县第一中学校考期中)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样本点数据,则下列结论正确的是( )
A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点
B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心
C.若以模型拟合该组数据,为了求出回归方程,设,将其变换后得到线性方程,则a,h的估计值分别是3和6
D.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
(二)求相关指数
21.(2023春·浙江杭州·高二杭州四中校考期中)关于线性回归的描述,下列命题错误的是( )
A.回归直线一定经过样本点的中心B.残差平方和越小,拟合效果越好
C.决定系数越接近1,拟合效果越好D.残差平方和越小,决定系数越小
22.【多选】(2023春·浙江杭州·高二杭州市长河高级中学校考期中)进入21世纪以来,全球二氧化碳排放量增长迅速,自2000年至今,全球二氧化碳排放量增加了约40%,我国作为发展中国家,经济发展仍需要大量的煤炭能源消耗.下图是2016—2020年中国二氧化碳排放量的统计图表(以2016年为第1年).利用图表中数据计算可得,采用某非线性回归模型拟合时,;采用一元线性回归模型拟合时,线性回归方程为,.则下列说法正确的是( )
A.由图表可知,二氧化碳排放量y与时间x正相关
B.由决定系数可以看出,线性回归模型的拟合程度更好
C.利用线性回归方程计算2019年所对应的样本点的残差为-0.30
D.利用线性回归方程预计2025年中国二氧化碳排放量为107.24亿吨
23.(2023春·四川成都·高二统考期中)某种农作物可以生长在滩涂和盐碱地,它的灌溉是将海水稀释后进行灌溉.某实验基地为了研究海水浓度(%)对亩产量(吨)的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
绘制散点图发现,可以用线性回归模型拟合亩产量(吨)与海水浓度(%)之间的相关关系,用最小二乘法计算得与之间的线性回归方程为.
(1)求的值;(参考公式:)
(2)统计学中常用相关指数来刻画回归效果,越大,回归效果越好,如假设,就说明预报变量的差异有是解释变量引起的.请计算相关指数(精确到0.01),并指出亩产量的变化多大程度上是由灌溉海水浓度引起的?
附残差相关指数其中
考点五 求非线性回归方程
24.(2023春·四川成都·高二统考期中)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是( )
A.B.
C.D.
25.(2023秋·四川遂宁·高二统考期末)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:
由上表可得经验回归方程,则当x=35时,蝗虫的产卵量y的估计值为( )
A.B.C.8D.
26.(2023春·浙江宁波·高二宁波市北仑中学校考期中)为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场,得到天数与直播间人数的数据如下表所示:
(1)求直播间人数y和与日期代码x的样本相关系数(精确到0.01);
(2)若使用作为y关于x的回归方程模型,计算该回归方程(结果保留1位小数),并预测至少要到哪一天直播间人数可以超过30万人.
参考公式和数据:相关系数,其中,回归直线方程中,
27.(2023春·河南南阳·高二校联考期中)某研发小组为了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响,结合近10年的年研发资金投入量和年销售额的数据(1,2,…10),建立了两个函数模型:①,②,其中α,β,λ,t均为常数,e为自然对数的底数.设,(1,2,…10),经过计算得如下数据.
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型.
(2)①根据(1)中选择的模型及表中数据,建立y关于x的回归方程(系数精确到0.01);
②当年研发资金投入量约为亿元时,年销售额大致为亿元,若正数a,b满足,求的最小值.
参考公式:相关系数,
线性回归直线中斜率和截距的最小二乘法估计参数分别为,.
28.(2023春·山西·高二统考期中)某生产制造企业统计了近10年的年利润(千万元)与每年投入的某种材料费用(十万元)的相关数据,作出如下散点图:
选取函数作为每年该材料费用和年利润的回归模型.若令,则,得到相关数据如表所示:
(1)求出与的回归方程;
(2)计划明年年利润额突破1亿,则该种材料应至少投入多少费用?(结果保留到万元)参考数据:.
29.(2023秋·辽宁阜新·高二校考期末)某县依托种植特色农产品,推进产业园区建设,致富一方百姓.已知该县近年人均可支配收入如下表所示,记年为,年为,…以此类推.
(1)使用两种模型:①;②的相关指数分别约为,,请选择一个拟合效果更好的模型,并说明理由;
(2)根据(1)中选择的模型,试建立关于的回归方程.(保留位小数)
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,令,.
30.(2023秋·广西南宁·高三南宁二中校考期末)2020年,是人类首次成功从北坡登顶珠峰60周年,也是中国首次精确测定并公布珠峰高程的45周年.华为帮助中国移动开通珠峰峰顶5G,有助于测量信号的实时开通,为珠峰高程测量提供通信保障,也验证了超高海拔地区5G信号覆盖的可能性,在持续高风速下5G信号的稳定性,在条件恶劣地区通过简易设备传输视频信号的可能性.正如任总在一次采访中所说:“华为公司价值体系的理想是为人类服务.”有人曾问,在珠峰开通5G的意义在哪里?“我认为它是科学技术的一次珠峰登顶,告诉全世界,华为5G、中国5G的底气来自哪里.现在,5G的到来给人们的生活带来更加颠覆性的变革,某IT公司基于领先技术的支持,5G经济收入在短期内逐月攀升,该IT公司在1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.
(1)根据散点图判断,与(a,b,c,d均为常数)哪一个更适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司7月份的5G经济收入.(结果保留小数点后两位)
(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X,求X的分布列和数学期望.参考数据:
其中,设(i=1,2,3,4,5,6).
参考公式:对于一组具有线性相关关系的数据(,)(i=1,2,3,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为,.
31.(2023秋·重庆沙坪坝·高三重庆南开中学校考期末)2021年3月1日,国务院新闻办公室举行新闻发布会,工业和信息化部长肖亚庆先生提出了芯片发展的五项措施,进一步激励国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入(亿元)与科技升级直接纯收益(亿元)的数据统计如下:
当时,建立了与的两个回归模型:模型①:;模型②:;当时,确定与满足的线性回归方程为.
(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型.
(附:刻画回归效果的相关指数,)
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,应用(1)的结论,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
(附:线性回归方程的系数关系:)
(3)科技升级后,“麒麟”芯片的效率大幅提高,经实际试验得大致服从正态分布.公司对科技升级团队的奖励方案如下:若芯片的效率不超过,不予奖励:若芯片的效率超过,但不超过,每部芯片奖励2元;若芯片的效率超过,每部芯片奖励4元.记为每部芯片获得的奖励,求(精确到0.01).
(附:若随机变量,则,)
考点六 等高堆积条形图的应用
32.(2023春·陕西宝鸡·高二校联考阶段练习)不可以判断两个变量是否有关系的是( )
A.散点图B.列联表
C.等高条形图D.频率分布直方图
33.(2023春·四川成都·高二统考期中)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
34.(2023春·宁夏中卫·高二中卫中学校考阶段练习)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:
根据图中的信息,下列结论中不正确的是( )
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
35.(2023·高二课时练习)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
考点七 独立性检验
36.(2023春·内蒙古赤峰·高二校考阶段练习)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验.经计算,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动有系”.
A.B.C.D.
37.【多选】(2023春·河南南阳·高二统考期中)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附:
A.50B.45C.40D.35
38.(2023春·辽宁阜新·高二校联考阶段练习)足球运动是深受学生喜爱的一项体育运动,为了研究是否喜爱足球运动与学生性别的关系,从某高校男女生中各随机抽取80名学生进行调查问卷,得到如下数据():
若有90%以上的把握认为是否喜爱足球运动与学生性别有关,则m的最小值为( )
附:.其中.
A.17B.15C.13D.11
39.(2023春·陕西西安·高二校考期中)为培养学生对传统文化的兴趣,某市从甲,乙两所学校各抽取100名学生参加传统文化知识竞赛,竞赛成绩分为优秀和非优秀两个等级,成绩统计如表:
(1)甲,乙两所学校竞赛成绩优秀的频率分别是多少?
(2)能否有95%的把握认为甲校成绩优秀与乙校成绩优秀有差异?
40.(2023春·河南郑州·高三校考阶段练习)某小区的住房结构有A和B两种户型,从中各随机抽取40户,调查他们的月平均电费,所得数据如下:
(1)分别估计该小区A户型和B户型居民的月平均电费低于200元的概率;
(2)根据列联表,能否有99%的把握认为该小区居民的月平均电费与所居住的户型有关?
附:,其中.
考点八 独立性检验与频率分布直方图交汇
41.(2023春·高二课时练习)某企业为响应国家在《“十四五”工业绿色发展规划》中提出的“推动绿色发展,促进人与自然和谐共生”的号召,推进产业结构高端化转型,决定开始投入生产某新能源配件.该企业初步用甲、乙两种工艺进行试产,为了解两种工艺生产新能源配件的质量情况,从两种工艺生产的产品中分别随机抽取了100件进行质量检测,得到下图所示的频率分布直方图,规定:质量等级包含合格和优等两个等级,综合得分在的是合格品,得分在的是优等品.
(1)通过计算,比较甲、乙两种工艺生产的配件的综合平均得分哪个更高?(同一组中的数据用该组区间的中点值作代表)
(2)根据频率分布直方图完成下面的列联表,并判断是否有的把握认为新能源配件的质量等级与生产工艺有关?
附:,其中.
42.(2023春·江西南昌·高二南昌十中校考阶段练习)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了个网箱,测量各箱水产品的产量(单位:),其频率分布直方图如下:
(1)根据频率分布直方图,填写下面列联表;
(2)根据小概率=0.01的独立性检验,分析箱产量与养殖方法是否有关?
(,)
43.(2023秋·浙江嘉兴·高三统考期末)为积极响应“反诈”宣传教育活动的要求,某企业特举办了一次“反诈”知识竞赛,规定:满分为100分,60分及以上为合格.该企业从甲、乙两个车间中各抽取了100位职工的竞赛成绩作为样本.对甲车间100位职工的成绩进行统计后,得到了如图所示的成绩频率分布直方图.
(1)估算甲车间职工此次“反诈”知识竞赛的合格率;
(2)若将频率视为概率,以样本估计总体.从甲车间职工中,采用有放回的随机抽样方法抽取3次,每次抽1人,每次抽取的结果相互独立,记被抽取的3人次中成绩合格的人数为.求随机变量的分布列;
(3)若乙车间参加此次知识竞赛的合格率为,请根据所给数据,完成下面的列联表,并根据列联表判断是否有的把握认为此次职工“反计”知识竞赛的成绩与其所在车间有关?
2×2列联表
附参考公式:①,其中.
②独立性检验临界值表
44.(2023春·高二课时练习)2022年11月江西省第十六届运动会在江西省九江市举行,本届省运会为全省人民呈现了一场精彩纷呈、令人难忘的“视听盛宴”和“文体大餐”,也极大地激发了九江市民运动的热情.为了更好的宣传省运会,九江市某高校决定举办主题为“圆梦浔阳城拼搏向未来”的体育知识竞赛活动,现从参加体育知识竞赛活动的学生中随机抽取了200名学生,将他们的比赛成绩(满分为100分),分为6组:,,,,,,得到如图所示的频率分布直方图.
(1)求a的值;
(2)在抽取的200名学生中,规定比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为比赛成绩是否优秀与性别有关?
附:(其中)
考点九 独立性检验与相关系数交汇
45.(2023·高二课时练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表:
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表:
(1)根据所给数据知,可用线性回归模型拟合与的关系,请用相关系数加以说明;(值精确到0.01)
(2)完成下面的列联表,并判断是否有的把握认为参与管理的意愿与该村村民的性别有关.
参考公式:,其中.
参考数据:.
临界值表:
46.(2023春·宁夏银川·高三银川一中校考阶段练习)人类命运共同体的提法将中国梦融入世界梦,充分展现了中国的大国担当.在第75届联合国大会上中国承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标"),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;
①参考数据:;
②参考公式:(i)线性回归方程:,其中;
(ii)相关系数:,若,则可判断与线性相关较强.
③参考临界值表:
47.(2023春·河北·高三校联考阶段练习)小家电指除大功率、大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,运用场景广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元),其中年份对应的代码依次为.
(1)由上表数据可知,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的经验回归方程(系数精确到0.01);
(3)某传媒公司为了了解中国智能小家电消费者年龄分布,随机调查了200名消费者,统计这200名消费者年龄,按照青少年与中老年分为两组,得到如下列联表:
依据的独立性检验,能否认为是否喜欢购买智能小家电与年龄有关?
参考数据:
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.
附:
48.(2023春·高二课时练习)热心网友们调查统计了柳州市某网红景点在2022年6月至10月的旅游收入y(单位:万元),得到以下数据:
(1)根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?若可以,求出y关于x之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,网友们随机抽查了200名游客,得到如图列联表,请填写2×2列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”?
参考数据:,
注:r与的计算结果精确到0.001.参考公式:相关系数,
线性回归方程:,其中,,
.
临界值表:
49.(2023春·山东滨州·高二校考阶段练习)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
(1)求新能源乘用车的销量关于年份的线性相关系数,并判断与是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关;
参考公式:,,其中.,若,则可判断与线性相关.
附表:
考点十 独立性检验与概率交汇
50.(2023秋·四川乐山·高三校考阶段练习)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%,学校为了考察学生对寄宿生活适应与否是否与性别有关,构建了如下2×2列联表:
(1)请将2×2列联表补充完整,并判断是否有99%的把握认为“适应寄宿生活与否”与性别有关;
(2)从男生中以“是否适应寄宿生活”为标准采用分层抽样的方法随机抽取5人,再从这5人中随机抽取2人,求所选2名学生都“适应寄宿生活”的概率..
附:,其中.
51.(2023春·山西·高二统考期中)为了实现五育并举,鼓励学生在学好文化知识的同时也要锻炼好身体,某学校随机抽查了100名学生,统计他们每天参加体育运动的时间,并把他们之中每天参加体育运动时间大于或等于60分钟的记为“达标”,运动时间小于60分钟的记为“不达标”,统计情况如下图:
(1)完成列联表,并判断能否在犯错误的概率不超过0.025的前提下认为“运动达标”与“性别”有关.
(2)现从“不达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2人进行体育运动指导,求选中的2人都是女生的概率.
参考数据:
52.(2023春·广东深圳·高二校考期中)某企业生产的产品按质量分为一等品和二等品,该企业计划对现有生产设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取200件产品作为样本,产品的质量情况统计如下表:
附:
(1)判断能否在犯错误的概率不超过的前提下,认为该企业生产的这种产品的质量与设备改造有关;
(2)按照分层抽样的方法,从设备改造前的产品中取得了5件产品,其中有3件一等品和2件二等品.现从这5件产品中任选3件,记所选的一等品件数为,求的分布列及均值;
(3)根据市场调查,企业每生产一件一等品可获利100元,每生产一件二等品可获利60元,在设备改造后,用先前所取的200个样本的频率估计总体的概率,记生产1000件产品企业所获得的总利润为,求的均值.
函数关系
相关关系
相同点
两者均是指两个变量之间的关系
不同点
是一种确定性关系
是一种非确定性的关系
是两个变量之间的关系
①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系
不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型
是一种更为一般的情况
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
x
6
8
10
12
y
a
10
6
4
X
6
8
10
12
Y
12
m
6
4
1
2
3
4
5
0.5
0.6
1
1.4
1.5
x
1
2
3
4
5
y
5
5
6
6
8
年份
2018
2019
2020
2021
2022
年份序号x
1
2
3
4
5
报考人数y(万人)
1. 1
1.6
2
2.5
m
2017年
2018年
2019年
2020年
x
1.8
2.2
2.6
3.0
y
2.0
2.8
3.2
4.0
x
1
2
3
4
5
y
0.5
0.8
1
1.2
1.5
单价x(元/件)
8
8.2
8.4
8.6
8.8
9
销量y(万件)
90
84
83
80
75
68
x
0
0.69
1.39
1.79
2.40
2.56
2.94
y
19
32
40
44
52
53
54
月份
月
月
月
月
月
月份代码
产值(亿元)
购买非电动车
购买电动车
总计
男性
女性
总计
x
6
7
8
9
10
y
3.5
4
5
5.5
7
胸径x/cm
18.2
19.1
22.3
24.5
26.2
树高的观测值y/m
18.9
19.4
20.8
22.8
24.8
树高的预测值
18.6
19.3
21.5
23.0
24.4
x
3
4
5
6
y
2
3
5
海水浓度(%)
3
4
5
6
7
亩产量(吨)
0.57
0.53
0.44
0.36
0.30
残差
-0.01
0.02
m
n
0
x
20
23
25
27
30
z
2
2.4
3
3
4.6
日期
第一天
第二天
第三天
第四天
第五天
第六天
第七天
日期代码x
1
2
3
4
5
6
7
直播间人数y(万人)
4
12
21
23
25
27
28
666
140
3268
1.2
206.4
13.2
2.65
10.8
7.39
20
66
770
200
14
460
4.20
3125000
0.308
21500
31.5
15
15
49.5
年份
年份代号
人均可支配收入(万元)
月份x
1
2
3
4
5
6
收入y(百万元)
6.6
8.6
16.1
21.6
33.0
41.0
3.50
21.15
2.85
17.70
125.35
6.73
4.57
14.30
序号
1
2
3
4
5
6
7
8
9
10
11
12
2
3
4
6
8
10
13
21
22
23
24
25
13
22
31
42
50
56
58
68.5
68
67.5
66
66
回归模型
模型①
模型②
回归方程
182.4
79.2
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
喜爱
不喜爱
男生
女生
0.25
0.10
0.05
0.001
k
2.072
2.706
3.841
6.635
优秀人数
非优秀人数
合计
甲校
60
40
100
乙校
70
30
100
合计
130
70
200
月平均电费
低于200元
不低于200元
A户型
32
8
B户型
18
22
0.100
0.050
0.010
2.706
3.841
6.635
合格品
优等品
合计
甲生产工艺
乙生产工艺
总计
养殖法
箱产量
合计
箱产量
箱产量
旧养殖法
新养殖法
合计
甲车间
乙车间
合计
合格人数
不合格人数
合计
成绩性别
优秀
非优秀
总计
男生
80
女生
100
总计
200
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
愿意参与管理
不愿意参与管理
男性村民
140
60
女性村民
40
愿意参与管理
不愿意参与管理
合计
男性村民
140
60
女性村民
40
合计
0.050
0.010
0.001
3.841
6.635
10.828
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
年份代码
1
2
3
4
5
市场规模
0.9
1.2
1.5
1.4
1.6
青少年
中老年
合计
喜欢购买智能小家电
80
不喜欢购买智能小家电
60
合计
110
200
0.10
0.010
0.001
2.706
6.635
10.828
月份x
6
7
8
9
10
旅游收入y
10
12
11
12
20
喜欢
不喜欢
总计
男
100
女
60
总计
110
0.010
0.005
0.001
6.635
7.879
10.828
年份
2014
2015
2016
2017
2018
销量(万台)
8
10
13
25
24
购置传统燃油车
购置新能源车
总计
男性车主
6
24
女性车主
2
总计
30
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
不适应寄宿生活
适应寄宿生活
合计
男生
女生
合计
运动达标
运动不达标
总计
男生
女生
总计
0.25
0.10
0.05
0.025
0.010
0.001
1.323
2.706
3.841
5.024
6.635
10.828
一等品
二等品
合计
设备改造前
120
80
200
设备改造后
150
50
200
合计
270
130
400
通关练37 相关性、回归分析及独立性检验-2023-2024学年高二数学期末导与练(人教A版选择性必修第三册): 这是一份通关练37 相关性、回归分析及独立性检验-2023-2024学年高二数学期末导与练(人教A版选择性必修第三册),文件包含通关练37相关性回归分析及独立性检验-高二数学题型归纳与解题策略人教A版选择性必修第三册原卷版docx、通关练37相关性回归分析及独立性检验-高二数学题型归纳与解题策略人教A版选择性必修第三册解析版docx等2份试卷配套教学资源,其中试卷共57页, 欢迎下载使用。
考点26 二项式定理9种常见考法归类-2023-2024学年高二数学期末导与练(人教A版选择性必修第三册): 这是一份考点26 二项式定理9种常见考法归类-2023-2024学年高二数学期末导与练(人教A版选择性必修第三册),文件包含考点26二项式定理9种常见考法归类-高二数学题型归纳与解题策略人教A版选择性必修第三册原卷版docx、考点26二项式定理9种常见考法归类-高二数学题型归纳与解题策略人教A版选择性必修第三册解析版docx等2份试卷配套教学资源,其中试卷共47页, 欢迎下载使用。
考点20 数列13种常见考法归类-2023-2024学年高二数学期末导与练(人教A版选择性必修第二册): 这是一份考点20 数列13种常见考法归类-2023-2024学年高二数学期末导与练(人教A版选择性必修第二册),文件包含考点20数列13种常见考法归类-高二数学题型归纳与解题策略人教A版选择性必修第二册原卷版docx、考点20数列13种常见考法归类-高二数学题型归纳与解题策略人教A版选择性必修第二册解析版docx等2份试卷配套教学资源,其中试卷共78页, 欢迎下载使用。