所属成套资源:【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用)
- 专题8.1 马尔科夫链(与数列结合的概率递推问题)-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用) 试卷 3 次下载
- 专题8.3 25类排列组合常考小题汇总-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用) 试卷 1 次下载
- 专题8.2 二项式定理16类常考问题汇总-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用) 试卷 1 次下载
- 专题8.4 四大分布:二项分布,超几何分布,正态分布(13类题型)-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用) 试卷 2 次下载
- 专题8.5 条件概率与全概率公式,贝叶斯公式8类题型-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用) 试卷 1 次下载
专题8.6 独立性检验与回归方程14类题型-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用)
展开
这是一份专题8.6 独立性检验与回归方程14类题型-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用),文件包含专题8-6独立性检验与回归方程14类题型原卷版docx、专题8-6独立性检验与回归方程14类题型解析版docx等2份试卷配套教学资源,其中试卷共110页, 欢迎下载使用。
TOC \ "1-3" \n \h \z \u \l "_Tc156322038" 题型一 独立性检验
\l "_Tc156322039" 题型二 独立性检验与超几何分布
\l "_Tc156322040" 题型三 独立性检验与二项式分布
\l "_Tc156322041" 题型四 独立性检验与正态分布
\l "_Tc156322042" 题型五 样本中心的计算及应用
\l "_Tc156322043" 题型六 相关系数的计算
\l "_Tc156322044" 题型七 求线性回归直线方程(结合相关系数与二项式分布,超几何分布,正态分布)
\l "_Tc156322045" 题型八 残差分析
\l "_Tc156322046" 题型九 相关指数
\l "_Tc156322047" 题型十 求非线性回归方程:幂函数方程拟合
\l "_Tc156322048" 题型十一 求非线性回归方程:指数函数方程拟合
\l "_Tc156322049" 题型十二 求非线性回归方程:对数函数方程拟合
\l "_Tc156322050" 题型十三 回归方程与独立性检验
\l "_Tc156322051" 题型十四 相关系数与独立性检验
独立性检验
独立性检验的基本步骤
(1) 提出零假设:X和Y相互独立(即X和Y无关)
(2) 根据联表给出的数据算出(其中),得到随机变量,并与临界值xα比较.
(3) 根据实际问题需要的可信程度(小概率值α)确定临界值“X与Y有关系”,这种推断犯错误的概率不超过,即成立;否则就说没有的把握认为“X与Y有关系”,即不成立.
(4)下表给出了产独立性检验中几个常用的小概率值和相应的临界值
(5)临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
线性回归方程
解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
最小二乘法
将eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的eq \(b,\s\up6(^)),eq \(a,\s\up6(^))叫做b,a的最小二乘估计,其中
,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
回归模型的处理方法
幂函数型:(n为常数,a,x,y均取正值),两边取常用对数,即,
令,,原方程变为,然后按线型回归模型求出,.
指数函数方程:1.直接设指数求解;2.取对数化简,再设对数求解
对数函数方程:1.直接设对数求解;2.对指数型取对数
残差与残差分析
(1)残差
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq \(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.
(2)残差分析
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为0,方差为σ2的随机变量的观测值.
(3)残差计算思路∶先求出回归方程y=bx+a(b,a直接套公式即可),然后把表格中每一个x值通过方程算出对应的每一个y值,最后与表格中的y值对应相减即可。数据点和它在回归直线上相应位置的差异yi-yi是随机误差的效应,称 ei=yi-yi为残差
残差计算公式∶实际观察值与估计值(拟合值)之间的差
(4)残差图
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
(5)残差平方和法
残差平方和越小,模型的拟合效果越好.
(6)R2
在回归分析中,可以用来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.
模型的拟合效果用相关指数来表示,,表达式中,与经验回归方程无关,残差平方和与经验回归方程有关,因此,越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差
注:决定系数与相关系数的联系与区别
①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果.
②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为.
③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好.
重点题型·归类精练
题型一 独立性检验
某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验.经计算,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动有系”.
A.B.C.D.
足球运动是深受学生喜爱的一项体育运动,为了研究是否喜爱足球运动与学生性别的关系,从某高校男女生中各随机抽取80名学生进行调查问卷,得到如下数据():
若有90%以上的把握认为是否喜爱足球运动与学生性别有关,则m的最小值为( )
附:.其中.
A.17B.15C.13D.11
“村BA”后,贵州“村超”又火出圈!所谓“村超”,其实是目前火爆全网的贵州乡村体育赛事一一榕江(三宝侗寨)和美乡村足球超级联赛,被大家简称为“村超”.“村超”的民族风、乡土味、欢乐感,让每个人尽情享受着足球带来的快乐.
某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各50名进行调查,部分数据如表所示:
附:χ2=n(ad−bc)2a+bc+da+cb+d.
(1)根据所给数据完成上表,依据α=0.005的独立性检验,能否有99.5%的把握认为该中学学生喜欢足球与性别有关?
(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范定点射门.据统计,这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人进球相互独立,求3人进球总次数X的分布列和数学期望.
题型二 独立性检验与超几何分布
民族要复兴,乡村要振兴,合作社助力乡村产业振兴,农民专业合作社已成为新型农业经营主体和现代农业建设的中坚力量,为实施乡村振兴战略作出了巨大的贡献.已知某主要从事手工编织品的农民专业合作社共有100名编织工人,该农民专业合作社为了鼓励工人,决定对“编织巧手”进行奖励,为研究“编织巧手”是否与年龄有关,现从所有编织工人中抽取40周岁以上(含40周岁)的工人24名,40周岁以下的工人16名,得到的数据如表所示.
(1)请完成答题卡上的2×2列联表,并根据小概率值α=0.010的独立性检验,分析“编织巧手”与“年龄”是否有关;
(2)为进一步提高编织效率,培养更多的“编织巧手”,该农民专业合作社决定从上表中的非“编织巧手”的工人中采用分层抽样的方法抽取6人参加技能培训,再从这6人中随机抽取2人分享心得,求这2人中恰有1人的年龄在40周岁以下的概率.
参考公式:,其中.
参考数据:
2023年实行新课标新高考改革的省市共有29个,选科分类是高级中学在校学生生涯规划的重要课题,某高级中学为了解学生选科分类是否与性别有关,在该校随机抽取100名学生进行调查.统计整理数据得到如下的2×2列联表:
(1)依据小概率值α=0.05的独立性检验,能否据此推断选科分类与性别有关联?
(2)在以上随机抽取的女生中,按不同选择类别同比例分层抽样,共抽取6名女生进行问卷调查,然后在被抽取的6名女生中再随机抽取4名女生进行面对面访谈.设面对面访谈的女生中选择历史类的人数为随机变量X,求随机变量X的分布列和数学期望.
附:χ2=n(ad−bc)2a+bc+da+cb+d,其中n=a+b+c+d.
2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件A= “了解亚运会项目”, B= “学生为女生”,据统计PAB=35,PBA=23.
附:χ2=nad−bc2a+bc+da+cb+d,n=a+b+c+d.
(1)根据已知条件,填写下列2×2列联表,并依据α=0.001的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?
(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为X,求X的分布列和数学期望.
杭州第19届亚运会又称“2022年杭州亚运会”,是继1990年北京亚运会、2010年广州亚运会之后,中国第三次举办亚洲最高规格的国际综合性体育赛事.某高校部分学生十分关注杭州亚运会,若将累计关注杭州亚运会赛事消息50次及以上的学生称为“亚运会达人”,未达到50次的学生称为“非亚运会达人”.现从该校随机抽取100名学生,得到数据如表所示:
(1)补全列联表,并判断能否有99%的把握认为是否为“亚运会达人”与性别有关?
(2)现从样本的“亚运会达人”中按性别采用分层抽样的方法抽取6人,然后从这6人中随机抽取3人,记这3人中女生的人数为X,求X的分布列和数学期望.
附:,.
题型三 独立性检验与二项式分布
2023年9月23日第19届亚运会在中国杭州举行,其中电子竞技第一次列为正式比赛项目.某中学对该校男女学生是否喜欢电子竞技进行了调查,随机调查了男女生人数各200人,得到如下数据:
(1)根据表中数据,采用小概率值的独立性检验,能否认为该校学生对电子竞技的喜欢情况与性别有关?
(2)为弄清学生不喜欢电子竞技的原因,采用分层抽样的方法从调查的不喜欢电子竞技的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,求“至少抽到一名男生”的概率;
(3)将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对电子竞技喜欢的人数为,求的数学期望.
参考公式及数据:,其中.
为学习贯彻中央农村工作会议精神“强国必先强农,农强方能国强”,某市在某村积极开展香菇种植,助力乡村振兴.香菇的生产可能受场地、基料、水分、菌种等因素的影响,现已知香菇有菌种甲和菌种乙两个品种供挑选,菌种甲在温度时产量为28吨/亩,在温度30℃时产量为20吨/亩;菌种乙在温度20℃时产量为22吨/亩,在气温时产量为30吨/亩.
(1)请补充完整2×2列联表,根据2×2列联表和小概率值的独立性检验,判断菌种甲、乙的产量与温度是否有关?
(2)某村选择菌种甲种植,已知菌种甲在气温为时的发芽率为,从菌种甲中任选3个,若设为菌种甲发芽的个数,求的分布列及数学期望.
附:参考公式:,其中.
临界值表:
某市某部门为了了解全市中学生的视力情况,采用比例分配的分层随机抽样方法抽取了该市120名中学生,已知该市中学生男女人数比例为7:5,他们的视力情况统计结果如表所示:
(1)请把表格补充完整,并根据小概率值α=0.01的独立性检验,判断近视是否与性别有关;
(2)如果用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的概率,且每名同学是否近视相互独立.现从该市中学生中任选4人,设随机变量X表示4人中近视的人数,求X的分布列及均值.
附:χ2= nad−bc2a+bc+da+cb+d,其中n=a+b+c+d.
sinαcsβ=12sinα+β+sinα−β,csαsinβ=12sinα+β−sinα−β,csαcsβ=12csα+β+csα−β,sinαsinβ=−12csα+β−csα−β这组公式被称为积化和差公式,最早正式发表于16世纪天文学家乌尔索斯1588年出版的《天文学基础》一书中.在历史上,对数出现之前,积化和差公式被用来将乘除运算化为加减运算.在现代工程中,积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一、高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占35,其他相关数据如下表:
(1)请完成2×2列联表,依据小概率值α=0.001的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?
(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.
附:χ2=nad−bc2a+bc+da+cb+d,n=a+b+c+d
随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人):
(1)完成如表;对于以上数据,采用小概率值α=0.01的独立性检验,能否认为我市市民网购与性别有关联?
(2)①现从所抽取的女市民中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
②将频率视为概率,从我市所有参与调查的市民中随机抽取20人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.
参考公式:χ2=nad−bc2a+bc+da+cb+d.常用的小概率值和对应的临界值如下表:
某中医研究所研制了一种治疗A疾病的中药,为了解其对A疾病的作用,要进行双盲实验.把60名患有A疾病的志愿者随机平均分成两组,甲组正常使用这种中药,乙组用安慰剂代替中药,全部疗期后,统计甲、乙两组的康复人数分别为20和5.
(1)根据所给数据,完成下面2×2列联表,并判断是否有99.9%的把握认为使用这种中药与A疾病康复有关联?
(2)若将乙组未用药(用安慰剂代替中药)而康复的频率视为这种疾病的自愈概率,现从患有A疾病的人群中随机抽取3人,记其中能自愈的人数为X,求X的分布列和数学期望.
附表:
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
注:双盲实验:是指在实验过程中,测验者与被测验者都不知道被测者所属的组别,(实验组或对照组),分析者在分析资料时,通常也不知道正在分析的资料属于哪一组.旨在消除可能出现在实验者和参与者意识当中的主观偏差和介入偏好.安慰剂:是指没有药物治疗作用,外形与真药相像的片、丸、针剂.
某企业生产的产品按质量分为一等品和二等品,该企业计划对现有生产设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取200件产品作为样本,产品的质量情况统计如下表:
附:
(1)判断能否在犯错误的概率不超过的前提下,认为该企业生产的这种产品的质量与设备改造有关;
(2)按照分层抽样的方法,从设备改造前的产品中取得了5件产品,其中有3件一等品和2件二等品.现从这5件产品中任选3件,记所选的一等品件数为,求的分布列及均值;
(3)根据市场调查,企业每生产一件一等品可获利100元,每生产一件二等品可获利60元,在设备改造后,用先前所取的200个样本的频率估计总体的概率,记生产1000件产品企业所获得的总利润为,求的均值.
题型四 独立性检验与正态分布
新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是50岁以上人群,该病毒进入人体后有潜伏期.潜伏期是指病原体侵入人体至最早出现临床症状的这段时间,潜伏期越长,感染到他人的可能性越高,现对400个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.2,方差为,如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,50岁以上人数占70%,长期潜伏人数占25%,其中50岁以上长期潜伏者有60人.
(1)请根据以上数据完成列联表,并根据小概率的独立性检验,是否可以认为“长期潜伏”与年龄有关;
单位:人
(2)假设潜伏期X服从正态分布,其中近似为样本平均数,近似为样本方差,现在很多省市对入境旅客一律要求隔离14天,请结合原则通过计算概率解释其合理性.
附:,其中.
若,,,.
某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,数据如下:
单位:人
(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?
(2)现有足球、篮球、跳绳供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种,且他们的选择情况相互独立互不影响.已知在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件B为“甲、乙两名学生的选择不同”,判断事件、是否独立,并说明理由.
②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数增加10,该校有1000名学生,预估经过训练后该校每分钟跳182个以上人数(结果四舍五入到整数).
参考公式和数据:,其中;
若,则,,.
为调查学生数学建模能力的总体水平,某地区组织10000名学生(其中男生4000名,女生6000名)参加数学建模能力竞赛活动.
(1)若将成绩在70,85的学生定义为“有潜力的学生”,经统计,男生中有潜力的学生有2500名,女生中有潜力的学生有3500名,完成下面的2×2列联表,并判断是否有99.9%的把握认为学生是否有潜力与性别有关?
(2)经统计,男生成绩的均值为80,方差为49,女生成绩的均值为75,方差为64.
(ⅰ)求全体参赛学生成绩的均值μ及方差σ2;
(ⅱ)若参赛学生的成绩X服从正态分布Nμ,σ2,试估计成绩在61,93的学生人数.
参考数据:
①
②若X∼Nμ,σ2,则Pμ−σ≤X≤μ+σ=0.6827,Pμ−2σ≤X≤μ+2σ=0.9545,Pμ−3σ≤X≤μ+3σ=0.9973.
参考公式:K2=nad−bc2a+bc+da+cb+d,n=a+b+c+d.
某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布Nμ,σ2,其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
并依据小概率值α=0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:Pμ−σ≤X≤μ+σ=0.6827;Pμ−2σ≤X≤μ+2σ=0.9545;Pμ−3σ≤X≤μ+3σ=0.9973.χ2=nad−bc2a+bc+da+cb+dn=a+b+c+d
题型五 样本中心的计算及应用
如果记录了,的几组数据分别为,,,,那么y关于x的经验回归直线必过点( )
A.B.C.D.
下列说法中正确的有 (填正确说法的序号).
①回归直线恒过点,且至少过一个样本点;
②若样本数据的方差为4,则数据的标准差为4;
③已知随机变量,且,则;
④若线性相关系数越接近1,则两个变量的线性相关性越弱;
⑤是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两个变量不相关.
已知两个变量和之间存在线性相关关系,某兴趣小组收集了一组,的样本数据如下表所示:
根据表中数据利用最小二乘法得到的回归方程是( )
A.B.
C.D.
已知变量x和y的统计数据如表:
根据上表可得回归直线方程,据此可以预测当时,( ).
A.9.2B.9.5C.9.9D.10.1
近年来,“考研热”持续升温,2022年考研报考人数官方公布数据为457万,相比于2021年增长了80万之多,增长率达到21%以上.考研人数急剧攀升原因较多,其中,本科毕业生人数增多、在职人士考研比例增大,是两大主要因素.据统计,某市各大高校近几年的考研报考总人数如下表:
根据表中数据,可求得y关于x的线性回归方程为,则m的值为___________.
(多选)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):
假设经验回归方程为,则( )
A.
B.当时,y的预测值为2.2
C.样本数据y的40%分位数为0.8
D.去掉样本点后,x与y的样本相关系数r不变
题型六 相关系数的计算
(多选)对于样本相关系数,下列说法正确的是( )
A.的取值范围是
B.越大,相关程度越弱
C.越接近于0,成对样本数据的线性相关程度越强
D.越接近于1,成对样本数据的线性相关程度越强
(多选)已知关于变量x,y的4组数据如表所示:
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )
A.B.变量x,y正相关C.D.
题型七 求线性回归直线方程(结合相关系数与二项式分布,超几何分布,正态分布)
近年来,“直播带货”成为一种常见的销售方式,某果农2018年至2022年通过直播销售水果的年利润(单位:万元)如表所示:
(1)由表中的数据判断,能否用线性回归模型拟合与的关系?请用相关系数加以说明(精确到0.01);
(2)建立关于的线性回归方程,并预测2025年该果农通过直播销售水果的利润.
参考数据:,,.
参考公式:相关系数,
回归方程中斜率和截距的最小二乘估计公式分别为,.
比亚迪, 这个在中国乘用车市场嶡露头角的中国品牌, 如今已经在全球汽车品牌销量前十中占据一席之地.这一成就不仅是比亚迪的里程硨,更是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.比亚迪旗下的宋plus自2020年9月上市以来,在SUV车型中的月销量遥遥领先,现统计了自上市以来截止到2023年8月的宋plus的月销量数据.
(1)通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了汽车的月销量,现将残差过大的数据剔除掉,得到2022年8月至2023年8月部分月份月销量(单位:万辆)和月份编号的成对样本数据统计.
请用样本相关系数说明与之间的关系可否用一元线性回归模型拟合?若能,求出关于的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到0.01)(若,则线性相关程度很高,可用一元线性回归模型拟合)
(2)为庆祝2023年“双节”(中秋节和国庆节),某地店特推出抽奖优惠活动,奖项共设一、二、三等奖三个奖项,其中一等奖、二等奖、三等奖分别奖励1万元、5千元、2千元,抽中一等奖、二等奖、三等奖的概率分别为.现有甲、乙两人参加了抽奖活动(每人只有一次抽奖机会),假设他们是否中奖相互独立,求两人所获奖金总额超过1万元的概率.
参考公式:样本相关系数,.
参考数据:,.
已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据:,,,.
参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为,.
某骑行爱好者近段时间在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分与对应用时(单位:小时)如下表:
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数如以说明;
(2)建立关于的回归方程.
参考数据和参考公式:相关系数,,,.
火车晚点是人们在旅行过程中最常见的问题之一,针对这个问题,许多人都会打电话进行投诉.某市火车站为了解每年火车的正点率对每年顾客投诉次数(单位:次)的影响,对近8年(2015年~2022年)每年火车正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
(1)求关于的经验回归方程;若预计2024年火车的正点率为,试估算2024年顾客对火车站投诉的次数;
(2)根据顾客对火车站投诉的次数等标准,该火车站这8年中有6年被评为“优秀”,2年为“良好”,若从这8年中随机抽取3年,记其中评价“良好”的年数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
,
直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货销售金额稳步提升,以下是该公司2023年前6个月的带货金额:
(1)根据统计表中的数据,计算变量与的样本相关系数,并判断两个变量与的相关程度(若,则认为相关程度较强;否则没有较强的相关程度,精确到0.01);
(2)若与的相关关系拟用线性回归模型表示,试求关于的经验回归方程,并据此预测2023年10月份该公司的直播带货金额(精确到整数).
附:经验回归方程,其中,
样本相关系数;
参考数据:.
为助力四川新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
(1)根据以上数据,求y关于x的线性回归方程;
(2)若该产品成本是4元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?
(参考公式:回归方程,其中,).
人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:
(1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);
(2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).
附:线性回归方程y=bx+a,其中b=i=1n(xi−x)(yi−y)i=1nxi−x2=i=1nxiyi−nxyi=1nxi2−nx2;
相关系数r=i=1n(xi−x)(yi−y)i=1nxi−x2i=1nyi−y2=i=1nxiyi−nxyi=1nxi2−nx2i=1nyi2−ny2;
参考数据:i=16yi=5724,i=16xiyi=26734,i=16(yi−y)2=20070.
网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数yi和时间第xi天间的数据,列表如下:
由表中给出的数据是否可用线性回归模型拟合人数y与时间x之间的关系?若可用,估计8月10日到该专营店购物的人数(人数用四舍五入法取整数;若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合,计算r时精确到0.01).
参考数据:4340≈65.88.附:相关系数r=i=1nxi−xyi−yi=1nxi−x2i=1nyi−y2,回归直线方程的斜率b=i=1nxi−xyi−yi=1nxi−x2,截距a=y−bx.
题型八 残差分析
已知变量x和y的统计数据如下表:
如果由表中数据可得经验回归直线方程为,那么,当时,残差为______.(注:残差=观测值-预测值)
已知回归方程,而试验中的一组数据是,,,则其残差平方和是______.
经验表明,树高与胸径具有线性关系,为了解回归方程的拟合效果,利用下列数据计算残差,用来绘制残差图.
则残差的最大值和最小值分别是( )
A.0.4,-1.8B.1.8,-0.4C.0.4,-0.7D.0.7,-0.4
某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为,则表中m的值为__________.
(多选)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样本点数据,则下列结论正确的是( )
A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点
B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心
C.若以模型拟合该组数据,为了求出回归方程,设,将其变换后得到线性方程,则a,h的估计值分别是3和6
D.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
题型九 相关指数
关于线性回归的描述,下列命题错误的是( )
A.回归直线一定经过样本点的中心B.残差平方和越小,拟合效果越好
C.决定系数越接近1,拟合效果越好D.残差平方和越小,决定系数越小
(多选)进入21世纪以来,全球二氧化碳排放量增长迅速,自2000年至今,全球二氧化碳排放量增加了约40%,我国作为发展中国家,经济发展仍需要大量的煤炭能源消耗.下图是2016—2020年中国二氧化碳排放量的统计图表(以2016年为第1年).利用图表中数据计算可得,采用某非线性回归模型拟合时,;采用一元线性回归模型拟合时,线性回归方程为,.则下列说法正确的是( )
A.由图表可知,二氧化碳排放量y与时间x正相关
B.由决定系数可以看出,线性回归模型的拟合程度更好
C.利用线性回归方程计算2019年所对应的样本点的残差为-0.30
D.利用线性回归方程预计2025年中国二氧化碳排放量为107.24亿吨
某种农作物可以生长在滩涂和盐碱地,它的灌溉是将海水稀释后进行灌溉.某实验基地为了研究海水浓度(%)对亩产量(吨)的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
绘制散点图发现,可以用线性回归模型拟合亩产量(吨)与海水浓度(%)之间的相关关系,用最小二乘法计算得与之间的线性回归方程为.
(1)求的值;(参考公式:)
(2)统计学中常用相关指数来刻画回归效果,越大,回归效果越好,如假设,就说明预报变量的差异有是解释变量引起的.请计算相关指数(精确到0.01),并指出亩产量的变化多大程度上是由灌溉海水浓度引起的?
附残差相关指数其中
题型十 求非线性回归方程:幂函数方程拟合
为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
表中,.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?
附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
某县依托种植特色农产品,推进产业园区建设,致富一方百姓.已知该县近年人均可支配收入如下表所示,记年为,年为,…以此类推.
(1)使用两种模型:①;②的相关指数分别约为,,请选择一个拟合效果更好的模型,并说明理由;
(2)根据(1)中选择的模型,试建立关于的回归方程.(保留位小数)
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,令,.
为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y(单位:gm3)与样本对原点的距离x(单位:m)的数据,并作了初步处理,得到了下面的一些统计理的值.(表中ui=1xi,u=19i=19ui)
(1)利用样本相关系数的知识,判断y=a+bx与y=c+dx哪一个更适宜作为平均金属含量y关于样本对原点的距离x的回归方程类型?
(2)根据(1)的结果回答下列问题:
①建立y关于x的回归方程;
②样本对原点的距离x=20时,金属含量的预报值是多少?
附:对于一组数据t1,s1,t2,s2,⋅⋅⋅,tn,sn,其线性相关系数r=i=1nti−tsi−si=1nti−t2i=1nsi−s2,其回归直线s=α+βt的斜率和截距的最小二乘估计分别为:β=i=1nti−tsi−si=1nti−t2,α=s−βt.
数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
参考数据t=1x1:
参考公式:对于一组数据(u1,v1),(u2,v2),⋯,(un,vn),其经验回归方程v=a+βμ的斜率和截距的最小二乘估计分别为β=i=1nμiνi−nμνi=1nμi2−nμ2,a=v−βμ.
(1)赛前小明进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:
现用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程;(a,b用分数表示)
(2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为23,且各局之间相互独立,设比赛X局后结束,求随机变量X的分布列及均值.
在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布N(0.54,0.022),而化肥施肥量因农作物的种类不同每亩也存在差异.
(1)假设生产条件正常,记X表示化肥的有效利用率,求P(X≥0.56);
(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为x(单位:公斤),粮食亩产量为y(单位:百公斤)
参考数据:
ti=lnxi,zi=lnyi(i=1,2,…,10).
(i)根据散点图判断,y=a+bx与y=cxd,哪一个适宜作为该农作物亩产量y关于每亩化肥施用量x的回归方程(给出判断即可,不必说明理由);
(ii)根据(i)的判断结果及表中数据,建立y关于x的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量y的值.(e≈2.7)
附:①对于一组数据(ui,vi)(i=1,2,3,…,n),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=i=1nuivi−nuvi=1nui2−nu2,α=v−βu;
②若随机变量X∼N(μ,σ2),则P(μ−σ0,对上述数据进行初步处理,其中vi=lnxi,wi=lnyi,i=1,2,…,6.
附:①可能用到的数据:i=16viwi=75.3,i=16vi=24.6,i=16wi=18.3,i=16vi2=101.4.
②对于一组数据v1,w2,v2,w2,…,vn,wn,其回归直线w=bv+a的斜率和截距的最小二乘估计值分别为b=i=1nvi−vwi−wi=1nvi−v2=i=1nviwi−nvwi=1nvi2−nv2,a=w−bv.
(1)根据所给数据,求y关于x的回归方程.
(2)按照相关部门的指标测定,当套票价格x∈49,81时,该套票受消费者的欢迎程度更高,可以被认定为“热门套票”.现有三位游客,每人从以上六款套票中购买一款旅游,购买任意一款的可能性相等.若三人买的套票各不相同,记三人中购买“热门套票”的人数为X,求随机变量X的分布列和期望.
当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:
(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程;
(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.
参考数据:i=16ui=28.5,i=16xiui=106.05,其中,ui=lnyi
参考公式:对于一组数据xi,yii=1,2,3,⋅⋅⋅,n,其经验回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=i=1nxiyi−nx⋅yi=1nxi2−nx2,a=y−bx
题型十二 求非线性回归方程:对数函数方程拟合
为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场,得到天数与直播间人数的数据如下表所示:
(1)求直播间人数y和与日期代码x的样本相关系数(精确到0.01);
(2)若使用作为y关于x的回归方程模型,计算该回归方程(结果保留1位小数),并预测至少要到哪一天直播间人数可以超过30万人.
参考公式和数据:相关系数,其中,回归直线方程中,
某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是( )
A.B.
C.D.
放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数xi与该机场飞往A地航班放行准点率yi(i=1,2,⋯,10)(单位:百分比)的统计数据所作的散点图及经过初步处理后得到的一些统计量的值.
其中ti=lnxi−2012,t=110i=110ti
(1)根据散点图判断,y=bx+a与y=clnx−2012+d哪一个适宜作为该机场飞往A地航班放行准点率y关于年份数x的经验回归方程类型(给出判断即可,不必说明理由),并根据表中数据建立经验回归方程,由此预测2023年该机场飞往A地的航班放行准点率.
(2)已知2023年该机场飞往A地、B地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往A地航班放行准点率的估计值,且2023年该机场飞往B地及其他地区(不包含A、B两地)航班放行准点率的估计值分别为80%和75%,试解决以下问题:
(i)现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;
(ii)若2023年某航班在该机场准点放行,判断该航班飞往A地、B地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.
附:(1)对于一组数据u1,v1,u2,v2,…,un,vn,其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=i=1nui−uvi−vi=1nui−u2=i=1nuivi−nu⋅vi=1nui2−nu2,α=v−βu
参考数据:ln10≈2.30,ln11≈2.40,ln12≈2.48.
《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yii=1,2,3,⋯,10的数据,得到如图所示的散点图.
(1)利用散点图判断,y=a+bx和y=c+dlnx哪一个更适合作为观看人次x和销售量y的回归方程类型;(只要给出判断即可,不必说明理由)
(2)对数据作出如下处理:得到相关统计量的值如表:
其中令ωi=lnxi,ω=110i=110ωi.根据(1)的判断结果及表中数据,求y关于x的回归方程,并预测当观看人次为280万人时的销售量;
(3)规定:观看人次大于等于120万人次的主播为优秀主播,从这10名主播中随机抽取3名,记其中优秀主播的人数为X,求X的分布列和数学期望.
参考数据和公式:ln2≈0.69,ln7≈1.95
附:对于一组数据u1,v1,u2,v2,…,un,vn,其回归线v=α+βu的斜率和截距的最小二乘估计分别为:β=i=1nui−uvi−vi=1nui−u2,α=v−βu.
某剧场的座位数量是固定的,管理人员统计了最近在该剧场举办的五场表演的票价xi(单位:元)和上座率yi(上座人数与总座位数的比值)的数据,其中i=1,2,3,4,5,并根据统计数据得到如下的散点图:
(1)由散点图判断y=bx+a与y=clnx+d哪个模型能更好地对y与x的关系进行拟合(给出判断即可,不必说明理由),并根据你的判断结果求回归方程;
(2)根据(1)所求的回归方程,预测票价为多少时,剧场的门票收入最多.
参考数据:x=240,y=0.5,i=15xi2=365000,i=15xiyi=457.5;设zi=lnxi,则i=15zi≈27,i=15zi2≈147.4,i=15ziyi≈12.7;e5.2≈180,e5.4≈220,e6.4≈600.
参考公式:对于一组数据u1,v1,u2,v2,⋯,un,vn,其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:β=i=1nuivi−nuvi=1nui2−nu2=i=1nui−uvi−vi=1nui−u2,α=v−βu.
题型十三 回归方程与独立性检验
2023年10月期间,某黄梅戏剧院共开播了5场精彩演出,观看人数(单位:万人)与场次的统计数据如表所示:
(1)已知可用线性回归模型拟合与的关系,请建立关于的线性回归方程;
(2)若该剧院分A,B,C三个等次的票价,某机构随机调查了该剧院200位观众的性别与购票情况,得到的部分数据如表所示,请将列联表补充完整,并判断能否有的把握认为该剧院的观众是否购买等票与性别有关.
参考公式及参考数据:回归方程中斜率与截距的最小二乘估计公式分别为,.
,其中.
题型十四 相关系数与独立性检验
某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
已知,,,,.
(1)计算y与x的样本相关系数r(精确到0.001),并判断该型机床的使用年限与所支出的维修费用的相关性强弱(若,则认为y与x相关性很强,否则不强).
(2)该厂购入一台新的A型机床,工人们分别使用这台机床(记为X)和一台已经使用多年的A型机床(记为Y)各制造50个零件,统计得出的数据如下表:
根据所给数据完成上表,试根据小概率值的独立性检验,分析零件合格情况是否与机床的使用情况有关.
附:相关系数.
,其中.
某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表:
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表:
(1)根据所给数据知,可用线性回归模型拟合与的关系,请用相关系数加以说明;(值精确到0.01)
(2)完成下面的列联表,并判断是否有的把握认为参与管理的意愿与该村村民的性别有关.
参考公式:,其中.
参考数据:.
临界值表:
人类命运共同体的提法将中国梦融入世界梦,充分展现了中国的大国担当.在第75届联合国大会上中国承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标"),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;
①参考数据:;
②参考公式:(i)线性回归方程:,其中;
(ii)相关系数:,若,则可判断与线性相关较强.
③参考临界值表:
热心网友们调查统计了柳州市某网红景点在2022年6月至10月的旅游收入y(单位:万元),得到以下数据:
(1)根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?若可以,求出y关于x之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,网友们随机抽查了200名游客,得到如图列联表,请填写2×2列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”?
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
喜爱
不喜爱
男生
女生
0.25
0.10
0.05
0.001
k
2.072
2.706
3.841
6.635
喜欢足球
不喜欢足球
合计
男生
20
女生
15
合计
100
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
“编织巧手”
非“编织巧手”
总计
年龄≥40岁
19
_____
_____
年龄<40岁
_____
10
_____
总计
_____
_____
40
α
0.100
0.050
0.010
0.005
xα
2.706
3.841
6.635
7.879
选物理类
选历史类
合计
男生
35
15
女生
25
25
合计
100
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
了解
不了解
合计
男生
女生
合计
亚运会达人
非亚运会达人
合计
男生
40
56
女生
24
合计
0.050
0.010
0.005
k
3.841
6.635
7.879
男生
女生
合计
喜欢
120
100
220
不喜欢
80
100
180
合计
200
200
400
0.15
0.10
0.05
0.025
0.01
2.072
2.706
3.841
5.024
6.635
合计
菌种甲
菌种乙
合计
0.10
0.05
0.01
2.706
3.841
6.635
性别
视力情况
合计
近视
不近视
男生
30
女生
40
合计
120
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
合格
不合格
合计
高三年级的学生
54
高一年级的学生
16
合计
100
α
0.100
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
经常网购
偶尔或不用网购
合计
男性
45
100
女性
65
100
合计
α
0.150
0.100
0.050
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
康复
未康复
合计
甲组
20
30
乙组
5
30
合计
α
0.100
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
一等品
二等品
合计
设备改造前
120
80
200
设备改造后
150
50
200
合计
270
130
400
50岁以下(含50岁)
50岁以上
总计
长期潜伏
非长期潜伏
总计
0.1
0.05
0.010
2.706
3.841
6.635
男生
女生
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
0.025
0.010
0.005
5.024
6.635
7.879
是否有潜力
性别
合计
男生
女生
有潜力
没有潜力
合计
PK2≥k
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
1
2
3
4
5
0.5
0.6
1
1.4
1.5
x
1
2
3
4
5
y
5
5
6
6
8
年份
2018
2019
2020
2021
2022
年份序号x
1
2
3
4
5
报考人数y(万人)
1. 1
1.6
2
2.5
m
x
1
2
3
4
5
y
0.5
0.8
1
1.2
1.5
x
6
8
10
12
y
a
10
6
4
年份
2018
2019
2020
2021
2022
年份代码t
1
2
3
4
5
年利润/万元
2.4
2.7
4.1
6.4
7.9
月份
2022.8
2022.9
2022.12
2023.1
2023.2
2023.3
2023.4
2023.6
2023.7
202.8
月份编号
1
2
3
4
5
6
7
8
9
10
月销量(单位:万辆)
4.25
4.59
4.99
3.5
3.78
3.01
2.46
2.72
3.02
3.28
身体综合指标评分()
1
2
3
4
5
用时(/小时)
10
8.5
8
7
6.5
600
592
43837.2
93.8
月份
1
2
3
4
5
6
带货金额万元
254
354
454
954
1654
2054
单价x(元/件)
8
8.2
8.4
8.6
8.8
9
销量y(万件)
90
84
83
80
75
68
xi
1
2
3
4
5
yi
75
84
93
98
100
x
6
7
8
9
10
y
3.5
4
5
5.5
7
胸径x/cm
18.2
19.1
22.3
24.5
26.2
树高的观测值y/m
18.9
19.4
20.8
22.8
24.8
树高的预测值
18.6
19.3
21.5
23.0
24.4
x
3
4
5
6
y
2
3
5
海水浓度(%)
3
4
5
6
7
亩产量(吨)
0.57
0.53
0.44
0.36
0.30
残差
-0.01
0.02
m
n
0
75
2.25
82.5
4.5
120
28.35
年份
年份代号
人均可支配收入(万元)
x
y
u
i=19xi−x2
i=19ui−u2
i=19yi−y2
i=19xi−xyi−y
i=19ui−uyi−y
6
97.90
0.21
60
0.14
14.12
26.13
−1.40
i=17tiyi
t
i=17ti2−7t2
1 750
0.37
0.55
x(天)
1
2
3
4
5
6
7
y(秒/题)
910
800
600
440
300
240
210
i=110xiyi
i=110xi
i=110yi
i=110xi2
i=110tizi
i=110ti
i=110zi
i=110ti2
650
91.5
52.5
1478.6
30.5
15
15
46.5
x
20
23
25
27
30
z
2
2.4
3
3
4.6
x=26
y=215
u=680
v=5.36
i=110xi−x2=100
i=110ui−u2=22500
i=110ui−uyi−y=260
i=110yi−y2=4
i=110vi−v2=4
i=110xi−xvi−v=18
旅游线路
奇山秀水游
古村落游
慢生活游
亲子游
采摘游
舌尖之旅
套票型号
A
B
C
D
E
F
价格x/元
39
49
58
67
77
86
年份
2017
2018
2019
2020
2021
2022
编号x
1
2
3
4
5
6
企业总数量y(单位:百个)
50
78
124
121
137
352
日期
第一天
第二天
第三天
第四天
第五天
第六天
第七天
日期代码x
1
2
3
4
5
6
7
直播间人数y(万人)
4
12
21
23
25
27
28
666
140
3268
1.2
206.4
13.2
2.65
10.8
7.39
x
y
t
i=110xi2
i=110xiyi
i=110ti2
i=110tiyi
2017.5
80.4
1.5
40703145.0
1621254.2
27.7
1226.8
x
y
ω
i=110xi−x2
i=110ωi−ω2
i=110xi−xyi−y
i=110ωi−ωyi−y
9.4
30.3
2
366
6.6
439.2
66
场次
第1场
第2场
第3场
第4场
第5场
场次编号
1
2
3
4
5
观看人数/万人
0.7
0.8
1
1.2
1.3
购买等票
购买非等票
总计
男性观众
50
女性观众
60
总计
100
200
0.100
0.050
0.010
2.706
3.841
6.635
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
机床
零件
合计
合格
不合格
X
4
Y
40
合计
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
愿意参与管理
不愿意参与管理
男性村民
140
60
女性村民
40
愿意参与管理
不愿意参与管理
合计
男性村民
140
60
女性村民
40
合计
0.050
0.010
0.001
3.841
6.635
10.828
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
月份x
6
7
8
9
10
旅游收入y
10
12
11
12
20
喜欢
不喜欢
总计
相关试卷
这是一份专题5.4 向量中的隐圆问题-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用),文件包含专题5-4向量中的隐圆问题原卷版docx、专题5-4向量中的隐圆问题解析版docx等2份试卷配套教学资源,其中试卷共35页, 欢迎下载使用。
这是一份专题4.4 奇偶数列问题-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用),文件包含专题4-4奇偶数列问题原卷版docx、专题4-4奇偶数列问题解析版docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。
这是一份专题3.5 外接球与内切球-【模型技巧】备考2024高考数学二轮复习重难点突破专题(新高考专用),文件包含专题3-5外接球与内切球原卷版docx、专题3-5外接球与内切球解析版docx等2份试卷配套教学资源,其中试卷共62页, 欢迎下载使用。