所属成套资源:2022年高考数学解题方法技巧篇(文理通用)
方法技巧专题25 回归分析与独立性检验-2022年高考数学满分之路方法技巧篇
展开
这是一份方法技巧专题25 回归分析与独立性检验-2022年高考数学满分之路方法技巧篇,文件包含方法技巧专题25回归分析与独立性检验解析版docx、方法技巧专题25回归分析与独立性检验原卷版docx等2份试卷配套教学资源,其中试卷共50页, 欢迎下载使用。
方法技巧专题25 回归分析与独立性检验
解析篇
一、回归分析与独立性检
回归分析与独立性检验题型分析
【一】回归分析
(1) 求回归直线方程的一般步骤如下:
①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算的值;③计算回归系数;④写出回归直线方程为。
(2)回归直线过样本点中心.
(3)可以利用回归直线方程预报在取某个值时的估计值.
1.例题
类型一:线性问题
【例1】 广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元)
广告费
2
3
4
5
6
销售额
29
41
50
59
71
由上表可得回归方程为,据此模型, 预测广告费为10万元时销售额约为( )
A.118.2万元 B.111.2万元 C.108.8万元 D.101.2万元
【答案】B
【解析】由表格中数据可得,,
,解得,
回归方程为,
当时,,
即预测广告费为10万元时销售额约为,故选B.
【例2】 随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,是昆虫大量活动与繁殖季节,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y与一定范围内的温度x有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:
日期
2日
7日
15日
22日
30日
温度x/∘C
10
11
13
12
8
产卵数y/个
23
25
30
26
16
(1)从这5天中任选2天,记这两天药用昆虫的产卵分别为m,n,求事件“m,n均不小于25”的概率;
(2)科研人员确定的研究方案是:先从这五组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.
(ⅰ)若选取的是3月2日与30日的两组数据,请根据3月7日、15日和22日这三天的数据,求出y关于x的线性回归方程;
(ⅱ)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问(ⅰ)中所得的线性回归方程是否可靠?
附:回归直线的斜率和截距的最小二乘估计公式分别为 ,a∧=y-b∧⋅x.
【解析】(1)依题意得,m、n的所有情况有:{23,25}、{23,30}、{23,26}、{23,16}、{25,30}、
{25,26}、{25,16}、{30,26}、{30,16}、{26,16},共有10个;
设“m、n均不小于25”为事件A,则事件A包含的基本事件有{25,30}、{25,26}、{30,26},
所以P(A)=310,故事件A的概率为310.
(2)(ⅰ)由数据得x=12,y=27,
, ,
,
所以y关于x的线性回归方程为y∧=52x-3.
(ⅱ)由(ⅰ)知,y关于x的线性回归方程为y∧=52x-3.
当x=10时,y∧=52×10-3=22,|22-23|6.635,则有99%的把握说两个事件有关;
若K23.841,
因此在犯错误的概率不超过0.05的前提下认为视力与学习成绩有关系.
【例2】2014年12月19日,2014年中国数学奥林匹克竞赛(第30届全国中学生数学冬令营)在重庆市巴蜀中学举行.参加本届中国数学奥林匹克竞赛共有来自各省、市(自治区、直辖市)、香港地区、澳门地区,以及俄罗斯、新加坡等国的30余支代表队,共317名选手.竞赛为期2天,每天3道题,限时4个半小时完成.部分优胜者将参加为国际数学奥林匹克竞赛而组建的中国国家集训队.中国数学奥林匹克竞赛(全国中学生数学冬令营)是在全国高中数学联赛基础上进行的一次较高层次的数学竞赛,该项活动也是中国中学生级别最高、规模最大、最有影响的全国性数学竞赛.2020年第29届全国中学生生物学竞赛也将在重庆巴蜀中学举行.巴蜀中学校本选修课“数学建模”兴趣小组调查了2019年参加全国生物竞赛的200名学生(其中男生、女生各100人)的成绩,得到这200名学生成绩的中位数为78.这200名学生成绩均在50与110之间,且成绩在内的人数为30,这200名学生成绩的高于平均数的男生有62名,女生有38名.并根据调查结果画出如图所示的频率分布直方图.
(1)求,的值;
(2)填写下表,能否有的把握认为学生成绩是否高于平均数与性别有关系?
男生
女生
总计
成绩不高于平均数
成绩高于平均数
总计
参考公式及数据:,其中.
【解析】(1)∵成绩在内的人数为30,
∴成绩在内的频率为.
由频率分布直方图得,
化简得,①
由中位数可得,
化简得,②
由①②解得,.
(2)200名学生成绩的高于平均数的男生有62名,女生有38名,
因男、女生各100名,所以可得成绩不高于平均数的男生有38名,女生有62名,
根据题意得到列联表:
男生
女生
总计
成绩不高于平均数
38
62
100
成绩高于平均数
62
38
100
总计
100
100
200
∴的观测值,
∴有的把握认为学生成绩是否高于平均数与性别有关系.
2.巩固提升综合练习
【练习1】 某市一中毕业生有3000名,二中毕业生有2000名.为了研究语文高考成绩是否与学校有关,现采用分层抽样的方法,从中抽取100名学生,先统计了他们的成绩(折合成百分制),然后按“一中”、“二中”分为两组,再将成绩分为5组,[50,60),[60,70),[70,80),[80,90),90,100,分别加以统计,得到如图所示的频率分布直方图:
(1)从成绩在90分(含90分)以上的学生中随机抽取2人,问至少抽到一名学生是“一中”的概率;
(2)规定成绩在70分以下为“成绩不理想”,请根据已知条件构造2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“成绩理想不理想与所在学校有关”?
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
【解析】(1)由分层抽样抽取的100名学生中,一中有60名,二中有40名,
所以成绩在90分以上的人中,一中有60×0.005×10=3人;
二中有40×0.005×10=2人,
故至少抽到一名学生是“一中”的概率为p=1-110=910.
(2)2×2列联表如下:
成绩不理想
成绩理想
合计
一中
15
45
60
二中
14
26
40
合计
29
71
100
将列联表中的数据代入公式,可得:
K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×26-14×45)229×71×60×40≈1.16565,
又x∈N,所以x可取6,7,8,9,故所求的概率为P=410=25,
故选D.
4.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:平均每天喝500以上为常喝,体重超过50为肥胖.
常喝
不常喝
合计
肥胖
2
不肥胖
18
合计
30
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为.
(1)请将上面的列联表补充完整;
(2)是否有的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;
(3)已知常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生抽取2人参加电视节目,则正好抽到一男一女的概率是多少?
参考公式及数据:,其中.
【解析】(1)设常喝碳酸饮料肥胖的学生有人,,,
补充完整的列联表如下:
常喝
不常喝
合计
肥胖
6
2
8
不肥胖
4
18
22
合计
10
20
30
(2)由已知数据可求得:,
因此有的把握认为肥胖与常喝碳酸饮料有关.
(3)设常喝碳酸饮料的肥胖者男生为、、、,女生为、,
则任取两人有,,,,,,,,,,,,,,共15种,
其中一男一女有,,,,,,,,共8种,
故抽出一男一女的概率为.
5.某企业为提高生产质量,引入了一批新的生产设备,为了解生产情况,随机抽取了新、旧设备生产的共200件产品进行质量检测,分别统计得到产品的质量指标值如下表及图(所有产品质量指标值均位于区间内),若质量指标值大于30,则说明该产品质量高,否则说明该产品质量一般.
质量指标
合计
频数
2
8
10
30
20
10
80
(1)根据上述图表完成下列列联表,并判断是否有的把握认为产品质量高与引人新设备有关;
新旧设备产品质量列联表
产品质量高
产品质量一般
合计
新设备产品
旧设备产品
合计
(2)从旧设备生产的质量指标值位于区间的产品中,按分层抽样抽取6件产品,再从这6件产品中随机选取2件产品进行质量检测,求至少有一件产品质量指标值位于的概率.
参考公式及数据:,其中.
【解析】(1)列联表如下:
产品质量高
产品质量一般
合计
新设备产品
60
20
80
旧设备产品
48
72
120
合计
108
92
200
所以的观测值,
所以有的把握认为产品质量高与引入新设备有关.
(2)由题意,从中抽取1件产品,记为,从中抽取2件产品,记为,,
从中抽取3件产品,记为,,,
从这6件产品中任选2件,共有15种可能情况,分别为,,,,,,,,,,,,,,,
记事件为至少有一件产品质量指标位于,共有9种情况,
所以.
6.(2019年高考全国Ⅰ卷文数)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为,
因此男顾客对该商场服务满意的概率的估计值为,女顾客中对该商场服务满意的比率为,
因此女顾客对该商场服务满意的概率的估计值为.
(2)由题可得.
由于,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
7.(2017年高考全国Ⅱ卷文数)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P(K2≥k)
0.050 0.010 0.001
k
3.841 6.635 10.828
.
【解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2=.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
8. (2018年全国III卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:,
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
【解析】
(1)第二种生产方式的效率更高.理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知m=79+812=80.
列联表如下:
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)由于,所以有99%的把握认为两种生产方式的效率有差异.
9.某企业生产某种产品,为了提高生产效益,通过引进先进的生产技术和管理方式进行改革,并对改革后该产品的产量x(万件)与原材料消耗量y(吨)及100件产品中合格品与不合格品数量作了记录,以便和改革前作对照分析,以下是记录的数据:
表一:改革后产品的产量和相应的原材料消耗量
x
3
4
5
6
y
2.5
3
4
4.5
表二:改革前后定期抽查产品的合格数与不合格数
合格品的数量
不合格品的数量
合计
改革前
90
10
100
改革后
85
15
100
合计
175
25
200
(1)请根据表一提供数据,用最小二乘法求出y关于x的线性回归方程y∧=b∧x+a∧ .
(2)已知改革前生产7万件产品需要6.5吨原材料,根据回归方程预测生产7万件产品能够节省多少原材料?
(3)请根据表二提供的数据,判断是否有90%的把握认为“改革前后生产的产品的合格率有差异”?
附参考公式与数据:,;
K2=;
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
【解析】(1)由表一得x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,
+62=86,
∴b=3×2.5+4×3+5×4+6×4.5-4×4.5×3.586-4×4.52=66.5-635=0.7,
a=3.5-0.7×4.5=0.35,
所以所求线性回归方程为y=0.7x+0.35.
(2)当x=7时,y=0.7×7+0.35=5.25,
从而能够节省6.5-5.25=1.25吨原材料.
(3)由表二得K2=200×(90×15-85×10)2100×100×175×25=87
相关试卷
这是一份方法技巧专题26 平面向量-2022年高考数学满分之路方法技巧篇,文件包含方法技巧专题26平面向量解析版docx、方法技巧专题26平面向量原卷版docx等2份试卷配套教学资源,其中试卷共40页, 欢迎下载使用。
这是一份方法技巧专题08 轨迹方程的求法-2022年高考数学满分之路方法技巧篇
这是一份方法技巧专题14 导数与切线方程问题-2022年高考数学满分之路方法技巧篇,文件包含方法技巧专题14导数与切线方程问题解析版docx、方法技巧专题14导数与切线方程问题原卷版docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。