- 第二章 随机变量及其分布达标检测 试卷 1 次下载
- 3.1 回归分析的基本思想及其初步应用练习题 试卷 1 次下载
- 3.2 独立性检验的基本思想及其初步应用练习题 试卷 1 次下载
- 第三章 统计案例达标检测 试卷 1 次下载
- 选修2-3综合测评 试卷 2 次下载
人教版新课标A选修2-3第三章 统计案例综合与测试课后作业题
展开本章复习提升
易混易错练
易错点1 选错回归模型致错
1.(2019山西康杰中学高二下学期月考,★★☆)在一次抽样调查中测得5个样本点,数值如下表:
x | 0.25 | 0.5 | 1 | 2 | 4 |
y | 16 | 12 | 5 | 2 | 1 |
(1)根据散点图判断y=a+bx与y=c+k·x-1哪一个更适合作为y关于x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的回归方程;(计算结果保留整数)
(3)在(2)的条件下,设z=y+x且x∈[4,+∞),试求z的最小值.
参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为
==,=-.
2.(2019河北鹿泉一中高二月考,★★☆)十九大指出,必须树立“绿水青山就是金山银山”的生态文明发展理念,这一理念将进一步推动新能源汽车产业的迅速发展.以下是2013至2017年我国新能源汽车的年销量数据及其散点图:
年份 | 2013 | 2014 | 2015 | 2016 | 2017 |
年份代码x | 1 | 2 | 3 | 4 | 5 |
新能源汽车的 年销量y/万辆 | 1.5 | 5.9 | 17.7 | 32.9 | 55.6 |
(1)请根据散点图判断y=bx+a与y=cx2+d中哪个更适合作为新能源汽车年销量y关于年份代码x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2020年我国新能源汽车的年销量.(精确到0.1)
参考公式:wi=,=,=-.
参考数据:
(xi-)2 | (wi-)2 | (xi-)· (yi-) | (wi-)· (yi-) | |
22.72 | 10 | 374 | 135.2 | 851.2 |
易错点2 独立性检验时武断下结论致错
3.(2019黑龙江大庆高二期末,★★☆)为了调查中学生每天玩游戏的时间是否与性别有关,随机抽取了男、女学生各50人进行调查,根据其日均玩游戏的时间(单位:分钟)绘制了如下所示的频率分布直方图.
(1)求所调查学生中日均玩游戏时间在[40,50)分钟的人数;
(2)将日均玩游戏时间不低于60分钟的学生称为“游戏迷”,已知“游戏迷”中女学生有6人.根据已知条件,完成下面的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“游戏迷”和性别有关系.
| 非游戏迷 | 游戏迷 | 合计 |
男学生 |
|
|
|
女学生 |
|
|
|
合计 |
|
|
|
附:K2=(其中n=a+b+c+d为样本容量).
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
4.(2019河北枣强中学高二上学期期末,★★☆)某学校为了解高一学生暑假里在家读书的情况,特随机调查了50名男生和50名女生平均每天的读书时间(单位:分钟),统计如下表:
读书时间 | [0,15) | [15,30) | [30,45) | [45,60) | [60,75) | [75,90) |
男生人数 | 6 | 13 | 15 | 8 | 6 | 2 |
女生人数 | 2 | 11 | 15 | 10 | 8 | 4 |
(1)根据统计表判断男生和女生谁的平均每天的读书时间更长,并说明理由;
(2)求100名学生每天读书时间的平均数,并将每天平均时间超过和不超过平均数的人数填入下面的列联表;
| 不超过 | 超过 | 合计 |
男生 |
|
|
|
女生 |
|
|
|
合计 |
|
|
|
(3)根据(2)中列联表,能否有99%的把握认为“平均读书时间超过或不超过平均数与性别有关”?
附:K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
思想方法练
一、数形结合思想在统计中的应用
1.(2019湖南岳阳一中高二月考,★★☆)以下是某地收集到的新房屋的销售价格y和房屋面积x的数据:
房屋面积x(m2) | 115 | 110 | 80 | 135 | 105 |
销售价格y(万元) | 24.8 | 21.6 | 18.4 | 29.2 | 22 |
(1)画出数据对应的散点图;
(2)求新房屋的销售价格y与房屋面积x之间的线性回归方程.
参考公式:=,=-.
2.(★★☆)某连锁经营公司下属的5个零售商店某月的销售额和利润额资料如下表:
商店名称 | A | B | C | D | E |
销售额x(千万元) | 3 | 5 | 6 | 7 | 9 |
利润额y(千万元) | 2 | 3 | 3 | 4 | 5 |
(1)画出散点图,并观察散点图,说明两个变量具有怎样的相关性;
(2)用最小二乘法求利润额y关于销售额x的线性回归方程;
(3)试估计当销售额为4千万元时的利润额.
3.(2019陕西澄城高二下学期期中,★★☆)某工厂为了安排生产任务,需要确定加工零件所花费的时间,为此进行了四次试验,得到的数据如下:
零件个数x | 2 | 3 | 4 | 5 |
加工时间y(小时) | 2.5 | 3 | 4 | 4.5 |
(1)在给定的坐标系中画出表中数据对应的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要的时间.
4.(2019四川绵阳高二上学期期末教学质量测试,★★☆)如图是某台大型设备使用时间x(单位:年)与维护费用y(单位:千元)的散点图.
(1)根据散点图,求y关于x的回归方程=x+;
(2)如果维护费用超过120千元就需要更换设备,那么根据(1)中模型的预测,该设备最多可以使用多少年.
附:①参考数据:=75,(xi-)(yi-)=63;②一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计公式分别为=,=-.
5.(2019黑龙江哈尔滨三中高二上学期期末,★★☆)某校高二年级六班同学用随机抽样的方法对所在学校老师的饮食习惯进行了一次调查,饮食指数结果用如图所示的茎叶图表示,图中饮食指数低于70的人饮食以蔬菜为主,饮食指数高于70的人饮食以肉类为主.
(1)完成下列2×2列联表:
| 以蔬菜为主 | 以肉类为主 | 总计 |
不超过45岁 |
|
|
|
45岁以上 |
|
|
|
总计 |
|
|
|
能否有99%的把握认为老师的饮食习惯与年龄有关?
(2)从该校任选一名老师,设“选到45岁以上的老师”为事件A,“饮食指数高于70的老师”为事件B,用调查的结果估计P(B|A)及P(B|)(用最简分数作答);
(3)为了给食堂提供老师的饮食信息,根据(1)(2)的结论,是否有更好的抽样方法来估计老师的饮食习惯,并说明理由.
附:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
K2=,其中n=a+b+c+d.
二、转化与化归思想在统计中的应用
6.(2019四川攀枝花高二上学期期末教学质量监测,★★☆)某公司为了确定下一年度投入某种产品的宣传费用,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润(单位:万元)的影响.对2013年至2018年的宣传费xi和年销售量yi(i=1,2,3,4,5,6)的数据进行了初步统计,并绘制成如下所示的表格:
年份 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 |
年宣传费x(万元) | 38 | 48 | 58 | 68 | 78 | 88 |
年销售量y(吨) | 16.8 | 18.8 | 20.7 | 22.4 | 24.0 | 25.5 |
经电脑模拟,发现年宣传费x(万元)与年销售量y(吨)之间近似满足关系式y=a·xb(a,b>0),即ln y=bln x+ln a.对上述数据进行了初步处理,得到的相关值如下表:
(ln xi·ln yi) | ln xi | ln yi | (ln xi)2 |
75.3 | 24.6 | 18.3 | 101.4 |
(1)从表中所给出的6年的年销售量数据中任选2个数据进行年销售量的调研,求所选数据中至多有一年年销售量低于20吨的概率;
(2)根据所给数据,求y关于x的回归方程;
(3)若生产该产品的固定成本为200万元,且每生产1吨产品的生产成本为20万元(总成本=固定成本+生产成本+年宣传费),销售收入为R(x)=[-x+(40+20e)+500]万元,假定该产品产销平衡(即生产的产品都能卖掉),则2019年该公司应该投入多少宣传费才能使利润最大?(其中e=2.718 28…)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=β·u+α中的斜率和截距的最小二乘估计分别为=,=-·.
答案全解全析
易混易错练
1.解析 (1)由散点图可以判断,y=c+k·x-1更适合作为y关于x的回归方程类型.
(2)令t=x-1,则y=c+kt,原数据变为
t | 4 | 2 | 1 | 0.5 | 0.25 |
y | 16 | 12 | 5 | 2 | 1 |
由表可知y与t近似呈线性关系.
计算得=1.55,=7.2,≈4,=- ≈1,所以y关于t的回归方程为=4t+1.
所以y关于x的回归方程是=+1.
(3)由(2)得z=y+x=+x+1,易知z=+x+1在x∈[4,+∞)上是单调递增函数,所以z=x++1的最小值为6.
2.解析 (1)由散点图可以判断,y=cx2+d更适合作为新能源汽车年销量y关于年份代码x的回归方程类型.
(2)依题意得,==11,∴==≈2.3,
=-≈22.72-2.3×11≈-2.6,
∴=2.3x2-2.6.
令x=8,得=2.3×64-2.6=144.6,
故预测2020年我国新能源汽车的年销量为144.6万辆.
3.解析 (1)日均玩游戏时间在[40,50)分钟的频率为1-(0.010+0.008+0.012+0.014+0.020+0.014+0.004+0.002)×10=0.16,
所以所调查学生中日均玩游戏时间在[40,50)分钟的人数为100×0.16=16.
(2)“游戏迷”的频率为(0.014+0.004+0.002)×10=0.20,故共有“游戏迷”0.20×100=20人,由于“游戏迷”中女学生有6人,故男学生有14人.可得如下2×2列联表:
| 非游戏迷 | 游戏迷 | 合计 |
男学生 | 36 | 14 | 50 |
女学生 | 44 | 6 | 50 |
合计 | 80 | 20 | 100 |
K2===4>3.841.
故能在犯错误的概率不超过0.05的前提下认为“游戏迷”和性别有关系.
4.解析 (1)女生平均每天的读书时间更长.
理由如下:
男生平均每天的读书时间为××6+×13+×15+×8+×6+×2=37.8(分钟),
女生平均每天读书时间为××2+×11+×15+×10+×8+×4=44.4(分钟),
故女生平均每天的读书时间更长.
(2)100名学生的平均读书时间为
××8+×24+×30+×18+×14+×6=41.1(分钟).
完整的列联表如下:
| 不超过 | 超过 | 合计 |
男生 | 31 | 19 | 50 |
女生 | 25 | 25 | 50 |
合计 | 56 | 44 | 100 |
(3)因为K2=≈1.461<6.635,所以没有99%的把握认为“平均读书时间超过或不超过平均数与性别有关”.
思想方法练
1.解析 (1)数据对应的散点图如图所示:
(2)计算可得=109,=23.2,=60 975,xiyi=12 952,所以=≈0.196 2,所以=-≈1.814 2,所以所求线性回归方程为=0.196 2x+1.814 2.
2.解析 (1)散点图如下:
由散点图可知,两变量呈正相关关系.
(2)设线性回归方程为=x+,计算得=3.4,=6,
∴====,=-=
0.4,
∴y关于x的线性回归方程为=0.5x+0.4.
(3)当销售额为4千万元时,利润额为0.5×4+0.4=2.4(千万元).
3.解析 (1)散点图如下:
(2)由题表中的数据得xiyi=52.5,=xi=3.5,=yi=3.5,=54,
∴===0.7,=-=3.5-0.7×3.5=1.05,
∴=0.7x+1.05.
回归直线如图:
(3)将x=10代入线性回归方程,得=0.7×10+1.05=8.05,
∴预测加工10个零件需要8.05小时.
4.解析 (1)计算得,==3.5,
(xi-)2=(1-3.5)2+(2-3.5)2+(3-3.5)2+(4-3.5)2+(5-3.5)2+
(6-3.5)2=17.5,
又=75,(xi-)(yi-)=63,
所以===3.6,=-=75-3.6×3.5=62.4.
所以y关于x的回归方程为=3.6x+62.4.
(2)令3.6x+62.4≤120,解得x≤16.所以估计该设备最多可以使用16年.
5.解析 (1)完成后的2×2列联表如下:
| 以蔬菜为主 | 以肉类为主 | 总计 |
不超过45岁 | 4 | 8 | 12 |
45岁以上 | 16 | 2 | 18 |
总计 | 20 | 10 | 30 |
K2==10>6.635,故有99%的把握认为老师的饮食习惯与年龄有关.
(2)由题意得P(AB)==,P(A)==,结合P(AB)=P(A)·P(B|A),得到P(B|A)=,又P(B)==,P()=,∴P(B|)==.
(3)可以考虑使用分层抽样,根据(1)的结论,不超过45岁与超过45岁的老师饮食习惯差异较大,为了给食堂提供更科学的有关老师的饮食信息,最佳的抽样方法是按年龄段进行分层抽样.
6.解析 (1)记事件A表示“至多有一年年销售量低于20吨”,由题表中数据可知6年的数据中只有2013年和2014年的年销售量低于20吨,记这两年分别为c,d,其余四年分别为e,f,g,h,则从6年的年销售量数据中任选2个数据有(c,d),(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h),共15种不同选法,
事件A包括(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h),共14种选法,故P(A)=.
(2)根据题意,令u=ln x,v=ln y,则v=ln a+b·u,由题中数据得==4.1,==3.05,
又uivi=(ln xi·ln yi)=75.3,=(ln xi)2=101.4,
所以===,由ln =-=3.05-×4.1=1,得=e,故所求回归方程为=e.
(3)设该公司的年利润为f(x),因为利润=销售收入-总成本,所以由题意可知
f(x)=-x+(40+20e)+500-(200+20e+x)=-2x+40+300=-2(-10)2+500,所以当=10,即x=100时,利润f(x)取得最大值500万元,故2019年该公司投入100万元的宣传费才能获得最大利润.
新高考数学一轮复习提升训练8.5 统计案例(精练)(含解析): 这是一份新高考数学一轮复习提升训练8.5 统计案例(精练)(含解析),共22页。
新高考数学一轮复习提升训练8.5 统计案例(精讲)(含解析): 这是一份新高考数学一轮复习提升训练8.5 统计案例(精讲)(含解析),共18页。试卷主要包含了独立性检验,线性回归方程,非线性回归方程等内容,欢迎下载使用。
北师大版 (2019)必修 第一册第三章 指数运算与指数函数3 指数函数本节综合与测试精练: 这是一份北师大版 (2019)必修 第一册第三章 指数运算与指数函数3 指数函数本节综合与测试精练,