- 8.3.1分类变量与列联表8_3_2 独立性检验练习题 试卷 2 次下载
- 第八章 成对数据的统计分析8.1~8.3 综合拔高练 试卷 2 次下载
- 专题强化练8 独立性检验与统计、概率的综合应用 试卷 2 次下载
- 第八章 成对数据的统计分析达标检测 试卷 3 次下载
- 选择性必修第三册综合测评 试卷 7 次下载
高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析本章综合与测试随堂练习题
展开易错点1 选错回归模型致错
1.(2020山西康杰中学高二下月考,)在一次抽样调查中测得5组成对数据,其数值及散点图如下:
(1)根据散点图判断y=a+bx与y=c+k·x-1哪一个更适宜作为y关于x的经验回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试建立y与x的经验回归方程;(计算结果保留整数)
(3)在(2)的条件下,设z=y+x且x∈[4,+∞),试求z的最小值.
参考公式:经验回归方程y^=b^x+a^中,
b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx 2,a^=y-b^x.
易错点2 求χ2用错公式致错
2.(2020河南郑州高二下第一次联考,)为了解人们对延迟退休年龄政策的态度,某部门从年龄在15岁到65岁的人群中随机调查了100人,并得到如图所示的频率分布直方图,在这100人中不支持延迟退休年龄政策的人数与年龄的统计结果如下表所示.
(1)由频率分布直方图,估计这100人年龄的平均数(同一组数据用该区间的中点值代表);
(2)根据以上统计数据填写下面的2×2列联表,并依据α=0.05的独立性检验,分析以45岁为分界点的不同人群对延迟退休年龄政策的态度是否存在差异.
单位:人
附表及公式:
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
3.(2020江西百所名校高三第四次联考,)今年1月至2月由新型冠状病毒引起的肺炎病例陡然增多,为了严控疫情扩散,做好重点人群的预防工作,某地区共统计返乡人员100人,其中50岁及以上的共有40人.这100人中确诊的有10人,其中50岁以下的人占310.
(1)试估计50岁及以上的返乡人员因感染新型冠状病毒而引起肺炎的概率;
(2)请将下面的列联表补充完整,并依据α=0.05的独立性检验,分析确诊患新冠肺炎与年龄是否有关.
单位:人
附表及公式:
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
4.(2020重庆高三上期末,)某地区在“精准扶贫”工作中切实贯彻习近平总书记提出的“因地制宜”的指导思想,扶贫工作小组经过多方调研,综合该地区的气候、地质、地理位置等特点,决定向当地农户推行某类景观树苗种植.工作小组根据市场前景重点考察了A,B两种景观树苗,为对比两种树苗的成活率,工作小组进行了引种试验,分别引种树苗A,B各50株,试验发现有80%的树苗成活,未成活的树苗A,B株数之比为1∶3.
(1)完成下面的2×2列联表,依据α=0.01的独立性检验,分析树苗A,B的成活率是否有差异;
(2)已知树苗A引种成活后再经过1年的生长即可作为景观树A在市场上出售,但每株售价y(单位:百元)受其树干的直径x(单位:cm)影响,扶贫工作小组对一批已出售的景观树A的相关数据进行统计,得到结果如下表:
根据上述数据,判断是否可以用线性回归模型拟合y与x的关系,并用样本相关系数r加以说明.(一般认为|r|>0.75为高度线性相关)
深度解析
参考公式及数据:样本相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,∑i=15(xi-x)2=250,
∑i=15(yi-y)2=320.
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
附表:
思想方法练
一、数形结合思想在统计中的应用
1.(2020福建泉州高三适应性线上测试,)下图是某地区2010年至2019年污染天数y与年份x的折线图,根据2010年至2014年的数据,2015年至2019年的数据,2010年至2019年的数据分别建立一元线性回归模型y^=b1x+a1,y^=b2x+a2,y^=b3x+a3,则( )
A.b1
(1)画出散点图;
(2)请根据上表提供的数据,求出y关于x的经验回归方程y^=b^x+a^.
参考公式:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y-b^x.
3.(2020山西运城河津二中高一上月考,)某医院用光电比色计检查尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
(1)画出散点图;
(2)如果y与x之间具有线性相关关系,求y关于x的经验回归方程;
(3)估计尿汞含量为9毫克/升时的消光系数(结果保留整数).
参考公式:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx2=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,
a^=y-b^x.
参考数据:22+42+62+82+102=220,2×64+4×138+6×205+8×285+10×360=7 790.
4.(2020陕西榆林高三三模,)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.
(1)依据散点图判断是否可以用线性回归模型拟合y与x的关系,并用样本相关系数r加以说明(若r>0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的经验回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量.
附:样本相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2∑i=1nyi2-ny2,经验回归方程y^=b^x+a^中,b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y-b^x.
二、转化与化归思想在统计中的应用
5.(2020四川攀枝花高二上教学质量监测,)某公司为了确定下一年度投入某种产品的宣传费用,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润(单位:万元)的影响.对2014年至2019年的宣传费xi和年销售量yi(i=1,2,3,4,5,6)的数据进行了初步统计,并绘制成如下表格:
经电脑模拟,发现年宣传费x(万元)与年销售量y(吨)之间近似满足关系式y=a·xb(a,b>0),即ln y=bln x+ln a.对上述数据进行了初步处理,得到的相关值如下表:
(1)从表中所给出的6年的年销售量数据中任选2个数据进行年销售量的调研,求所选数据中至多有一年的年销售量低于20吨的概率;
(2)根据所给数据,求y关于x的经验回归方程;
(3)若生产该产品的固定成本为200万元,且每生产1吨产品的生产成本为20万元(总成本=固定成本+生产成本+年宣传费),销售收入为R(x)=[-x+(40+20e)x+500]万元,假定该产品产销平衡(即生产的产品都能卖掉),则2020年该公司应该投入多少宣传费才能使利润最大?(其中e=2.718 28…)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线v^=β^u+α^中的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nu v∑i=1nui2-nu 2,α^=v-β^u-.
答案全解全析
本章复习提升
易混易错练
1.解析 (1)由题中散点图可以判断,y=c+k·x-1更适宜作为y关于x的经验回归方程类型.
(2)令t=x-1,则y=c+kt,构造新的成对数据,如下表:
易知y与t存在线性相关关系.
计算得t=1.55,y=7.2,k^≈4,c^=y-k^ t=1,所以y关于t的经验回归方程为y^=4t+1,
所以y关于x的经验回归方程为y^=4x+1.
(3)由(2)得z=y+x=4x+x+1,易得z=4x+x+1在x∈[4,+∞)上是单调递增函数,即最小值为6.
2.解析 (1)估计这100人年龄的平均数为20×0.2+30×0.1+40×0.2+50×0.3+60×0.2=42(岁).
(2)由题中频率分布直方图可知,45岁以下的有50人,45岁及以上的有50人.
可得2×2列联表如下:
单位:人
零假设为H0:不同人群与态度相互独立,即以45岁为分界点的不同人群对延迟退休年龄政策的态度不存在差异.计算可得χ2=100×(35×10-40×15)275×25×50×50≈1.333<3.841=x0.05,依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为以45岁为分界点的不同人群对延迟退休年龄政策的态度不存在差异.
3.解析 (1)因为100人中确诊的有10人,50岁以下的人占310,
所以50岁以下的确诊人数为3,50岁及以上的确诊人数为7,
因为50岁及以上的共有40人,
所以50岁及以上的返乡人员因感染新型冠状病毒而引起肺炎的概率约为740.
(2)补充列联表如下:
单位:人
零假设为H0:确诊患新冠肺炎与年龄无关.计算可得χ2=100×(7×57-33×3)240×60×10×90=256≈4.167>3.841=x0.05.
依据α=0.05的独立性检验,推断H0不成立,即认为确诊患新冠肺炎与年龄有关.
4.解析 试验发现有80%的树苗成活,故未成活的树苗有20株,未成活的树苗A,B株数之比为1∶3,所以树苗A未成活5株,成活45株,树苗B未成活15株,成活35株.
(1)补充列联表如下:
零假设为H0:树苗A,B的成活率无差异.计算可得χ2=100×(45×15-35×5)280×20×50×50=6.25<6.635=x0.01,
依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即认为树苗A,B的成活率无差异.
(2)可以用线性回归模型拟合y与x的关系.由题表中数据易得x=20,y=13,
所以r=
(-10)×(-9)+(-5)×(-5)+0×(-3)+5×3+10×14250×320
≈0.95>0.75.故可以用线性回归模型拟合y与x的关系.
思想方法练
1.C 经验回归直线应分布在散点图的附近,由题中统计图可知2010年至2014年,y随着x的增加而减少,2015年至2019年,y随着x的增加而减少的更多,根据经验回归方程y^=b^x+a^中a^,b^的几何意义可知,a2>a1,b2
(2)易得x=6+8+10+124=9,y=2+3+5+64=4,
∑i=14xiyi=6×2+8×3+10×5+12×6=158,
∑i=14xi2=62+82+102+122=344,
所以b^=158-4×9×4344-4×92=1420=0.7,
a^=y-b^x=4-0.7×9=-2.3,
故经验回归方程为y^=0.7x-2.3.
3.解析 (1)散点图如图所示.
(2)设经验回归方程为y^=b^x+a^,
易得x=6,y=210.4,b^=7 790-5×6×210.4220-5×62=1 47840=36.95,
∴a^=210.4-36.95×6=-11.3.
∴y关于x的经验回归方程为y^=36.95x-11.3.
(3)当x=9时,y^=36.95×9-11.3=321.25≈321.
故估计尿汞含量为9毫克/升时消光系数为321.
4.解析 (1)可以用线性回归模型拟合y与x的关系.易得x=2+4+5+6+85=5,y=3+4+5+6+75=5,
∑i=15(xi-x)(yi-y)=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
∑i=15(xi-x)2=(-3)2+(-1)2+02+12+32=20,
∑i=15(yi-y)2=(-2)2+(-1)2+02+12+22=10.
∴r=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2∑i=15(yi-y)2=1420×10=7210>0.75.
∴可以用线性回归模型拟合y与x的关系.
(2)设经验回归方程为y^=b^x+a^,b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=1420=0.7,a^=y-b^x=5-0.7×5=1.5,∴y^=0.7x+1.5.
当x=12时,y^=0.7×12+1.5=9.9.
∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量为9.9百千克.
5.解析 (1)记事件A表示“至多有一年的年销售量低于20吨”,由题表中数据可知6年的数据中2014年和2015年的年销售量低于20吨,记这两年分别为c,d,其余四年分别为e,f,g,h,则从6年中任选2年,共有(c,d),(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h)15种取法,
事件A包括(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h),共14种取法,故P(A)=1415.
(2)根据题意,令u=ln x,v=ln y,得v=ln a+b·u,由题中数据得,u=24.66=4.1,v=18.36=3.05,
又∑i=16uivi=∑i=16(ln xi·ln yi)=75.3,∑i=16ui2=∑i=16(ln xi)2=101.4,
所以b^=∑i=16uivi-nu v∑i=16ui2-nu 2=75.3-6×4.1××4.12=0.5,由ln a^=v-b^u=3.05-0.5×4.1=1,得a^=e,故所求经验回归方程为y^=ex.
(3)设该公司的年利润为f(x)万元,因为利润=销售收入-总成本,所以由题意可知
f(x)=-x+(40+20e)x+500-(200+20ex+x)=-2x+40x+300=-2(x-10)2+500,所以当x=10,即x=100时,年利润f(x)取得最大值,为500万元,故2020年该公司应该投入100万元的宣传费才能使利润最大.x
0.25
0.5
1
2
4
y
16
12
5
2
1
年龄
不支持延迟退休年龄政策的人数
[15,25)
15
[25,35)
5
[35,45)
15
[45,55)
23
[55,65]
17
45岁以下
45岁及以上
合计
不支持
支持
合计
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
确诊患新冠肺炎
未确诊患新冠肺炎
合计
50岁及以上
40
50岁以下
合计
10
100
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
树苗A
树苗B
合计
成活株数
未成活株数
合计
50
50
100
直径x
10
15
20
25
30
单株售价y
4
8
10
16
27
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
x
6
8
10
12
y
2
3
5
6
尿汞含量x
2
4
6
8
10
消光系数y
64
138
205
285
360
年份
2014
2015
2016
2017
2018
2019
年宣传费x(万元)
38
48
58
68
78
88
年销售量y(吨)
16.8
18.8
20.7
22.4
24.0
25.5
∑i=16(ln xi·ln yi)
∑i=16ln xi
∑i=16ln yi
∑i=16(ln xi)2
75.3
24.6
18.3
101.4
t
4
2
1
0.5
0.25
y
16
12
5
2
1
45岁以下
45岁及以上
合计
不支持
35
40
75
支持
15
10
25
合计
50
50
100
确诊患
新冠肺炎
未确诊患
新冠肺炎
合计
50岁及以上
7
33
40
50岁以下
3
57
60
合计
10
90
100
树苗A
树苗B
合计
成活株数
45
35
80
未成活株数
5
15
20
合计
50
50
100
新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析): 这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。
专题38 成对数据的统计分析(单元测试卷): 这是一份人教A版 (2019)选择性必修 第三册全册综合单元测试当堂达标检测题,文件包含专题38成对数据的统计分析单元测试卷解析版doc、专题38成对数据的统计分析单元测试卷原卷版doc等2份试卷配套教学资源,其中试卷共31页, 欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课时训练: 这是一份人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课时训练,文件包含新教材精创第八章成对数据的统计分析---B提高练解析版docx、新教材精创第八章成对数据的统计分析---B提高练原卷版docx等2份试卷配套教学资源,其中试卷共13页, 欢迎下载使用。