高考数学一轮复习课时质量评价55成对数据的统计分析含答案
展开1.(多选题)在下列各图中,两个变量具有线性相关关系的图是( )
A B
C D
BC 解析:A中各点都在一条直线上,所以这两个变量之间是函数关系,不是相关关系;B,C所示的散点图中,样本点成带状分布,这两组变量具有线性相关关系;
D所示的散点图中,样本点成团状分别,不是带状分布,所以这两个变量不具线性相关关系.综上,具有线性相关关系的是B和C.
2.据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知,y与x之间有较强的线性相关关系,其经验回归方程是eq \(y,\s\up7(^))=0.3x+eq \(a,\s\up7(^)).预测广告费用投入为10万元时,估计该产品的市场销售量约为( )
A.6.1万台 B.5.5万台
C.5.2万台 D.6万台
B 解析:由题意知:eq \x\t(x)=eq \f(2+4+5+6+8,5)=5,eq \x\t(y)=eq \f(3+4×3+5,5)=4,
将(eq \x\t(x),eq \x\t(y))代入eq \(y,\s\up7(^))=0.3x+eq \(a,\s\up7(^)),即4=0.3×5+eq \(a,\s\up7(^)),解得eq \(a,\s\up7(^))=2.5,即eq \(y,\s\up7(^))=0.3x+2.5,
将x=10代入得eq \(y,\s\up7(^))=0.3×10+2.5=5.5.
3.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
C 解析:由线性相关系数r1=0.785 9>0知x与y正相关;
由线性相关系数r2=-0.956 8<0知u,v负相关.
又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.
4.为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:
则下列说法一定正确的是( )
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(其中n=a+b+c+d).
临界值表:
A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
A 解析:由列联表中数据,计算χ2=eq \f(100×(300-800)2,30×70×50×50)=eq \f(100,21)≈4.762,且3.841<4.762<5.024,所以有95%的把握认为“小白鼠有无被感染与是否注射疫苗有关”.
5.设两个相关变量x和y分别满足xi=i,yi=2i-1,i=1,2,…,6.若相关变量x和y可拟合为非线性经验回归方程eq \(y,\s\up7(^))=2bx+a,则当x=7时,y的估计值为( )
A.32 B.63
C.64 D.128
C 解析:令zi=lg2yi=i-1,则eq \(z,\s\up7(^))=eq \(b,\s\up7(^))x+eq \(a,\s\up7(^)),
eq \x\t(x)=eq \f(1,6)(1+2+3+4+5+6)=3.5,eq \x\t(z)=eq \f(1,6)(0+1+2+3+4+5)=2.5,
eq \(a,\s\up7(^))=eq \x\t(z)-eq \(b,\s\up7(^))·eq \x\t(x)=2.5-1×3.5=-1,
所以eq \(z,\s\up7(^))=x-1,即eq \(y,\s\up7(^))=2x-1,所以当x=7时, eq \(y,\s\up7(^))=27-1=64.
6.(2021·银川模拟)在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N=100m,m∈N*),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若在犯错误的概率不超过0.001的前提下,认为性别与是否喜欢该学科有关,则可以推测N的最小值为( )
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
A.400 B.300
C.200 D.100
B 解析:设男、女学生的人数分别为50m,50m,建立2×2列联表如下:
由表中的数据,χ2=eq \f(100m×(30m×30m-20m×20m)2,50m×50m×50m×50m)=4m,
由题意可得,4m>10.828,解得m>2.707,
又m∈N*,所以m=3,N=300.故选B.
7.下列说法:①分类变量A与B的随机变量χ2越大,说明“A与B有关系”的可信度越大;②以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④若变量x和y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关,正确的个数是________.
3 解析:对于①,根据独立性原理知,分类变量A与B的随机变量χ2越大,说明“A与B有关系”的可信度越大,所以①正确;
对于②,根据线性回归模型和对数的运算性质知,以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程z=0.3x+4,则c,k的值分别是e4和0.3,所以②正确;
对于③,利用残差分析模型拟合效果时,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以③正确;
对于④,若变量x和y满足关系y=-0.1x+1,且变量y与z正相关,则x与z是负相关,所以④错误.
综上,正确命题的序号是①②③,共3个.
8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查对临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④有95%的把握认为这种血清不能起到预防感冒的作用.
① 解析:因为χ2≈3.918>3.841,
所以对于①,在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”,故①正确;
对于②,若某人未使用该血清,不能说“他在一年中有95%的可能性得感冒”,故②错误;
对于③,这种血清有95%的可能性预防感冒,不是有效率为95%,故③错误;
对于④,有95%的把握认为这种血清能起到预防感冒的作用,故④错误.
9.为了调查某地区中学生是否喜欢踢足球,用简单随机抽样的方法从该地区调查了500名学生,调查结果如下:
(1)求x,y,z的值;
(2)依据小概率值α=0.01的独立性检验,能否认为该地区的中学生是否喜欢踢足球与性别有关?
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
解:(1)由列联表可得,y=70-40=30,z=500-70=430,所以x=430-270=160.
(2)零假设为H0:该地区的中学生是否喜欢踢足球与性别无关.由列联表中的数据可得,χ2=eq \f(500×(40×270-160×30)2,70×430×200×300)≈9.966 8>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该地区的中学生是否喜欢踢足球与性别有关,此推断犯错误的概率不大于0.01.
10.(2022·中卫一模)医学中判断男生的体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175 cm的人,其标准体重为175-105=70 kg,一个人实际体重超过了标准体重,我们就说该人体重超标了.已知某班共有30名男生,从这30名男生中随机选取6名,其身高和体重的数据如表所示:
(1)从这6人中任选2人,求恰有1人体重超标的概率;
(2)依据上述表格信息,用最小二乘法求出了体重y对身高x的经验回归方程:eq \(y,\s\up7(^))=0.65x+eq \(a,\s\up7(^)),但在用经验回归方程预报其他同学的体重时,预报值与实际值吻合不好,需要对上述数据进行残差分析,按经验,对残差在区间[-3.5,3.5]之外的同学要重新采集数据.上述随机抽取的编号为3,4,5,6的四人中,有哪几位同学要重新采集数据?
参考公式:残差eq \(e,\s\up7(^))i=yi-eq \(b,\s\up7(^))xi-eq \(a,\s\up7(^)).
解:(1)由图表可知,编号1的标准体重为165-105=60;
编号2的标准体重为171-105=66;
编号3的标准体重为160-105=55;
编号4的标准体重为173-105=68;
编号5的标准体重为178-105=73;
编号6的标准体重为167-105=62.
故编号3,4两人体重超标,故从6人中任取两人有Ceq \\al(2,6)=15种取法,恰有一人体重超标共有Ceq \\al(1,2)Ceq \\al(1,4)=8种情况,
故p=eq \f(8,15).
(2)eq \x\t(x)=eq \f(1,6)×(165+171+160+173+178+167)=169,
eq \(y,\s\up7(-))=eq \f(1,6)×(60+63+62+70+71+58)=64,
因为经验回归直线必过样本中心(169,64),所以64=0.65×169+eq \(a,\s\up7(^)),解得eq \(a,\s\up7(^))=-45.85,
则eq \(y,\s\up7(^))=0.65x-45.85.
残差分析:
eq \(e,\s\up7(^))3=62-0.65×160+45.85=3.85;
eq \(e,\s\up7(^))4=70-0.65×173+45.85=3.4;
eq \(e,\s\up7(^))5=71-0.65×178+45.85=1.15;
eq \(e,\s\up7(^))6=58-0.65×167+45.85=-4.7.
故3号、6号需要重新采集数据.
B组 新高考培优练
11.针对当下的“读书热”,某大学对“学生性别和喜欢读书是否有关”做了一次调查,随机调查了40名男生和50名女生,经统计得到如下的2×2列联表:
则a-b=( )
A.9 B.10
C.11 D.12
A 解析:a=40-19=21,b=50-38=12,所以a-b=9.故选A.
12.(2021·朝阳区期末)为了研究某校男生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该校随机抽取20名男生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设y关于x的经验回归方程为eq \(y,\s\up7(^))=eq \(b,\s\up7(^))x+eq \(a,\s\up7(^)).已知xi=460,yi=3 240,eq \(b,\s\up7(^))=4,该校某男生的脚长为25.5 cm,据此估计其身高为( )
A.164 cm B.168 cm
C.172 cm D.176 cm
C 解析:eq \x\t(x)=eq \f(460,20)=23,eq \x\t(y)=eq \f(3 240,20)=162,所以162=4×23+a,解得eq \(a,\s\up7(^))=70.
所以经验回归方程为eq \(y,\s\up7(^))=4x+70,当x=25.5时,y=172.故选C.
13.福建省采用“3+1+2”新高考模式,其中“3”为全国统考科目语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的120人,选考历史的80人,统计各选科人数如表:
则下列说法正确的是( )
附:χ2=eq \f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d)).
A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
B.物理类的学生中选择生物的比例比历史类的学的中选择生物的比例低
C.在犯错误的概率不超过0.1的前提下认为选择生物与选考类别有关
D.在犯错误的概率不超过0.05的前提下不能认为选择生物与选考类别有关
D 解析:由表中的数据可得,物理类中选择地理的比例为eq \f(50,120)=eq \f(5,12)=eq \f(20,48),历史类中选择地理的比例为eq \f(45,80)=eq \f(9,16)=eq \f(27,48).因为eq \f(20,48)
因为eq \f(26,48)>eq \f(21,48),所以物理类的学生中选择生物的比例比历史类的学生中选择生物的比例高,故选项B错误.
由表中的数据可知,物理类中选生物和不选生物的人数分别是65,55,合计120人,
历史类中选生物和不选生物的人数分别是35,45,合计80人,200人中选生物和不选生物的人数均是100,故χ2=eq \f((a+b+c+d)(ad-bc)2,(a+b)(a+c)(b+d)(c+d))=eq \f(200×(65×45-35×55)2,100×100×120×80)≈2.083.因为2.083<2.706,故没有90%以上的把握认为选择生物与选考类别有关,故选项C错误.
因为2.083<3.841,故没有95%以上的把握认为选择生物与选考类别有关,故选项D正确.故选D.
14.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
0.025 解析:2×2列联表如下:
所以χ2=eq \f(105×(45×20-30×10)2,75×30×50×55)≈6.109>5.024,
所以认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.025.
15.(2022·开封期末)某商家统计,甲产品以往的先进技术投入xi(千元)与月产利润yi(千元)(i=1,2,3,…,8)的数据可以用函数y=eq \(a,\s\up7(^))+50eq \r(x)来拟合,且eq \x\t(y)=9 630,eq \x\t(t)=6.8,其中ti=eq \r(xi),eq \x\t(t)=eq \f(1,8)ti,eq \x\t(y)=eq \f(1,8)yi,预测先进生产技术投入为64千元时,甲产品的月产利润大约为 ________千元.
9 690 解析:a=eq \x\t(y)-50eq \x\t(t)=9 630-50×6.8=9 290,所以经验回归方程为y=9 290+50eq \r(x),
当x=64时,月产利润y的预报值eq \(y,\s\up7(^))=9 290+50×8=9 690(千元).
16.如图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.
由折线图看出,可用一元线性回归模型拟合y与t的关系,请建立y关于t的经验回归方程(系数精确到0.01),并预测2022年我国生活垃圾无害化处理量.
解:由题图中的数据以及参考数据可得,eq \x\t(t)=4,
所以eq \(b,\s\up7(^))=eq \f(2.89,28)≈0.10,
则eq \(a,\s\up7(^))=eq \x\t(y)-eq \(b,\s\up7(^))eq \x\t(t)≈1.331-0.10×4≈0.93,
故y关于t的经验回归方程为eq \(y,\s\up7(^))=0.93+0.1t.
因为2022年对应的t=12,代入经验回归方程可得,eq \(y,\s\up7(^))=0.93+0.1×12=2.13,
所以预测2022年我国生活垃圾无害化处理量为2.13亿吨.
17.在一次抽样调查中测得5个样本点,得到如表及相关数据.
表中ti=eq \f(1,xi).
(1)请从样本相关系数的角度,分析y=a+bx与y=c+k·x-1哪一个适宜作为y关于x的回归模型;
(2)根据(1)的判断结果试建立y与x的经验回归方程(计算结果精确到0.01);
(3)在(2)的条件下,设z=y-x且x∈[4,+∞),试求z的最大值(计算结果精确到0.01).
解:(1)令t=eq \f(1,x),数据整理得:
模型y=a+bx的样本相关系数r1=eq \f(-32.8,39.86)≈-0.82;
模型y=c+kt的样本相关系数r2=eq \f(38.45,39.86)≈0.96.
因为|r2|>|r1|,所以y=c+kx-1适宜作为y关于x的回归模型.
(2)eq \x\t(t)=eq \x\t(x)=1.55,eq \x\t(y)=7.2.eq \(b,\s\up7(^))=eq \f(38.45,9.3)≈4.13,eq \(a,\s\up7(^))=eq \x\t(y)-eq \(b,\s\up7(^))eq \x\t(t)≈0.80,
所以y关于x的非线性经验回归方程为eq \(y,\s\up7(^))=0.80+eq \f(4.13,x).
(3)z=y-x=0.80+eq \f(4.13,x)-x,x≥4.
因为z′=-eq \f(4.13,x2)-1<0恒成立,所以z=0.80+eq \f(4.13,x)-x在[4,+∞)上单调递减.
所以z的最大值为0.80+eq \f(4.13,4)-4≈-2.17.未治愈
治愈
合计
服用药物
10
40
50
未服用药物
20
30
50
合计
30
70
100
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
喜欢课程
不喜欢课程
合计
男生
30m
20m
50m
女生
20m
30m
50m
合计
50m
50m
100m
项目
男
女
合计
喜欢踢足球
40
y
70
不喜欢踢足球
x
270
z
合计
500
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.076
3.841
5.024
6.635
7.879
10.828
编号
1
2
3
4
5
6
身高x(cm)
165
171
160
173
178
167
体重y(kg)
60
63
62
70
71
58
喜欢
不喜欢
合计
男
a
19
女
38
b
合计
选择科目选考类别
思想政治
地理
化学
生物
物理类
35
50
90
65
历史类
50
45
30
35
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
α
0.05
0.025
0.010
0.001
xα
3.841
5.024
6.635
10.828
通过
未通过
合计
集中培训
45
10
55
分散培训
30
20
50
合计
75
30
105
x
0.25
0.5
1
2
4
t
4
2
1
0.5
0.25
y
16
12
5
2
1
备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。
高考数学一轮复习课时分层作业65成对数据的统计分析含答案: 这是一份高考数学一轮复习课时分层作业65成对数据的统计分析含答案,文件包含高考数学一轮复习课时分层作业65成对数据的统计分析含答案docx、高考数学一轮复习课时分层作业65参考答案docx等2份试卷配套教学资源,其中试卷共16页, 欢迎下载使用。