还剩11页未读,
继续阅读
成套系列资料,整套一键下载
新教材2023年高中数学第八章成对数据的统计分析检测题新人教A版选择性必修第三册
展开
这是一份新教材2023年高中数学第八章成对数据的统计分析检测题新人教A版选择性必修第三册,共14页。
第八章检测题
考试时间120分钟,满分150分.
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法中正确的是( C )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的
D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的
[解析] 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故选C.
2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( B )
A.总偏差平方和 B.残差平方和
C.回归平方和 D.相关指数
3.相关变量x,y的样本数据如下:
x
1
2
3
4
5
y
2
2
3
5
6
经回归分析可得y与x线性相关,并由最小二乘法求得经验回归方程=1.1x+a,则a=( C )
A.0.1 B.0.2
C.0.3 D.0.4
[解析] 由题意,==3,
==3.6,
∵经验回归方程为=1.1x+a,
∴3.6=1.1×3+a,
∴a=0.3.故选C.
4.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
Y
X
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于同一样本,以下数据能说明X与Y有关的可能性最大的一组为( D )
A.a=5,b=10,c=6,d=7
B.a=5,b=6,c=10,d=7
C.a=7,b=6,c=10,d=5
D.a=6,b=7,c=10,d=5
[解析] 对于同一样本,|ad-bc|越小,说明X与Y相关性越弱,而|ad-bc|越大,说明X与Y相关性越强,通过计算知,对于选项A,B,C,都有|ad-bc|=|35-60|=25;对于选项D,有|ad-bc|=40.故选D.
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20名市民,得到如下2×2列联表:
A
B
总计
认可
13
5
18
不认可
7
15
22
总计
20
20
40
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.1
0.05
0.010
0.005
k
2.706
3.841
6.635
7.879
根据表中的数据,下列说法中正确的是( D )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
[解析] 由题意,根据2×2列联表中的数据,得χ2=≈6.465,又3.841<6.465<6.635,所以可以在犯错误的概率不超0.05的前提下认为“是否认可与城市的拥堵情况有关”.故选D.
6.废品率x%与每吨生铁成本y(元)之间的经验回归方程为=234+3x,表明( B )
A.废品率每增加1%,生铁成本增加3x元
B.废品率每增加1%,生铁成本每吨平均增加3元
C.废品率每增加1%,生铁成本增加234元
D.废品率不变,生铁成本为234元
[解析] 经验回归方程表示废品率x%与每吨生铁成本y(元)之间的相关关系,当经验回归方程为=234+3x时,表明废品率每增加1%,生铁成本每吨平均增加3元,故选B.
7.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到χ2≈9.643,根据临界值表,以下说法正确的是( D )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关
[解析] ∵χ2≈9.643>7.879,P(xα≥7.879)≈0.005,∴在犯错误的概率不超过0.005的前提下认为作文成绩优秀与课外阅读量大有关.故选D.
8.两个相关变量满足如下关系:
x
10
15
20
25
30
y
1 003
1 005
1 010
1 011
1 014
两变量的经验回归方程为( A )
A.=0.56x+997.4 B.=0.63x-231.2
C.=50.2x+501.4 D.=60.4x+400.7
[解析] ==20,
==1 008.6
利用公式可得=
=0.56,又=-=997.4.
∴经验回归方程为=0.56x+997.4.故选A.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0分)
9.晚上睡眠充足是提高学习效率的必要条件,高中甲的高三年级学生晚上10点10分必须休息,高中乙的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中甲有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( AC )
附:K2=.
P(K2≥k0)
0.050
0.010
0.005
0.001
k0
3.841
6.635
7.879
10.828
A.高中甲的前50名学生中有60%的学生学习效率高
B.高中乙的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
[解析] 高中甲的前50名学生中有30人学习效率高,即×100%=60%,所以A正确;高中乙的前50名学生中有10人学习效率高,即×100%=20%,所以B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写2×2列联表如下:
学习效率高
学习效率不高
合计
高中甲
30
20
50
高中乙
10
40
50
合计
40
60
100
计算观测值K2==≈16.667>10.828,
所以有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”, C正确;认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过0.05,所以D错误.故选AC.
10.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=-5x+150,则下列结论正确的是( AD )
A.y与x具有负的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=-5
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
[解析] 由经验回归方程=-5x+150可知y与x具有负的线性相关关系,故A正确;y与x之间的线性相关系数|r|≤1,故B错误;当销售价格为10元时,销售量为-5×10+150=100(件)左右,故C错误,D正确.
11.(2022·北京一零一中学)下列说法中正确的有( ABD )
A.一支田径队有男、女运动员共98人,其中男运动员有56人.按男、女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是12人
B.在某项测量中,测量结果X服从正态分布N( 1,σ2 )(σ>0),若X在(0,1)内取值的概率为0.4.则X在(0,2)内取值的概率为0.8
C.废品率x%和每吨生铁成本y (元)之间的回归直线方程为=2x+256,这表明废品率每增加1%,生铁成本每吨大约增加258元
D.为了检验某种血清预防感冒的作用,把500名未使用血清和使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防作用”,利用2×2列联表计算得χ2的观测值k≈3.918,经查对临界值表知P(χ2≥3.841 )≈0.05,由此,得出以下判断:在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防的作用”
[解析] ∵田径队有男、女运动员共98人,其中男运动员有56人,
∴这支田径队有女运动员98-56=42 (人),
用分层抽样的方法从该队的全体运动员中抽取一个容量为28的样本,
∵每个个体被抽到的概率是=.
∵田径队有女运动员42人,
∴女运动员要抽取42×=12(人).故A正确.
根据正态分布的规律,测量结果X服从正态分布
N(1,σ2)(σ>0),若X在(0,1)内取值的概率为0.4,则X在(0,2)内取值的概率为2×0.4=0.8.故B正确.
废品率x%和每吨生铁成本y(元)之间的回归直线方程为=2x+256,
这表明废品率每增加1%,生铁成本每吨大约增加2元.
故C不正确.
根据独立性检验的方法与结论可知,D正确.故选ABD.
12.对于表中x,y之间的一组数据:
x
1
3
6
7
8
y
1
2
3
4
5
甲、乙两位同学给出的拟合直线方程分别为①=x+1和②=x+.若通过分析得出②的拟合效果好,则下列分析理由正确的是( BCD )
A.①的残差和大于②的残差和,所以②拟合效果更好
B.①的残差平方和大于②的残差平方和,所以②拟合效果更好
C.①的R2小于②的R2,所以②拟合效果更好
D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好
[解析] 不可以根据残差和的大小来分析模型的拟合效果的好坏,故A错误;用=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和即残差平方和为:S1=2+(2-2)2+(3-3)2+2+2=.用=x+作为拟合直线时,所得残差平方和为:S2=(1-1)2+(2-2)2+2+(4-4)2+2=,∴S2
三、填空题(本大题共4小题,每小题5分,共20分)
13.某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形图(如图所示),则这80名学生中喜欢国画的人数为_58__.
[解析] 由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+30×60%= 58.
14.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对于x呈线性相关关系,且经验回归方程为=+x,其中已知=1.23,请估计使用年限为20年时,维修费用为_24.68__万元.
[解析] 由表中数据可知:
==4,
==5.
又∵经验回归直线一定经过样本点中心(,),
∴5=+1.23×4,∴= 0.08,
∴经验回归方程为=1.23x+0.08.
故估计使用年限为20年时,维修费用为=1.23×20+0.08=24.68(万元).
15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得经验回归方程为=-4x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为___.
[解析] 样本点中心坐标为,所以=80+4×=106,所以经验回归方程为=-4x+106,经验证可知有2个点位于回归直线左下方,其概率为=.
16.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
20
a
25
女生
b
15
c
合计
30
d
50
则a+b+c+d=_60__;在犯错误的概率不超过_0.005__的前提下认为喜爱打篮球与性别有关.
附:χ2=.
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
[解析] 由列联表数据可求得
a=5,b=10,c=25,d=20,
所以a+b+c+d=60;χ2=≈8.33>7.879,
所以在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”.
四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)某大型企业人力资源部为了研究企业员工的工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示.
积极支持企业改革
不太赞成企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189
李明和张宇都对该题进行了独立性检验的分析,李明的结论是“在犯错误的概率不超过 0.01 的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”;张宇的结论是“在犯错误的概率不超过0.005的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”.
他们两人的结论正确吗?他们的结论为什么不一样?
[解析] 正确.由列联表中的数据,
得χ2=≈10.759.
10.759>7.879>6.635,
若以7.879为临界值,则在犯错误的概率不超过0.005的前提下认为企业员工的工作积极性和对待企业改革的态度有关系;
若以6.635为临界值,则在犯错误的概率不超过0.01的前提下认为企业员工的工作积极性和对待企业改革的态度有关系.
18.(本小题满分12分)某地区某农产品近几年的产量统计如表:
年份
2017
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
6
年产量(万吨)
6.6
6.7
7
7.1
7.2
7.4
(1)根据表中数据,建立y关于x的经验回归方程=x+;
(2)根据经验回归方程预测2023年该地区该农产品的年产量.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.(参考数据:(xi-)(yi-)=2.8,计算结果保留到小数点后两位)
[解析] (1)由题意可知:==3.5,==7,
(xi-)2=(-2.5)2+(-1.5)2+(-0.5)2+0.52+1.52+2.52=17.5,
所以===0.16,
又=-=7-0.16×3.5=6.44,
故y关于x的经验回归方程为=0.16x+6.44.
(2)由(1)可得,当年份为2023年时,年份代码x=7,此时=0.16×7+6.44=7.56.
所以可预测2023年该地区该农产品的年产量约为7.56万吨。
19.(本小题满分12分)某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费支出为10万元时,销售额为多少?
附:=,=-.
参考数据:=145,iyi=1 380.
[解析] (1)根据表格中的5组数据,绘制散点图如图所示:
(2)由表格数据可知:
= (2+4+5+6+8)=5,
=(30+40+60+50+70)=50,
故===6.5,
=-=50-6.5×5=17.5,
故所求经验回归方程为=6.5x+17.5.
(3)由(2)知,=6.5x+17.5,
令x=10,解得=82.5.
故广告费支出为10万元时,销售额约为82.5万元.
20.(本小题满分12分)(2021·湖南长沙市雅礼中学)某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起, 第x天的高度为y cm,测得一些数据如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如图:
(1)请根据散点图判断,y=ax+b与y=c+d中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程,并预测第144 天这株幼苗的高度(结果保留1位小数).
附:=,=-.
参考数据:
xi
yi
yi
140
28
56
283
[解析] (1)根据散点图可知,y=c+d更适宜作为幼苗高度y关于时间x的回归方程类型.
(2)令μ=,则y=c+d构造新的成对数据,如下表所示:
x
1
4
9
16
25
36
49
μ=
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
容易计算,=4,=8.
通过上表计算可得
===.
∵回归直线=μ+过点(,),
∴=-=-,
故y关于μ的经验回归直线方程为=μ-,从而可得y关于x的经验回归方程为=-.
令x=144,则=≈24.9,∴预测第144天幼苗的高度大约为24.9 cm.
21.(本小题满分12分)某调查组利用网站进行民意调查,数据调查显示,民生问题是百姓最关心的热点,参与调查者中关注此问题的约占80%,现从参与调查者中随机选出200人,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.
(1)求a;
(2)估计参与调查者的平均年龄;
(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,问是否有99%的把握认为是否关注民生与年龄有关?
附:
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=,n=a+b+c+d.
[解析] (1)∵0.010×10+0.015×10+0.030×10+a×10+0.010×10=1,
∴a=0.035.
(2)=0.01×10×20+0.015×10×30+0.035×10×40+0.03×10×50+0.01×10×60=41.5,
∴估计参与调查者的平均年龄为:41.5岁.
(3)选出的200人中,各组的人数分别为:
第1组:200×0.010×10=20人,第2组:200×0.015×10=30人,第3组:200×0.035×10=70人,第4组:200×0.030×10=60人,第5组:200×0.010×10=20人,
∴青少年组有20+30+70=120人,中老年组有200-120=80人,
∵参与调查者中关注此问题的约占80%,
∴有200×(1-80%)=40人不关心民生问题,
∴选出的200人中不关注民生问题的青少年有30人,
∴2×2列联表如下:
关注民生问题
不关注民生问题
合计
青少年
90
30
120
中老年
70
10
80
合计
160
40
200
∴K2==4.6875<6.635,
∴没有99%的把握认为是否关注民生与年龄有关.
22.(本小题满分12分)某人计划于2021年7月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如表所示:
月份
2021.02
2021.03
2021.04
2021.05
2021.06
月份编号t
1
2
3
4
5
实际销量y(万辆)
0.5
0.6
1
1.4
1.7
(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性经验回归方程:=t+,并预测2021年7月份当地该品牌新能源汽车的销量;
(2)已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到下表:
补贴金额预期值区间(万元)
[1,2)
[2,3)
[3,4)
[4,5)
[5,6)
[6,7]
频数
20
60
60
30
20
10
将频率视为概率,现用随机抽样的方法从该地区拟购买新能源汽车的所有消费者中随机抽取3人,记被抽取的3人中对补贴金额的心理预期值不低于3万元的人数为ξ.求ξ的分布列及均值E(ξ).
参考公式:==,=-.
[解析] (1)易知==3,
==1.04,
t=12+22+32+44+52=55,
tiyi=1×0.5+2×0.6+3×1+4×1.4+5×1.7=18.8
=
===0.32,
=-=1.04-0.32×3=0.08,
则y关于t的线性经验回归方程为=0.32t+0.08.
当t=6时,=2.
即2021年7月份当地该品牌新能源汽车的销量约为2万辆.
(2)根据题中的频数表可知,任意抽取1名拟购买新能源汽车的消费者,对补贴金额的心理预期值不低于3万元的概率为=.
由题意可知ξ~B,ξ的所有可能取值为0,1,2,3.
P(ξ=0)=C03=,
P(ξ=1)=C12=,
P(ξ=2)=C21=,
P(ξ=3)=C30=,
故ξ的分布列为
ξ
0
1
2
3
P
所以E(ξ)=3×=.
第八章检测题
考试时间120分钟,满分150分.
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法中正确的是( C )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的
D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的
[解析] 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故选C.
2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( B )
A.总偏差平方和 B.残差平方和
C.回归平方和 D.相关指数
3.相关变量x,y的样本数据如下:
x
1
2
3
4
5
y
2
2
3
5
6
经回归分析可得y与x线性相关,并由最小二乘法求得经验回归方程=1.1x+a,则a=( C )
A.0.1 B.0.2
C.0.3 D.0.4
[解析] 由题意,==3,
==3.6,
∵经验回归方程为=1.1x+a,
∴3.6=1.1×3+a,
∴a=0.3.故选C.
4.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
Y
X
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于同一样本,以下数据能说明X与Y有关的可能性最大的一组为( D )
A.a=5,b=10,c=6,d=7
B.a=5,b=6,c=10,d=7
C.a=7,b=6,c=10,d=5
D.a=6,b=7,c=10,d=5
[解析] 对于同一样本,|ad-bc|越小,说明X与Y相关性越弱,而|ad-bc|越大,说明X与Y相关性越强,通过计算知,对于选项A,B,C,都有|ad-bc|=|35-60|=25;对于选项D,有|ad-bc|=40.故选D.
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20名市民,得到如下2×2列联表:
A
B
总计
认可
13
5
18
不认可
7
15
22
总计
20
20
40
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.1
0.05
0.010
0.005
k
2.706
3.841
6.635
7.879
根据表中的数据,下列说法中正确的是( D )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
[解析] 由题意,根据2×2列联表中的数据,得χ2=≈6.465,又3.841<6.465<6.635,所以可以在犯错误的概率不超0.05的前提下认为“是否认可与城市的拥堵情况有关”.故选D.
6.废品率x%与每吨生铁成本y(元)之间的经验回归方程为=234+3x,表明( B )
A.废品率每增加1%,生铁成本增加3x元
B.废品率每增加1%,生铁成本每吨平均增加3元
C.废品率每增加1%,生铁成本增加234元
D.废品率不变,生铁成本为234元
[解析] 经验回归方程表示废品率x%与每吨生铁成本y(元)之间的相关关系,当经验回归方程为=234+3x时,表明废品率每增加1%,生铁成本每吨平均增加3元,故选B.
7.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到χ2≈9.643,根据临界值表,以下说法正确的是( D )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关
[解析] ∵χ2≈9.643>7.879,P(xα≥7.879)≈0.005,∴在犯错误的概率不超过0.005的前提下认为作文成绩优秀与课外阅读量大有关.故选D.
8.两个相关变量满足如下关系:
x
10
15
20
25
30
y
1 003
1 005
1 010
1 011
1 014
两变量的经验回归方程为( A )
A.=0.56x+997.4 B.=0.63x-231.2
C.=50.2x+501.4 D.=60.4x+400.7
[解析] ==20,
==1 008.6
利用公式可得=
=0.56,又=-=997.4.
∴经验回归方程为=0.56x+997.4.故选A.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0分)
9.晚上睡眠充足是提高学习效率的必要条件,高中甲的高三年级学生晚上10点10分必须休息,高中乙的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中甲有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( AC )
附:K2=.
P(K2≥k0)
0.050
0.010
0.005
0.001
k0
3.841
6.635
7.879
10.828
A.高中甲的前50名学生中有60%的学生学习效率高
B.高中乙的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
[解析] 高中甲的前50名学生中有30人学习效率高,即×100%=60%,所以A正确;高中乙的前50名学生中有10人学习效率高,即×100%=20%,所以B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写2×2列联表如下:
学习效率高
学习效率不高
合计
高中甲
30
20
50
高中乙
10
40
50
合计
40
60
100
计算观测值K2==≈16.667>10.828,
所以有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”, C正确;认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过0.05,所以D错误.故选AC.
10.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=-5x+150,则下列结论正确的是( AD )
A.y与x具有负的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=-5
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
[解析] 由经验回归方程=-5x+150可知y与x具有负的线性相关关系,故A正确;y与x之间的线性相关系数|r|≤1,故B错误;当销售价格为10元时,销售量为-5×10+150=100(件)左右,故C错误,D正确.
11.(2022·北京一零一中学)下列说法中正确的有( ABD )
A.一支田径队有男、女运动员共98人,其中男运动员有56人.按男、女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是12人
B.在某项测量中,测量结果X服从正态分布N( 1,σ2 )(σ>0),若X在(0,1)内取值的概率为0.4.则X在(0,2)内取值的概率为0.8
C.废品率x%和每吨生铁成本y (元)之间的回归直线方程为=2x+256,这表明废品率每增加1%,生铁成本每吨大约增加258元
D.为了检验某种血清预防感冒的作用,把500名未使用血清和使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防作用”,利用2×2列联表计算得χ2的观测值k≈3.918,经查对临界值表知P(χ2≥3.841 )≈0.05,由此,得出以下判断:在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防的作用”
[解析] ∵田径队有男、女运动员共98人,其中男运动员有56人,
∴这支田径队有女运动员98-56=42 (人),
用分层抽样的方法从该队的全体运动员中抽取一个容量为28的样本,
∵每个个体被抽到的概率是=.
∵田径队有女运动员42人,
∴女运动员要抽取42×=12(人).故A正确.
根据正态分布的规律,测量结果X服从正态分布
N(1,σ2)(σ>0),若X在(0,1)内取值的概率为0.4,则X在(0,2)内取值的概率为2×0.4=0.8.故B正确.
废品率x%和每吨生铁成本y(元)之间的回归直线方程为=2x+256,
这表明废品率每增加1%,生铁成本每吨大约增加2元.
故C不正确.
根据独立性检验的方法与结论可知,D正确.故选ABD.
12.对于表中x,y之间的一组数据:
x
1
3
6
7
8
y
1
2
3
4
5
甲、乙两位同学给出的拟合直线方程分别为①=x+1和②=x+.若通过分析得出②的拟合效果好,则下列分析理由正确的是( BCD )
A.①的残差和大于②的残差和,所以②拟合效果更好
B.①的残差平方和大于②的残差平方和,所以②拟合效果更好
C.①的R2小于②的R2,所以②拟合效果更好
D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好
[解析] 不可以根据残差和的大小来分析模型的拟合效果的好坏,故A错误;用=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和即残差平方和为:S1=2+(2-2)2+(3-3)2+2+2=.用=x+作为拟合直线时,所得残差平方和为:S2=(1-1)2+(2-2)2+2+(4-4)2+2=,∴S2
13.某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形图(如图所示),则这80名学生中喜欢国画的人数为_58__.
[解析] 由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+30×60%= 58.
14.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对于x呈线性相关关系,且经验回归方程为=+x,其中已知=1.23,请估计使用年限为20年时,维修费用为_24.68__万元.
[解析] 由表中数据可知:
==4,
==5.
又∵经验回归直线一定经过样本点中心(,),
∴5=+1.23×4,∴= 0.08,
∴经验回归方程为=1.23x+0.08.
故估计使用年限为20年时,维修费用为=1.23×20+0.08=24.68(万元).
15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得经验回归方程为=-4x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为___.
[解析] 样本点中心坐标为,所以=80+4×=106,所以经验回归方程为=-4x+106,经验证可知有2个点位于回归直线左下方,其概率为=.
16.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
20
a
25
女生
b
15
c
合计
30
d
50
则a+b+c+d=_60__;在犯错误的概率不超过_0.005__的前提下认为喜爱打篮球与性别有关.
附:χ2=.
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
[解析] 由列联表数据可求得
a=5,b=10,c=25,d=20,
所以a+b+c+d=60;χ2=≈8.33>7.879,
所以在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”.
四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)某大型企业人力资源部为了研究企业员工的工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示.
积极支持企业改革
不太赞成企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189
李明和张宇都对该题进行了独立性检验的分析,李明的结论是“在犯错误的概率不超过 0.01 的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”;张宇的结论是“在犯错误的概率不超过0.005的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”.
他们两人的结论正确吗?他们的结论为什么不一样?
[解析] 正确.由列联表中的数据,
得χ2=≈10.759.
10.759>7.879>6.635,
若以7.879为临界值,则在犯错误的概率不超过0.005的前提下认为企业员工的工作积极性和对待企业改革的态度有关系;
若以6.635为临界值,则在犯错误的概率不超过0.01的前提下认为企业员工的工作积极性和对待企业改革的态度有关系.
18.(本小题满分12分)某地区某农产品近几年的产量统计如表:
年份
2017
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
6
年产量(万吨)
6.6
6.7
7
7.1
7.2
7.4
(1)根据表中数据,建立y关于x的经验回归方程=x+;
(2)根据经验回归方程预测2023年该地区该农产品的年产量.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.(参考数据:(xi-)(yi-)=2.8,计算结果保留到小数点后两位)
[解析] (1)由题意可知:==3.5,==7,
(xi-)2=(-2.5)2+(-1.5)2+(-0.5)2+0.52+1.52+2.52=17.5,
所以===0.16,
又=-=7-0.16×3.5=6.44,
故y关于x的经验回归方程为=0.16x+6.44.
(2)由(1)可得,当年份为2023年时,年份代码x=7,此时=0.16×7+6.44=7.56.
所以可预测2023年该地区该农产品的年产量约为7.56万吨。
19.(本小题满分12分)某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费支出为10万元时,销售额为多少?
附:=,=-.
参考数据:=145,iyi=1 380.
[解析] (1)根据表格中的5组数据,绘制散点图如图所示:
(2)由表格数据可知:
= (2+4+5+6+8)=5,
=(30+40+60+50+70)=50,
故===6.5,
=-=50-6.5×5=17.5,
故所求经验回归方程为=6.5x+17.5.
(3)由(2)知,=6.5x+17.5,
令x=10,解得=82.5.
故广告费支出为10万元时,销售额约为82.5万元.
20.(本小题满分12分)(2021·湖南长沙市雅礼中学)某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起, 第x天的高度为y cm,测得一些数据如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如图:
(1)请根据散点图判断,y=ax+b与y=c+d中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程,并预测第144 天这株幼苗的高度(结果保留1位小数).
附:=,=-.
参考数据:
xi
yi
yi
140
28
56
283
[解析] (1)根据散点图可知,y=c+d更适宜作为幼苗高度y关于时间x的回归方程类型.
(2)令μ=,则y=c+d构造新的成对数据,如下表所示:
x
1
4
9
16
25
36
49
μ=
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
容易计算,=4,=8.
通过上表计算可得
===.
∵回归直线=μ+过点(,),
∴=-=-,
故y关于μ的经验回归直线方程为=μ-,从而可得y关于x的经验回归方程为=-.
令x=144,则=≈24.9,∴预测第144天幼苗的高度大约为24.9 cm.
21.(本小题满分12分)某调查组利用网站进行民意调查,数据调查显示,民生问题是百姓最关心的热点,参与调查者中关注此问题的约占80%,现从参与调查者中随机选出200人,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.
(1)求a;
(2)估计参与调查者的平均年龄;
(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,问是否有99%的把握认为是否关注民生与年龄有关?
附:
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=,n=a+b+c+d.
[解析] (1)∵0.010×10+0.015×10+0.030×10+a×10+0.010×10=1,
∴a=0.035.
(2)=0.01×10×20+0.015×10×30+0.035×10×40+0.03×10×50+0.01×10×60=41.5,
∴估计参与调查者的平均年龄为:41.5岁.
(3)选出的200人中,各组的人数分别为:
第1组:200×0.010×10=20人,第2组:200×0.015×10=30人,第3组:200×0.035×10=70人,第4组:200×0.030×10=60人,第5组:200×0.010×10=20人,
∴青少年组有20+30+70=120人,中老年组有200-120=80人,
∵参与调查者中关注此问题的约占80%,
∴有200×(1-80%)=40人不关心民生问题,
∴选出的200人中不关注民生问题的青少年有30人,
∴2×2列联表如下:
关注民生问题
不关注民生问题
合计
青少年
90
30
120
中老年
70
10
80
合计
160
40
200
∴K2==4.6875<6.635,
∴没有99%的把握认为是否关注民生与年龄有关.
22.(本小题满分12分)某人计划于2021年7月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如表所示:
月份
2021.02
2021.03
2021.04
2021.05
2021.06
月份编号t
1
2
3
4
5
实际销量y(万辆)
0.5
0.6
1
1.4
1.7
(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性经验回归方程:=t+,并预测2021年7月份当地该品牌新能源汽车的销量;
(2)已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到下表:
补贴金额预期值区间(万元)
[1,2)
[2,3)
[3,4)
[4,5)
[5,6)
[6,7]
频数
20
60
60
30
20
10
将频率视为概率,现用随机抽样的方法从该地区拟购买新能源汽车的所有消费者中随机抽取3人,记被抽取的3人中对补贴金额的心理预期值不低于3万元的人数为ξ.求ξ的分布列及均值E(ξ).
参考公式:==,=-.
[解析] (1)易知==3,
==1.04,
t=12+22+32+44+52=55,
tiyi=1×0.5+2×0.6+3×1+4×1.4+5×1.7=18.8
=
===0.32,
=-=1.04-0.32×3=0.08,
则y关于t的线性经验回归方程为=0.32t+0.08.
当t=6时,=2.
即2021年7月份当地该品牌新能源汽车的销量约为2万辆.
(2)根据题中的频数表可知,任意抽取1名拟购买新能源汽车的消费者,对补贴金额的心理预期值不低于3万元的概率为=.
由题意可知ξ~B,ξ的所有可能取值为0,1,2,3.
P(ξ=0)=C03=,
P(ξ=1)=C12=,
P(ξ=2)=C21=,
P(ξ=3)=C30=,
故ξ的分布列为
ξ
0
1
2
3
P
所以E(ξ)=3×=.
相关资料
更多