所属成套资源:高考二轮复习重难点专题突破(含解析)
- 解三角形及其应用练习题 试卷 6 次下载
- 与三角形周长、面积有关的问题 试卷 5 次下载
- 方案与决策问题 试卷 2 次下载
- 互斥事件和独立事件的概率计算练习题 试卷 6 次下载
- 随机变量及其分布练习题 试卷 4 次下载
统计案例(精选)练习题
展开这是一份统计案例(精选)练习题,共27页。试卷主要包含了27x−a,决定系数R2≈0,6788,3,2x+2,65≈104,635<10<10,【答案】B,【答案】D,【答案】C等内容,欢迎下载使用。
统计案例
副标题
得分
1. 为了了解空气质量指数(AQI)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI值,并制作了如图散点图.
(1)环保小组准备做y与x的线性回归分析,算得y与x的相关系数为γ≈−0.58,试分析y与x的线性相关关系?
(2)环保小组还发现散点有分区聚集的特点,尝试作聚类分析.用直线x=100与y=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5、10、10、35,并初步认定“参加户外健身运动的人数不少于100与AQI值不大于100有关联”,试分析该初步认定的犯错率是否小于1%?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
2. 某车间加工零件的数量x与加工时间y的统计数据如表:
零件数x(个)
10
20
30
加工时间y(分钟)
21
30
39
现已求得上表数据的回归方程y=bx+a中的b值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )
A. 84分钟 B. 94分钟 C. 102分钟 D. 112分钟
3. 观察下列散点图,关于两个变量的相关关系推断正确的是( )
(1) (2) (3)
A. (1)为正相关,(2)为负相关,(3)为不相关
B. (1)为负相关,(2)为不相关,(3)为正相关
C. (1)为负相关,(2)为正相关,(3)为不相关
D. (1)为正相关,(2)为不相关,(3)为负相关
4. 如表是一个2×2列联表:则表中a,b的值分别为( )
y1
y2
合计
x1
a
21
73
x2
22
25
47
合计
b
46
120
A. 94,72 B. 52,50 C. 52,74 D. 74,52
5. 下列表述中,正确的个数是( )
①将一组数据中的每一个数据都加上同一个常数后,方差不变;
②设有一个回归方程y=3−5x,变量x增加1个单位时,y平均增加5个单位;
③设具有相关关系的两个变量x,y的相关系数为r,那么r越接近于0,x,y之间的线性相关程度越高;
A. 0 B. 1 C. 2 D. 3
6. 观察如图所示的等高条形图,其中最有把握认为两个分类变量x,y之间有关系的是( )
A. B.
C. D.
7. 用模型y=cekx拟合一组数据时,为了求出回归方程,设z=lny,其变换后得到线性回归方程为z=0.3x+4,则c=( )
A. 0.3 B. e0.3 C. 4 D. e4
8. 某产品的研发投入费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:
根据表中的数据可得回归直线方程y=2.27x−a,决定系数R2≈0.96,以下说法正确的是
A. 第四个样本点对应的残差e4=−1,回归模型的拟合效果一般
B. 第四个样本点对应的残差e4=1,回归模型的拟合效果较好
C. 销售量y的多少有96%是由研发投入费用引起的
D. 销售量y的多少有4%是由研发投入费用引起的
9. 在对具有相关关系的两个变量进行回归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析。下列选项为四个同学根据自己所得数据的散点图建立的非线性模型,且散点图的样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有( )
A. y=c1x2+c2x B. y=x+c1x+c2
C. y=c1+ln(x+c2) D. y=c1ex+c2
10. 以下4幅散点图所对应的样本相关系数的大小关系为 .
11. 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得表格中的数据,
x
6
8
10
12
y
2
3
5
6
请根据表格中提供的数据,求出y关于x的线性回归方程: .
(参考公式:b=i=1nxiyi−nxyi=1nxi2−n(x)2=i=1n(xi−x)(yi−y)i=1n(xi−x)2,a=y−bx)
12. 商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.下表所示是某项目在中国和南亚某国投资额和相应利润的统计表.
项目落地国
中国
南亚某国
投资额x(亿元)
10
11
12
13
14
10
11
12
13
14
利润y(亿元)
11
12
14
16
19
12
13
13
14
15
请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 ,并根据回归直线方程预计在该国投资15亿元所获得的利润是 亿元.
参考数据和公式:i=15(xi−x)2=10,中国i=15(xi−x)(yi−y)=20,南亚某国i=15(xi−x)(yi−y)=7 b=i=15(xi−x)(xi−y)i=15(xi−x)2,a=y−bx.
13. 2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式,某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如表所示:
(表一)
了解情况
Y
N
人数
140
60
(表二)
男
女
合计
Y
80
N
40
合计
(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;
(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为P1,“4名女性中恰有3人了解云课堂倡议”的概率为P2,试求出P1与P2,并比较P1与P2的大小.
附:临界值参考表的参考公式
P(χ2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
(χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)
14. 某电器企业统计了近10年的年利润额y(千万元)与投入的年广告费用x(十万元)的相关数据,散点图如图,对数据作出如下处理:令ui=lnxi,vi=lnyi,得到相关数据如表所示:
i=110uivi
i=110ui
i=110vi
i=110ui2
30.5
15
15
46.5
(1)从①y=bx+a;②y=m⋅xk(m>0,k>0);③y=cx2+dx+e三个函数中选择一个作为年广告费用x和年利润额y的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出y与x的回归方程;
(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元)
参考数据:10e≈3.6788,3.67883≈49.787.
参考公式:回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为b=i=1ntiyi−nt·yi=1nti2−nt2,a=y−−bt−.
15. 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1∼9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:
x(天)
1
2
3
4
5
6
7
y(秒)
990
990
450
320
300
240
210
现用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.
参考数据(其中ti=1xi)
i=17tiyi
t
i=17ti2−7×t2
1845
0.37
0.55
参考公式:对于一组数据u1,v1,u2,v2,…,un,vn,其回归直线v=α+βu的斜率和截距的最小二乘估计公式分别为:β=i=1nuivi−nu⋅vi=1nui2−nu2,α=v−β⋅u.
16. 某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x(单位: 万元)和产量y(单位:吨)的数据,利用两种函数模型 ①y=bx+a, ②y=bx+a分别进行拟合,得到相应的回归方程为y1=11.2x+2.0,y2=28.2x−9.8,并得到如表所示的残差值及一些统计量:
月份
1
2
3
4
5
6
投入量x(万元)
1
2
3
4
5
6
产量y(吨)
13
22
43
45
55
68
参考数据:
回归模型
①y=bx+a
②y=bx+a
其他数据
i=16(yi−yi)2
74.24
195.28
i=16xiyi
1049
i=16(yi−y)2
2090
i=16xi2
91
(1)根据残差比较模型①,②的拟合效果,应选择哪一个模型,并计算该模型的R2(精确到0.01).
(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:ei=yi−bxi−a,b=i=1nxiyi−nxyi=1nxi2−nx2,a=y−bx,R2=1−i=1n(yi−yi)2i=1n(yi−y)2)
17. 在班级随机地抽取8名学生,得到一组数学成绩与物理成绩的数据:
数学成绩6090115809513580145物理成绩4060754070856090
(1)计算出数学成绩与物理成绩的平均分;
(2)求相关系数r的值,并判断相关性的强弱.(r≥0.75为强)
附:r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2.
18. 某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(吨)与相应的生产总成本y(万元)的五组对照数据.
产量x(件)
1
2
3
4
5
生产总成本y(万元)
3
7
8
10
12
(1)根据上述数据,若用最小二乘法进行线性模拟,试求y关于x的线性回归直线方程y=bx+a;参考公式:b=i=1nxiyi−nx yi=1nxi2−nx2,a=y−bx.
(2)记第(1)问中所求y与x的线性回归直线方程y=bx+a为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:y=12x2+1.其中模型 ②的残差图(残差=实际值−预报值)如图所示:
某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(吨)与相应的生产总成本y(万元)的五组对照数据.
产量x(件)
1
2
3
4
5
生产总成本y(万元)
3
7
8
10
12
(1)根据上述数据,若用最小二乘法进行线性模拟,试求y关于x的线性回归直线方程y=bx+a;参考公式:b=i=1nxiyi−nx yi=1nxi2−nx2,a=y−bx.
(2)记第(1)问中所求y与x的线性回归直线方程y=bx+a为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:y=12x2+1.其中模型 ②的残差图(残差=实际值−预报值)如图所示:
请完成模型①的残差表与残差图,并根据残差图,判断哪一个模型更适宜作为y关于x的回归方程⋅并说明理由;
(3)根据模型①中y与x的线性回归方程,预测产量为6吨时生产总成本为多少万元⋅
19. 某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,通过汇总数据得到下面等高条形图:
(1)根据所给等高条形图数据,完成下面的2×2列联表:
满意
不满意
男顾客
女顾客
(2)根据(1)中列联表,依据小概率值α=0.01的χ2独立性检验,能否据此推断顾客对该商场服务的评价与性别有关?
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
20. 为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个条状区域内,两个变量并不呈现线性相关关系,现分别用模型 ①y=C1x2+C2与模型 ②y=eC3x+C4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃
20
22
24
26
28
30
32
产卵数y/个
6
10
21
24
64
113
322
t=x2
400
484
576
676
784
900
1024
z=lny
1.79
2.30
3.04
3.18
4.16
4.73
5.77
x
t
y
z
26
692
80
3.57
i=17(xi−x)(yi−y)i=17(xi−x)2
i=17(ti−t)(yi−y)i=17(ti−t)2
i=17(zi−z)(xi−x)i=17(xi−x)2
i=17(zi−z)(ti−t)i=17(ti−t)2
21.38
0.43
0.32
0.01
其中ti=xi2,t=17i=17ti,zi=lnyi,z=17i=17zi.
(1)根据表中数据,分别建立两个模型下y关于x的回归方程,并在两个模型下分别估计温度为30℃时的产卵数;(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
(2) 若由模型 ① ②分别求得R12=0.82,R22=0.96,请判断哪个模型的拟合效果更好.
21. 某公司在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
(Ⅰ)根据频率分布直方图,计算图中各小长方形的宽度;
(Ⅱ)根据频率分布直方图,估计投入4万元广告费用之后,销售收益的平均值(以各组的区间中点值代表该组的取值);
(Ⅲ)按照类似的研究方法,测得另外一些数据,并整理得到下表:
广告投入x(单位:万元)
1
2
3
4
5
销售收益y(单位:百万元)
2
3
2
7
表中的数据显示,x与y之间存在线性相关关系,请将(2)的结果填入空白栏,并计算y关于x的回归方程.
附公式:b=i=1nxiyi−nx−y−i=1nxi2−nx−2,a=y−bx.
答案和解析
1.【答案】解:(1)由y与x的相关系数为γ≈−0.58,所以y与x的线性相关关系是负相关,
且|γ|<0.75,所以线性相关性不强,所以不建议继续做线性回归分析,
得到的回归方程,拟合效果也会不理想;
(2)建立2×2列联表如下:
人数<100
人数≥100
总计
AQI>100
10
5
15
AQI≤100
10
35
45
总计
20
40
60
代入公式计算得K2=60×(10×35−10×5)215×45×20×40=10,
查表知6.635<10<10.828,
所以犯错误率在0.001与0.01之间,
即该初步认定的犯错率小于1%.
【解析】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力和数据分析的核心素养,属于基础题.
(1)由相关系数γ≈−0.58知y与x的线性相关关系以及线性相关性强弱;
(2)建立2×2列联表,计算K2的值,对照附表得出结论.
2.【答案】C
【解析】
【分析】
本题考利用样本中心必过线性回归方程这一特征求线性回归方程及其应用,属于基础题.
根据表中所给的数据,求出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a的值,写出线性回归方程,将x=100代入回归直线方程,即可预测.
【解答】
解:由表中数据得:
x=20,y=30,
又b值为0.9,
故a=30−0.9×20=12,
∴y=0.9x+12,
将x=100代入回归直线方程,
得y=0.9×100+12=102(分钟),
∴预测加工100个零件需要102分钟.
故选C.
3.【答案】D
【解析】
【分析】
本题考查了两个变量的线性相关,属于基础题.
根据散点图直接判断即可.
【解答】
解:由第一个图可知各点呈上升趋势,x与y正相关;
第二个图中的点杂乱无章,不具有相关性;
第三个图各点呈下降趋势,x与y负相关.
故选D.
4.【答案】C
【解析】
【分析】
本题考查了列联表中数据的计算,属于基础题.
由列联表中数据之间的关系即可求得答案.
【解答】
解:a=73−21=52,b=a+22=52+22=74.
故选:C.
5.【答案】B
【解析】
【分析】
本题考查的知识要点:均值和方差的关系,回归直线的方程,相关性强弱和相关系数的关系,主要考查学生对基础知识的理解,属于中档题.
①根据方差的性质即可判断,②由回归方程一次项的系数符号可知增减情况,③根据相关系数的含义判断正误,
【解答】
解:
①将一组数据中的每一个数据都加上同一个常数C后D(X+C)=D(X),方差不变,
故选项A正确;
②设有一个回归方程y=3−5x,变量x增加1个单位时,y平均减少5个单位,
故选项B错误;
③设具有相关关系的两个变量x,y的相关系数为r,
那么r越接近于1,x,y之间的线性相关程度越高,
故选项C错误;
故选:B
6.【答案】D
【解析】
【分析】
本题考查等高条形图的应用,涉及分类变量关系强弱的判断,属于基础题.
根据题意,由等高条形图的意义分析可得答案.
【解答】
解:根据题意,在等高的条形图中,当x1,x2所占比例相差越大时,越有把握认为两个分类变量x,y之间有关系,
分析选项可得:D选项中,x1,x2所占比例相差最大,
故选:D.
7.【答案】D
【解析】
【分析】
本题考查可线性化的回归分析,属于基础题.
由z=lny得y=ez,然后将已知代入求解即可.
【解答】
解:由z=lny,得y=ez=e0.3x+4=e4⋅e0.3x,所以c=e4.
故选D.
8.【答案】C
【解析】
【分析】
本题考查线性回归方程,考查统计学中的基础知识,是基础题.
求出残差e4判断A;由已知R2的值及其意义判断B、C、D.
【解答】
解:由题意得,x=2.2+2.6+4.3+5+5.95=4,y=3.8+5.4+7+10.35+12.25=5.55
可得:5.55=2.27×4−a,解得a=3.53
e4=10.35−2.27×5−3.53=2.53,
由于R2≈0.96,∴该回归方程的拟合效果比较好,故A,B错误;
在线性回归模型中,R2表示解释变量对于预报变量的贡献率,R2≈0.96,
则销售量y的多少有96%是由广告支出费用引起的,C正确,D错误.
故选C.
9.【答案】ABC
【解析】
【分析】
本题考查可线性化的回归分析,属于中档题.
解答时将各选项变形代换,看是否符合最小二乘法回归直线的要求,即可得答案.
【解答】
解:对于A项,y=c1x2+c2x,则yx=c1x+c2,
令μ=yx,则μ=c1x+c2,符合题意;
对于B项,y=1+c1−c2x+c2,则y−1=c1−c2x+c2,
所以1y−1=x+c2c1−c2=1c1−c2x+c2c1−c2,
令μ=1y−1,则μ=1c1−c2x+c2c1−c2,符合题意;
对于C项,y=c1+ln(x+c2),则y−c1=ln(x+c2),
所以ey−c1=x+c2,即ey=ec1(x+c2)=ec1x+c2ec1,
令μ=ey,则μ=ec1x+c2ec1,符合题意;
对于D项,lny=lnc1+x+c2=x+lnc1+c2,
令μ=lny,则μ=x+lnc1+c2,
此时斜率为1,不符合题意,
故选:ABC.
10.【答案】r1>r3>r4>r2
【解析】
【分析】
本题考查了由散点图判断两变量的相关性,相关系数的比较,散点越集中,说明相关系数越接近于1或−1,考查了识图能力与推理能力,属于基础题.
先由散点图判断是正相关还是负相关,然后再观察散点哪个更集中,即可得到答案.
【解答】
解:由题中给出的4幅散点图可以看出,
图2和图4是负相关,相关系数小于0,其中图2的点相对更集中,r2>r4,∴r2
故答案为r1>r3>r4>r2.
11.【答案】y=0.7x−2.3
【解析】
【分析】
本题考查线性回归方程的求法及应用.
根据所给的这组数据,写出利用最小二乘法要用的量的结果,把所求的这些结果代入公式求出线性回归方程的系数,进而求出a的值,写出线性回归方程.
【解答】
解:由题意可得:
x=6+8+10+124=9,
y=2+3+5+64=4;
i=14xiyi=6×2+8×3+10×5+12×6=158;
i=14xi2=62+82+102+122=344;
b=i=14xiyi−4xyi=14xi2−4x2=158−4×9×4344−4×92=0.7;
a=y−bx=4−0.7×9=−2.3;
故线性回归方程为̂y=0.7x−2.3.
故答案为:y=0.7x−2.3.
12.【答案】y=2x−9.6
20.4
【解析】
【分析】
本题主要考查回归直线方程及回归分析的应用,平均数的计算,属于中档题.
分别计算出中国和南亚某国的投资额、利润的平均数,然后进行比较和选择,然后利用公式和参考数据计算出b的值,再根据a=y−bx计算出a的值,则回归直线方程可求.
根据回归直线方程计算出x=15时y的取值即可.
【解答】
解:由表中数据可求得,x中国=x南亚某国=10+11+12+13+145=12,
y中国=11+12+14+16+195=14.4,y南亚某国=12+13+13+14+155=13.4,
因此应选择中国.
∴由参考数据和公式可知b=2010=2,
∴a=14.4−2×12=−9.6,
所以所求回归直线方程为y=2x−9.6,
当x=15时,y=20.4.
故答案为:y=2x−9.6;20.4.
13.【答案】解:(1)根据题意填写列联表,如下:
男
女
合计
Y
80
60
140
N
20
40
60
合计
100
100
200
根据表中数据,计算χ2=200×(80×40−20×60)2100×100×140×60=20021≈9.524>6.635,
对照临界值表知,有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;
(2)用样本估计总体,将频率视为概率,
根据列联表得出男性了解“云课堂”倡议的概率为80100=45,
女性了解“云课堂”倡议的概率为60100=35,
所以计算概率P1=C43⋅(45)3⋅15=256625,
概率P2=C43⋅(35)3⋅25=216625,
所以P1>P2.
【解析】本题考查了列联表与独立性检验应用问题,也考查了有关概率的计算问题,是中档题.
(1)根据题意填写列联表,计算χ2,对照临界值表得出结论;
(2)用样本估计总体,将频率视为概率,分别计算所求的概率值即可.
14.【答案】解:(1)由散点图知,选择回归类型y=m⋅xk更好.
(2)对y=m⋅xk两边取对数,
得lny=lnm+klnx,即v=lnm+ku,
由表中数据得,
k=i=110uiυi−10u−υ−i=110ui2−10u−2=30.5−10×1.5×1.546.5−10×1.5×1.5=13,
所以lnm=v−ku=1.5−13×1.5=1,
所以m=e,
所以年广告费用x和年利润额y的回归方程为y=e⋅x13.
(3)由(2),知y=e⋅x13,
令y=e⋅x13>10,得x13>10e,得x13>3.6788,
所以x>3.67883≈49.787,
故下一年应至少投入498万元广告费用.
【解析】本题考查回归直线方程的应用,散点图的应用,考查分析问题解决问题的能力,属于中档题.
(1)由散点图即可得到答案;
(2)对y=m⋅xk两边取对数,得lny=lnm+klnx,即v=lnm+ku,求出回归直线方程的系数,然后求解回归方程即可;
(3)通过y=e⋅x13>10,求出下一年应至少投入广告费用.
15.【答案】解:(1)由题意,y=17(990+990+450+320+300+240+210)=500,
令t=1x,设y关于t的线性回归方程为y=bt+a,则
b=i=17tiyi−7t⋅yi=17ti2−7t2=1845−7×0.37×5000.55=1000,
则a=500−1000×0.37=130,
∴y=1000t+130,又t=1x,
∴y关于x的回归方程为y=1000x+130,
故x=100时,y=140,
∴经过100天训练后,每天解题的平均速度y约为140秒;
(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,
由题意知,最多再进行4局就有胜负,
当X=2时,小明4:1胜,∴P(X=2)=34×34=916,
当X=3时,小明4:2胜,∴P(X=3)=C21×34×1−34×34=932,
当X=4时,小明4:3胜,∴P(X=4)=C31×34×1−342×34=27256,
∴小明最终赢得比赛的概率为916+932+27256=243256.
【解析】本题考查可线性化回归分析和概率的计算,互斥事件,n次独立重复试验及概率计算,属于一般题.
(1)设y关于t的线性回归方程为y=bt+a,求出b和a的值,先得出y与t的函数关系式,再得出y关于x的线性回归方程,把x=100代入回归方程,求出y的值即可;
(2)分别求出X=2,X=3和X=4的概率,再将X=2,X=3和X=4的概率相加即可.
16.【答案】解:(1)因为1−74.242090>1−195.282090,应该选择模型①.
此时
(2)计算残差值
投入量x(万元)
1
2
3
4
5
6
产量y(吨)
13
22
43
45
55
68
模型①的残差值
−0.2
−2.4
7.4
−1.8
−3
−1.2
根据表格知3月份的数据异常,剔除异常数据,得x=15(3.5×6−3)=3.6,y=15(41×6−43)=40.6,
i=15xiyi=1049−3×43=920,i=15xi2=91−32=82.
,.
∴y关于x的回归方程为.
【解析】本题考查线性回归方程的求法,考查计算能力,是中档题.
(1)分别求出模型①与模型②的残差值,比较即得结论;
(2)求出剔除3月份的数据后的b与a的值,则线性回归方程可求.
17.【答案】解:(1)数学成绩的平均分x=60+90+115+80+95+135+80+1458=100,
物理成绩的平均分y=40+60+75+40+70+85+60+908=65.
(2)因为,所以相关性较强.
【解析】本题考查利用相关系数判断相关性的强弱,涉及平均数的求解,属于基础题.
(1)根据数据计算即可;
(2)根据公式计算相关系数r,再判断即可.
18.【答案】解:(1)计算x=15(1+2+3+4+5)=3,
y=15(3+7+8+10+12)=8,
i=15xi2=12+22+32+42+52=55,
i=15xiyi=1×3+2×7+3×8+4×10+5×12=141,
b=i=15xiyi−nx yi=1nxi2−nx2=141−5×3×855−5×9=2.1,
a=y−bx=8−2.1×3=1.7,因此,回归直线方程为y=2.1x+1.7;
(2)模型①的残差表为:
x
1
2
3
4
5
y
3
7
8
10
12
y
3.8
5.9
8
10.1
12.2
e
−0.8
1.1
0
−0.1
−0.2
画出残差图,如图所示:
结论:模型①更适宜作为y关于x的回归方程,因为:
理由1:模型①的4个样本点的残差点落在的带状区域比模型②的带状区域更窄;
理由2:模型①的4个样本点的残差点比模型②的残差点更贴近x轴.
(3)根据模型①中y与x的回归直线方程,
计算x=6时,y=2.1×6+1.7=14.3,
所以预测产量为6吨时生产总成本为14.3万元.
【解析】本题考查了线性回归方程的求法与应用问题,也考查了残差图的应用问题,属于中档题.
(1)计算平均数和线性回归方程系数,即可写出回归直线方程;
(2)写出模型 ①的残差表,画出残差图,结合图形得出结论;
(3)根据模型 ①中y与x的回归直线方程,计算x=6时的函数值即可.
19.【答案】解:(1)由等高条形图中的数据可得:
男顾客中满意的人数为:50×0.8=40,不满意的人数为50×0.2=10
女顾客中满意的人数为:50×0.6=30,不满意的人数为50×0.4=20
所以2×2列联表如下:
满意
不满意
男顾客
40
10
女顾客
30
20
(2)零假设为:H0:顾客对该商场服务的评价与性别无关
根据表中数据,计算得到χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(40×20−10×30)250×50×70×30≈4.762<6.635=x0.01
根据小概率值α=0.01的χ2独立性检验,没有充分的证据推断出H0不成立,因此可以认为H0成立,即认为顾客对商场服务的评价与性别无关.
【解析】本题考查的是独立性检验,考查了学生的计算能力,属于中档题.
(1)根据等高条形图中的数据可得答案;
(2)计算出χ2的值,然后与6.635作比较即可.
20.【答案】解:(1)对于模型 ①:设t=x2,则y=C1x2+C2=C1t+C2,
其中C1=i=17(ti−t)(yi−y)i=17(ti−t)2=0.43,
C2=y−C1t=80−0.43×692=−217.56,
所以y=0.43x2−217.56.
当x=30时,估计产卵数为y=0.43×302−217.56=169.44.
对于模型 ②:设z=lny,则z=C3x+C4,
其中C3=i=17(zi−z)(xi−x)i=17(xi−x)2=0.32,
C4=z−C3x=3.57−0.32×26=−4.75,
所以z=0.32x−4.75,则y=e0.32x−4.75.
当x=30时,估计产卵数为y=e0.32×30−4.75=e4.85≈127.74.
(2)因为R12=0.82,R22=0.96,R12
【解析】本题考查求线性回归方程以及回归方程的应用,属于中档题.
1根据模型①②求出回归方程,估计x=30时的产卵数即可;
2根据决定系数的大小,即可比较模型的拟合效果.
21.【答案】解:(Ⅰ)设各小长方形的宽度为m,由频率分布直方图各小长方形面积总和为1,
可知(0.08+0.1+0.14+0.12+0.04+0.02)m=0.5m=1,
故m=2;
(Ⅱ)由(Ⅰ)知各小组依次是:[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,
故可估计平均值为:1×0.16+3×0.2+5×0.28+7×0.24+9×0.08+11×0.04=5;
(Ⅲ)由(Ⅱ)知空白栏中填5.
广告投入x(单位:万元)
1
2
3
4
5
销售收益y(单位:百万元)
2
3
2
5
7
由题意可知,x−=1+2+3+4+55=3,
y−=2+3+2+5+75=3.8,
i=15xiyi=1×2+2×3+3×2+4×5+5×7=69,
i=15xi2=12+22+32+42+52=55,
根据公式,可求得b=69−5×3×3.855−5×32=1210=1.2,
所以a=3.8−1.2×3=0.2,
即回归直线的方程为:y=1.2x+0.2.
【解析】本题考查回归方程,考查频率分布直方图,考查学生的读图、计算能力.
(Ⅰ)根据频率分布直方图,由频率分布直方图各小长方形面积总和为1,可计算图中各小长方形的宽度;
(Ⅱ)以各组的区间中点值代表该组的取值,即可计算销售收益的平均值;
(Ⅲ)求出回归系数,即可得出结论.
相关试卷
这是一份新高考小题微点特训38 统计案例练习题
这是一份【备战2023高考】数学考点全复习——第73讲《统计案例》精选题(新高考专用),文件包含备战2023高考数学考点全复习第73讲《统计案例》精选题解析版docx、备战2023高考数学考点全复习第73讲《统计案例》精选题原卷版docx等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。
这是一份考点11.5 变量间的相关关系、统计案例(解析版)练习题,共16页。