- 第6章 计数原理(A卷·知识通关练)-【单元测试】2022-2023学年高二数学分层训练AB卷(沪教版2020选择性必修第二册) 试卷 4 次下载
- 第6章 计数原理(B卷·能力提升练)-【单元测试】2022-2023学年高二数学分层训练AB卷(沪教版2020选择性必修第二册) 试卷 3 次下载
- 第7章 概率初步(续)(A卷·知识通关练)-【单元测试】2022-2023学年高二数学分层训练AB卷(沪教版2020选择性必修第二册) 试卷 3 次下载
- 第7章 概率初步(续)(B卷·能力提升练)-【单元测试】2022-2023学年高二数学分层训练AB卷(沪教版2020选择性必修第二册) 试卷 1 次下载
- 第8章 成对数据的统计分析(A卷·知识通关练)-【单元测试】2022-2023学年高二数学分层训练AB卷(沪教版2020选择性必修第二册) 试卷 1 次下载
上教版(2020)选修第二册8.3 2x2列联表单元测试复习练习题
展开班级 姓名 学号 分数
第8章 成对数据的统计分析(B卷·能力提升练)
(时间:120分钟,满分:150分)
一、填空题(本大题共有12题,满分54分,第1~6题每题4分,第7~12题每题5分)
1.(2022春·吉林白城·高二校考阶段练习)在一组样本数据(x1,y1),(x2,y2), ...(xn,yn), (n≥2,x1,x2⋯xn不相等)的散点图中,若所有样本点xi,yii=1,2,…,n都在直线y=12x+3上,则这组样本数据的样本相关系数为_________
【答案】1
【分析】根据样本相关系数的定义及直线的斜率为正,得到相关系数为1.
【详解】因为所有样本点都在直线y=12x+3上,且直线y=12x+3的斜率为12>0,
故相关系数为1.
故答案为:1
2.(2023·全国·高二专题练习)喝茶是很多中国人的习惯.为了解某茶中所放茶叶量x克与食客的满意率y的关系,抽样得一组数据如表.根据表中数据,用最小二乘法得出y与x的线性回归方程为y=6.5x+17.5,则表中m的值为________.
x(克)
2
4
5
6
8
y(%)
30
m
50
70
60
【答案】40
【分析】根据回归直线方程必过样本中心可得210+m5=6.5×5+17.5,解方程即可求出结果.
【详解】x=2+4+5+6+85=5,y=30+m+50+70+605=210+m5,
故样本中心为5,210+m5,又因为回归直线方程必过样本中心,
所以210+m5=6.5×5+17.5,解得m=40,
故答案为:m=40.
3.(2022春·河南三门峡·高二校考阶段练习)已知变量y关于x的回归方程为y=ekx+2,其一组数据如表所示:若x=8,则预测y值可能为___________.
x
2
3
4
5
6
y
e1.5
e4.5
e5.5
e6.5
e7
【答案】e8
【分析】由已知回归方程取对数并令z=lny,得线性回归方程z=kx+2,根据线性回归直线过中心点求得k值,然后代入x=8可得预测值.
【详解】由y=ekx+2得:lny=kx+2,令z=lny,即z=kx+2,
因为x=2+3+4+5+65=4,
z=lne1.5+lne4.5+lne5.5+lne6.5+lne75=1.5+4.5+5.5+6.5+75=5,
将点(4,5)代入直线方程z=kx+2中,即可得:k=0.75,
所以回归方程为y=e0.75x+2,
若x=8,则y=e0.75×8+2=e8.
故答案为:e8.
4.(2022·全国·高三专题练习)已知由样本数据xi,yi(i=1,2,3,⋯,10)组成的一个样本,得到回归直线方程为y=2x-0.4,且x=2,其中发现两个歧义点(-2,1)和(2,-1)偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回归直线方程为______________.
【答案】y=3x-3
【分析】由题可得y=3.6,进而可得新的平均数,根据回归直线方程过样本中心结合条件即得.
【详解】因为y=2x-0.4,且x=2,
所以y=2×2-0.4=3.6,
去除两个歧义点(-2,1)和(2,-1)后新的平均数为:
X=2×108=52,Y=3.6×108=92,又新的回归直线的斜率为3,
所以a=92-3×52=-3,
所以新的回归直线方程为y=3x-3.
故答案为:y=3x-3.
5.(2023·高二课时练习)对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、r1、r2、r3、r4从小到大排列,应为______.
【答案】r2
【详解】由散点图可知0
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是________.
【答案】丁同学
【分析】根据相关系数的绝对值越接近于1,相关性越强即得.
【详解】由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,
结合题意可知丁的线性相关性更强.
故答案为:丁同学.
7.(2015秋·黑龙江哈尔滨·高二统考期末)下列关于回归分析的说法正确的是___________(填上所有正确说法的序号)
①相关系数r越小,两个变量的相关程度越弱;
②残差平方和越大的模型,拟合效果越好;
③用相关指数R2来刻画回归效果时,R2越小,说明模型的拟合效果越好;
④用最小二乘法求回归直线方程,是寻求使i=1nyi-bxi-a2取最小值时的a、b的值;
⑤在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高.
【答案】④⑤
【分析】利用相关系数与两个变量的相关程度的关系可判断①;利用残差的定义可判断②;利用相关指数与模型的拟合效果之间的关系可判断③;利用最小二乘法的概念可判断④;利用残差图可判断⑤.
【详解】对于①,对于相关系数r,r越接近于0,两个变量的相关程度越弱,①错;
对于②,残差平方和越小的模型,拟合效果越好,②错;
对于③,用相关指数R2来刻画回归效果时,R2越大,说明模型的拟合效果越好,③错;
对于④,用最小二乘法求回归直线方程,是寻求使i=1nyi-bxi-a2取最小值时的a、b的值,④对;
对于⑤,在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,⑤对.
故答案为:④⑤.
8.(2023春·河南焦作·高二统考开学考试)某中学统计了一个班40名学生中每一个学生的英语成绩与语文成绩,并制成了一个不完整的2×2列联表如下:
英语成绩及格
英语成绩不及格
总计
语文成绩及格
20
语文成绩不及格
11
总计
25
40
则____________(填“有”或“没有”)99%的把握认为学生的英语成绩与语文成绩有关.
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
参考数据:
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
【答案】有
【分析】先将2×2列联表填写完整,再计算χ2进行判断.
【详解】由题意可得2×2列联表如下:
英语成绩及格
英语成绩不及格
总计
语文成绩及格
20
4
24
语文成绩不及格
5
11
16
总计
25
15
40
则χ2=40×(20×11-4×5)225×15×24×16≈11.111>6.635,
因此有99%的把握认为学生的英语成绩与语文成绩有关.
故答案为:有.
9.(2023·高三课时练习)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的45,女生喜欢网络游戏的人数占女生人数的35,若有95%的把握但没有99%的把握认为是否喜欢网络游戏和性别有关,则被调查的学生中男生可能有______人.
附表:
K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.
P(K2≥k0)
0.050
0.010
k0
3.841
6.635
【答案】45,50,55,60,65
【分析】设男生有x人,可得2×2列联表,计算K2,由3.841
喜欢
不喜欢
合计
男生
45x
15x
x
女生
35x
25x
x
合计
75x
35x
2x
若有95%的把握但没有99%的把握认为是否喜欢网络游戏和性别有关,则3.841
∴3.841<221x<6.635,
解得40.3
故答案为:45,50,55,60,65.
10.(2022·全国·高三专题练习)根据表中的数据,及观测值K2则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.
篮球
舞蹈
合计
男
13
7
20
女
2
8
10
合计
15
15
30
其中K2=nad-bc2a+bc+da+cb+d的参考数据:
P(K2≥k0)
0.05
0.025
0.010
k0
3.841
5.024
6.635
【答案】0.025
【分析】由列联表中的数据,计算K2的值,对照表中的参考数据,比较即可得到答案.
【详解】解:由列联表中的数据可得,
K2=30×13×8-2×7215×15×20×10=275=5.4>5.024,
所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.
故答案为:0.025.
11.(2022·全国·高三专题练习)为了解高中生选科时是否选择物理与数学成绩之间的关系,学校抽取了50名高中生,通过问卷调查,得到以下数据:
选物理
不选物理
数学成绩优异
20
7
数学成绩一般
10
13
由以上数据,计算得到χ2=50×13×20-10×7223×27×20×30≈4.844,则有______的把握认为是否选择物理与数学成绩有关系.
【答案】95%
【分析】根据卡方值与临界值比较,即可求解.
【详解】因为4.844>3.841,Pχ2≥3.841≈0.05,所以有95%的把握认为是否选择物理与数学成绩有关.
故答案为:95%
12.(2023·高二课时练习)从2015年到2020年六年间我国公共图书馆业机构数与对应年份编号的散点图如图所示(为便于计算,设2015年编号为1,2016年编号为2,…,2020年编号为6,把每年的公共图书馆业机构数作为预报变量,把年份编号作为解释变量进行回归分析),并得到回归直线方程为y=13.743x+3095.7,其相关指数r2=0.9817,则下列结论中正确的是______.(写出所有满足要求的结论编号)
①公共图书馆业机构数与年份编号的正相关性较强;
②公共图书馆业机构数平均每年增加13.743;
③可预测2021年公共图书馆业机构数为3192.
【答案】①②③
【分析】根据回归方程,相关指数,散点图依次分析即可得答案.
【详解】解:因为相直线方程为y=13.743x+3095.7,斜率为正数13.743,相关指数r2=0.9817,
所以,公共图书馆业机构数与年份编号的正相关性较强,故①正确;
公共图书馆业机构数平均每年增加13.743,故②正确;
当x=7时,y=13.743×7+3095.7=3191.901≈3192,故预测2021年公共图书馆业机构数为3192,③正确;
故答案为: ①②③
二、选择题(本题共有4题,满分20分,每题5分)每题有且只有一个正确选项.
13.(2022秋·四川达州·高二统考期末)关于线性回归的描述,下列说法不正确的是( )
A.回归直线方程y=-1.8x+2.1中变量x,y成正相关关系
B.相关系数r越接近1,相关程度越强
C.回归直线方程y=1.1x-1.6中变量x,y成正相关关系
D.残差平方和越小,拟合效果越好
【答案】A
【分析】根据线性回归的性质可知:b的正负决定正负相关,可判断选项A,C;根据相关系数的绝对值越接近1,相关性越强,可判断B;残差平方和越小,拟合效果越好,可判断选项D.
【详解】对于A,因为回归直线方程y=-1.8x+2.1中的b<0,所以变量x,y成负相关关系,故选项A错误;
对于B,因为相关系数r的绝对值越接近1,相关度越强,所以当相关系数r越接近1,相关程度越强,故选项B正确;
对于C,因为回归直线方程y=1.1x-1.6中的b=1.1>0,所以变量x,y成正相关关系,故选项C正确;
对于D,因为残差平方和越小,拟合效果越好,所以选项D正确,
综上:说法不正确的是A,
故选:A.
14.(2022秋·湖南长沙·高三长郡中学校考阶段练习)为了解某种产品与原材料之间的关系,随机调查了该产品5个不同时段的产品与原材料的价格,得到如下统计数据表:
原材料价格x(万元/吨)
1
1.2
1.4
1.6
1.8
产品价格y(万元/件)
5
5.8
k
8.1
8.8
但是统计员不小心丢失了一个数据(用k代替),在数据丢失之前得到回归直线方程为y=5x-0.04,则k的值等于( )A.7.1 B.7.2 C.7.3 D.7.4
【答案】A
【分析】先求得样本中心,再将样本中心代入回归直线方程即可求得k的值.
【详解】依题意,得x=15×1+1.2+1.4+1.6+1.8=1.4,y=15×5+5.8+k+8.1+8.8=27.7+k5,
因为y=5x-0.04必过x,y,
所以27.7+k5=5×1.4-0.04,解得k=7.1,
所以k=7.1.
故选:A.
15.(2022·全国·高三专题练习)通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有16的男大学生“不看”,有13的女大学生“不看”,若有99%的把握认为性别与是否看营养说明之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
【答案】C
【分析】由题意列出2×2列联表,并计算出χ2,根据有99%的把握认为性别与是否看营养说明之间有关,列出不等式,解出2m,可得答案.
【详解】设男女大学生各有m人,根据题意画出2×2列联表,如下图:
看
不看
合计
男
56m
16m
m
女
23m
13m
m
合计
32m
12m
2m
所以χ2=2m56m×13m-16m×23m232m×12m×m×m=2m27,因为有99%的把握认为性别与对产品是否满意有关,所以2m27>6.635,解得2m>179.145,所以总人数2m可能为240.
故选:C.
16.(2023·全国·高二专题练习)某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机调查部分中老年人,统计数据如下表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是( )
表1
表2
患糖尿病
未患糖尿病
坚持锻炼
6
14
不坚持锻炼
7
25
患高血压
未患高血压
坚持锻炼
2
18
不坚持锻炼
11
21
表3
表4
患冠心病
未患冠心病
坚持锻炼
4
16
不坚持锻炼
9
23
患关节炎
未患关节炎
坚持锻炼
7
13
不坚持锻炼
6
26
A.糖尿病 B.高血压 C.冠心病 D.患关节炎
【答案】B
【分析】根据独立性检验计算k2,比较可得选项.
【详解】解:由表1得:k2=52×6×25-7×14220×32×13×39≈0.43,
由表2得:k2=52×2×21-11×18220×32×13×39≈3.9,
由表3得:k2=52×4×23-9×16220×32×13×39≈0.43,
由表4得:k2=52×7×26-6×13220×32×13×39≈1.73,
所以这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是高血压,
故选:B.
三、解答题(本大题共有5题,满分76分). 17.(2023·江苏南通·统考一模)第二十二届卡塔尔世界杯足球赛(FIFAWorldCupQatar2022)决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:
喜欢足球
不喜欢足球
合计
男生
40
女生
30
合计
(1)根据所给数据完成上表,并判断是否有99.9%的把握认为该校学生喜欢足球与性别有关?
(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知男生进球的概率为23,女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数的分布列和数学期望.
附:K2=n(ad-bc)2a+bc+da+cb+d.
PK2≥k
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)列联表见解析,有
(2)分布列见解析,116
【分析】(1)利用独立性检验的方法求解;
(2)根据独立事件的概率公式和离散型随机变量的分布列的定义求解.
【详解】(1)2×2列联表如下:
喜欢足球
不喜欢足球
合计
男生
60
40
100
女生
30
70
100
合计
90
110
200
K2=200×(60×70-40×30)2100×100×90×110≈18.182>10.828,
∴有99.9%的把握认为该校学生喜欢足球与性别有关
(2)3人进球总次数ξ的所有可能取值为0,1,2,3,
Pξ=0=132×12=118,Pξ=1=C21⋅23⋅13×12+12×132=518
Pξ=2=C21⋅23⋅13⋅12+232×12=49,Pξ=3=232×12=29
∴ξ的分布列如下:
ξ
0
1
2
3
P
118
518
49
29
∴ξ的数学期望:Eξ=1×518+2×49+3×29=116.
18.(2023·四川南充·四川省南充高级中学校考模拟预测)某电子产品生产商经理从众多平板电脑中随机抽取6台,检测它们充满电后的工作时长(单位:分钟), 相关数据如下表所示.
平板电脑序号
1
2
3
4
5
6
工作时长/分
220
180
210
220
200
230
(1)若从被抽中的6台平板电脑中随机抽出2台,则抽出的2台平板电脑充满电后工作时长都不小于210分钟的概率;
(2)下表是一台平板电脑的使用次数与当次充满电后工作时长的相关数据.求该平板电脑工作时长y与使用次数x之间的回归直线方程,并估计该平板电脑使用第200次时充满电后的工作时长.
使用次数x/次
20
40
60
80
100
120
140
工作时长/分
210
206
202
196
191
188
186
附: y=bx+a,b=i=1nxi-xyi-yi=1nxi-x2,a=y-bx.
【答案】(1)25
(2)y=-1780x+214;171.5分钟.
【分析】(1)使用古典概型概率公式进行求解即可;
(2)使用表格中的数据,根据题目所附公式进行计算,并将x=200代入回归直线方程进行估计即可.
【详解】(1)用x,y表示从被抽中的6台平板电脑中随机抽出2台的序号分别为x和y,
则基本事件有1,2,1,3,1,4,1,5,1,6,2,3,2,4,2,5,2,6,3,4,3,5,3,6,4,5,4,6,5,6共15个,
将“抽出的2台平板电脑充满电后工作时长都不小于210分钟”记为事件A,
由已知,序号为1,3,4,6的平板电脑充满电后工作时长都不小于210分钟,
∴事件A中基本事件有1,3,1,4,1,6,3,4,3,6,4,6共6个,
∴PA=615=25.
∴若从被抽中的6台平板电脑中随机抽出2台,则抽出的2台平板电脑充满电后工作时长都不小于210分钟的概率为25.
(2)由已知,x=20+40+60+80+100+120+1407=80,
y=210+206+202+196+191+188+1867=197,
i=17xi-xyi-y
=-60×13+-40×9+-20×5+0×-1+20×-6+40×-9+60×-11=-2380,
i=17xi-x2=-602+-402+-202+02+202+402+602=11200,
∴b=i=17xi-xyi-yi=17xi-x2=-238011200=-1780,
∴a=y-bx=197--1780×80=214,
∴线性回归直线方程为y=-1780x+214,
当x=200时,y=-1780×200+214=171.5,
∴估计该平板电脑使用第200次时充满电后的工作时长为171.5分钟.
19.(2023·河南·长葛市第一高级中学统考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某市一健身连锁机构对其会员进行了统计,制作成如下两个统计图,图1为会员年龄分布图(年龄为整数),图2为会员一个月内到健身房次数分布扇形图.
若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类,将一个月内到健身房锻炼16次及以上的会员称为”健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.
(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图的数据,补全下方2×2列联表,并判断是否有95%的把握认为“健身达人”与年龄有关?
年轻人
非年轻人
合计
健身达人
健身爱好者
合计
附:
PK2≥k0
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
K2=nad-bc2a+bc+da+cb+d
(2)将(1)中相应的频率作为概率,该健身连锁机构随机选取3名会员进行回访,设3名会员中既是“年轻人”又是“健身达人”的人数为随机变量X,求X的分布列和数学期望.
【答案】(1)列联表见解析,没有95%的把握认为“健身达人”与年龄有关;
(2)分布列见解析,数学期望为32.
【分析】(1)根据条件完善列联表,然后算出K2即可;
(2)随机变量X满足二项分布X~B3,12,然后根据二项分布进行求概率和期望
【详解】(1)根据年轻人标准结合图1可得年轻人占比为80%,则年轻人人数为100×80%=80,
则非年轻人为20人,
根据图2表格得健身达人所占比60%,所以其人数为100×60%=60,根据其中年轻人占比56,
所以健身达人中年轻人人数为60×56=50,则非年轻人为10人;
健身爱好者人数为100-60=40,再通过总共年轻人合计为80人,则健身爱好者中年轻人人数为80-50=30,
根据非年轻人总共为20人,则健身爱好者中非年轻人人数为20-10=10,
所以列联表为
年轻人
非年轻人
合计
健身达人
50
10
60
健身爱好者
30
10
40
合计
80
20
100
K2=100×50×10-30×10280×20×60×40≈1.042<3.841,
所以没有95%的把握认为“健身达人”与年龄有关.
(2)由(1)知,既是年轻人又是健身达人的概率为12,
则随机变量X满足二项分布X~B3,12,X=0,1,2,3,
PX=0=C301-123=18,PX=1=C31121⋅1-122=38,
PX=2=C32122⋅1-121=38,P(X=3)=C33123=18
故X的分布列:
X
0
1
2
3
P
18
38
38
18
则X的数学期望为EX=1×38+2×38+3×18=32.
20.(2023·河南·长葛市第一高级中学统考模拟预测)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每千米所需要的时间.相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.2022北京马拉松于2022年11月6日举行,已知图①是本次北京马拉松比赛中某位跑者的心率y(单位:次/分钟)和配速x(单位:分钟/千米)的散点图,图②是本次马拉松比赛(全程约42千米)前3000名跑者成绩(单位:分钟)的频率分布直方图.
(1)由散点图看出,可用线性回归模型拟合y与x的关系,求y与x的线性回归方程;
(2)在本次比赛中,该跑者如果将心率控制在160(单位:次/分钟)左右跑完全程,估计他跑完全程花费的时间及他能获得的名次.
参考公式:用最小二乘法求线性回归方程y=bx+a的系数,b=i=1nxiyi-nxyi=1nxi2-nx2=i=1nxi-xyi-yi=1nxi-x2,a=y-bx.参考数据:y=135.
【答案】(1)y=-25x+285
(2)210分钟,192名
【分析】(1)将数据代入公式,计算回归方程;
(2)由回归方程计算y=160时x的值,得跑完马拉松所花时间,由频率分布直方图估计该值所处名次.
【详解】(1)由散点图中数据和参考数据得x=4.5+5+6+7+7.55=6,y=135
∴b=-1.5×36+-1×30+0×-5+1×-26+1.5×-35-1.52+-12+02+12+1.52=-25,a=135--25×6=285,
所以y与x的线性回归方程为y=-25x+285.
(2)将y=160代入回归方程得x=5,所以该跑者跑完马拉松全程所花的时间为42×5=210分钟,
从马拉松比赛前3000名跑者成绩的频率分布直方图可知成绩好于210分钟的累计频率为0.0008×50+0.0024×210-200=0.064.
有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.064×3000=192名.
21.(2018·广东东莞·统考一模)学校对甲、乙两个班级的同学进行了体能测验,成绩统计如下(每班50人):
(1)成绩不低于80分记为“优秀”,请完成下面的2×2列联表,并判断是否有85%的把握认为“成绩优秀”与所在教学班级有关?
成绩优秀
成绩不优秀
总计
甲班
乙班
总计
(2)从两个班级的成绩在[50,60)的所有学生中任选2人,记事件A为“选出的2人中恰有1人来自甲班”,求事件A发生的概率P(A).
参考公式:K2=n(ad-bc)2a+bc+da+cb+d,其中n=a+b+c+d.
参考数据:
PK2≥k0
0.25
0.15
0.10
0.05
0.025
k0
1.323
2.072
2.706
3.841
5.024
【答案】(1)没有85%的把握
(2)47
【分析】(1)由题意得到2×2列联表,利用公式求解K2的值,根据附表即可作出判断;
(2)成绩在[50,60)的学生中,甲班有3人,分别记为x,y,z;乙班有4人,分别记为a,b,c,d,列举基本事件的总是,利用古典概型及其概率的计算公式,即可求解.
【详解】(1)根据题意,由甲班成绩的频率分布直方图可得,甲班优秀的学生人数为:50×0.034+0.02×10=27,则不优秀的人数为:50-27=23,
由乙班成绩的频率分布直方图可得,乙班优秀的学生人数为:50×0.024+0.016×10=20,则不优秀的人数为:50-20=30,
所以2×2列联表如下:
成绩优秀
成绩不优秀
总计
甲班
27
23
50
乙班
20
30
50
总计
47
53
100
故K2=nad-bc2a+bc+da+cb+d=100×27×30-23×20250×50×47×53≈1.967<2.072,
所以没有85%的把握认为 “成绩优秀”与所在教学班级有关.
(2)甲班成绩在50,60的学生有50×0.006×10=3人,分别记为x,y,z;
乙班有50×0.008×10=4人,分别记为a,b,c,d,
则从两个班级的成绩在[50,60)的所有学生中任选2人总的基本事件有:
xy,xz,xa,xb,xc,xd,yz,ya,yb,yc,yd,za,zb,zc,zd,ab,ac,ad,bc,bd,cd共21个,
其中事件A包含的基本事件有:xa,xb,xc,xd,ya,yb,yc,yd,za,zb,zc,zd共12个,
所以PA=1221=47,即事件A发生的概率为PA=47.
高中数学8.3 2x2列联表单元测试课堂检测: 这是一份高中数学8.3 2x2列联表单元测试课堂检测,文件包含第8章成对数据的统计分析A卷·知识通关练解析版docx、第8章成对数据的统计分析A卷·知识通关练原卷版docx等2份试卷配套教学资源,其中试卷共39页, 欢迎下载使用。
数学选修第二册7.3 常用分布单元测试习题: 这是一份数学选修第二册7.3 常用分布单元测试习题,文件包含第6章概率初步续B卷·能力提升练解析版docx、第6章概率初步续B卷·能力提升练原卷版docx等2份试卷配套教学资源,其中试卷共21页, 欢迎下载使用。
高中上教版(2020)6.5 二项式定理单元测试课后测评: 这是一份高中上教版(2020)6.5 二项式定理单元测试课后测评,文件包含第6章计数原理B卷·能力提升练解析版docx、第6章计数原理B卷·能力提升练原卷版docx等2份试卷配套教学资源,其中试卷共18页, 欢迎下载使用。