人教A版 (2019)第八章 成对数据的统计分析8.3 分类变量与列联表同步训练题
展开
第03讲 列联表与独立性检验
目标导航
课程标准
课标解读
1. 了解分类变量与数值变量的区别,了解回归与相关的区
别;
2.通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性. 理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误.
3. 理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误.
本节课要求会通过比较相关比率,判断两个随机变量的独立性. 会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题.
知识精讲
知识点
一 数值变量与分类变量
数值变量:数值变量的取值为实数,其大小和运算都有实际含义.
分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
注意点:
分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.
变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.
二 列联表
(1)2×2列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
(2)等高堆积条形图
等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
三 分类变量与列联表的实际应用
利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
四 独立性检验的理解
1.独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
2.,其中n=a+b+c+d.
注意点:
(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.
(2)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.
五 有关“相关的检验”
用χ2进行“相关的检验”步骤
(1)零假设:即先假设两变量间没关系.
(2)计算χ2:套用χ2的公式求得χ2值.
(3)查临界值:结合所给小概率值α查得相应的临界值xα.
(4)下结论:比较χ2与xα的大小,并作出结论.
六 有关“无关的检验”
运用独立性检验的方法
(1)列出2×2列联表,根据公式计算χ2.
(2)比较χ2与xα的大小作出结论.
【微点拨】1.下表给出了产独立性检验中几个常用的小概车值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
2. 临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
【即学即练1】下列说法中不正确的是 ( )
A.独立性检验是检验两个分类变量是否有关的一种统计方法
B.独立性检验得到的结论一定是正确的
C.独立性检验的样本不同,其结论可能不同
D.独立性检验的基本思想是带有概率性质的反证法
【答案】B
【解析】独立性检验是检验两个分类变量是否有关的一种统计方法,只是在一定的可信度下进行判断,不一定正确,会因为样本不同导致结论可能不同,带有反证法思想.
故选B.
【即学即练2】把两个分类变量的频数列出,称为( )
A.三维柱形图 B.二维条形图 C.列联表 D.频率分布直方图
【答案】C
【解析】
【分析】
根据三维柱形图、二维条形图、列联表和频率分布直方图的定义和特征依次判断即可.
【详解】
三维柱形图和二维条形图,是粗略地判断两个分类变量是否相关,故不合题意;
列联表,是将两个分类变量的频数列表,故符合题意;
频率分布直方图,显示各组频数分布情况又易于显示各组之间频数的差别,故不合题意.
故选:C
【即学即练3】假设有两个分类变量X与Y,它们的可能取值分别为和,其2×2列联表为:
Y
X
10
18
m
26
则当m取下面何值时,X与Y的关系最弱( )A.8 B.9 C.14 D.19
【答案】C
【解析】
【详解】
当时,由,解得,所以当时,X与Y的关系最弱.
故选:C
【即学即练4】根据如图所示的等高堆积条形图可知吸烟与患肺病 关系(填“有”或“没有”).
【答案】 有
【解析】 从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.
【即学即练5】已知变量,由它们的样本数据计算得到的观测值,的部分临界值表如下:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
则最大有________的把握说变量有关系.(填百分数)
【答案】
【解析】
【分析】
因为的观测值,进而可得结果.
【详解】
因为的观测值,所以在犯错误的概率不超过0.05的前提下认为变量有关系.所以最大有的把握说变量有关系.
故答案为:
【即学即练6】(多选题)针对时下的抖音热,某校团委对学生性别和喜欢抖音是否有关作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握但没有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
A.人 B.人 C.人 D.人
【答案】BC
【解析】
【分析】
设男生有人,可得列联表,计算可得,由可求得的范围,结合为的整数倍可得结果.
【详解】设男生有人,由题意可得列联表如下,
喜欢
不喜欢
合计
男生
女生
合计
若有的把握但没有的把握认为是否喜欢抖音和性别有关,则;
,,
解得:,又为的整数倍,选项中的和满足题意.
故选:BC.
【即学即练7】为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
铅中毒病人
29
7
36
对照组
9
28
37
总计
38
35
73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
【答案】答案见解析
【解析】
【分析】分别计算铅中毒组和对照组的阳性、阴性比例,根据所得数据画出等高堆积条形图,考察铅中毒病人与对照组的阳性与阴性的比值是否差异明显即可得到结论.
【详解】解:铅中毒组的阳性比例为,阴性比例为;
对照组的阳性比例为,阴性比例为,由此画出等高堆积条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
【点睛】本题考查登高堆积条形图的绘制和应用,用等高条形图可以粗略地判断两个分类变量是否有关.
【即学即练8】在对人们的休闲方式的一次调查中,共调查了110人,其中女性50人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)由列联表判断性别与休闲方式是否有关系.
【答案】(1)列联表答案见解析;(2)性别与休闲方式有关系.
【解析】
【分析】(1)根据2×2的列联表要求列表.
(2)根据列联表中的数据,分别算出女性、男性中休息方式为看电视的频率即可判断.
【详解】
(1)2×2的列联表:
看电视
运动
合计
女
30
20
50
男
20
40
60
合计
50
60
110
(2)根据列联表中的数据,可得女性中休息方式为看电视的频率为,男性中休息方式为看电视的频率为,二者差别较大,可知性别与休闲方式有关系.
能力拓展
考法01
分类变量
【典例1】观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【答案】D
【解析】
【分析】
由等高条形图的定义和性质依次分析,即得解
【详解】
观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.
故选:D
【典例2】.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是( )
A.样本中的男生数量多于女生数量 B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢手机支付 D.样本中多数女生喜欢现金支付
【答案】D
【详解】
由右边条形图知,男生女生喜欢手机支付的比例都高于现金支付的比例,所以男生女生都喜欢手机支付,故对,错,由左边条形图知,男生女生手机支付都比现金支付比例相同,对,结合两个条形图可知,样本中的男生数量多于女生数量,对,故选D.
【典例3】为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】C
【解析】
【分析】
通过阅读理解、识图,将数据进行比对,通过计算可得出C选项错误.
【详解】
由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图知:
在A中,城镇户籍倾向选择生育二胎的比例为,农村户籍倾向选择生育二胎的比例为,是否倾向选择生育二胎与户籍有关,故A正确;
在B中,男性倾向选择生育二胎的比例为,女性倾向选择生育二胎的比例为,
是否倾向选择生育二胎与性别无关,故B正确;
在C中,男性倾向选择生育二胎的比例为,人数为人,
女性倾向选择生育二胎的比例为,人数为人,
倾向选择生育二胎的人员中,男性人数比女性人数多,故C错误;
在D中,倾向选择不生育二胎的人员中,农村户籍人数为人,城镇户籍人数为人,
倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D正确.
故选:C.
【典例4】某校文理合卷期中考试后,按照学生的数学考试成绩优秀和不优秀进行统计,得到如下列联表:
优秀
不优秀
总计
文科
60
140
200
理科
265
335
600
总计
325
475
800
画出列联表的等高堆积条形图,并通过图形判断数学成绩优秀与文理分科是否有关.
【答案】作图见解析,数学成绩与文理分科有关.
【解析】
【分析】
做出等高堆积条形图,根据等高堆积条形图的性质进行判断即可.
【详解】
等高堆积条形图如图所示:
由图形可以看出,文理科数学成绩优秀率差距较大,说明数学成绩与文理分科有关.
【典例5】某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.
【解析】 作列联表如下:
单位:人
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张的样本中性格内向占的比例高,可以认为该校高三学生考前心情紧张与性格类型有关.
考法02
列联表
【典例6】在2×2列联表中,两个比值与______相差越大,两个分类变量有关系的可能性越大.
【答案】
【解析】
【分析】结合二联表特征,直接分析填写即可.
【详解】
根据2×2列联表可知,比值与相差越大,则就越大,那么两个分类变量有关系的可能性就越大.
故答案为:
【典例7】如表是一个2×2列联表:则表中a,b的值分别为( )
y1
y2
合计
x1
a
21
73
x2
22
25
47
合计
b
46
120
A.94,72 B.52,50 C.52,74 D.74,52
【答案】C
【分析】
根据表中数据简单计算即可.
【详解】a=73-21=52,b=a+22=52+22=74.故选:C.
【典例8】某村庄对改村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B. C. D.
【答案】D
【解析】
分析:先根据列联表列方程组,解得a,b,c,d,e,f,再判断真假.
详解:因为,
所以
选D.
【典例9】.假设2个分类变量X和Y的2×2列联表如下:
Y
X
y1
y2
总计
x1
a
10
a+10
x2
c
30
c+30
总计
a+c
40
100
对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )
A.a=40,c=20 B.a=45,c=15 C.a=35,c=25 D.a=30,c=30
【答案】B
【分析】
根据题意, 一定时,,相差越大,与相差就越大,的观测值就越大,由此能说明和有关系的可能性越大.
【详解】
的观测值,
根据2×2列联表和独立性检验的相关知识,当, 一定时,,相差越大,与相差就越大,就越大,即和有关系的可能性越大,选项B中与其它选项相比相差最大.
故选:B
【典例10】假设两个分类变量和,他们的取值分别为和,其样本频数列联表如下:
总计
总计
对于以下数据,对同一样本说明与有关的可能性最大的一组是( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【解析】
依据越大,说明与有关的可能性越大,即可判定.
【详解】
一般地,越大,说明与有关的可能性越大.
选项A中,;
选项B中,;
选项C中,;
选项D中,.
故选:B.
【点睛】
此题考查独立性检验思想,根据列联表数据判定两个分类变量的相关性,关键在于熟练掌握独立性检验思想的应用.
【典例11】针对某新型病毒,某科研机构已研发出甲、乙两种疫苗,为比较两种疫苗的效果,选取100名志愿者,将他们随机分成两组,每组50人.第一组志愿者注射甲种疫苗,第二组志愿者注射乙种疫苗,经过一段时间后,对这100名志愿者进行该新型病毒抗体检测,发现有的志愿者未产生该新型病毒抗体,在未产生该新型病毒抗体的志愿者中,注射甲种疫苗的志愿者占.根据题中数据,完成列联表
产生抗体
未产生抗体
合计
甲
乙
合计
【答案】列联表见解析.
【解析】
【分析】根据题中数据及比例计算表格中的对应人数,完成列联表即可
【详解】根据题中数据可得未产生该新型病毒抗体的志愿者的人数为,
则注射甲种疫苗的志愿者中未产生抗体的人数为,产生抗体的人数为;
注射乙种疫苗的志愿者中未产生抗体的人数为,产生抗体的人数为.
产生抗体
未产生抗体
合计
甲
48
2
50
乙
42
8
50
合计
90
10
100
考法03
独立性检验应用
【典例12】对于独立性检验,下列说法正确的是( )
A.时,有95%的把握说事件与无关
B.时,有99%的把握说事件与有关
C.时,有95%的把握说事件与有关
D.时,有99%的把握说事件与无关
【答案】B
【分析】
根据独立性检验中卡方的概念知,选B.
【详解】
根据独立性检验中卡方的概念知,时,有99%的把握说事件与有关选B.
【点睛】
本题主要考查了独立性检验中卡方的概念,属于中档题.
【典例13】给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.喝酒者得胃病的概率
C.喜欢喝酒与性别是否有关
D.学习成绩与体重是否有关
【答案】B
【解析】
【分析】利用独立性检验的定义直接判断作答.
【详解】
独立性检验是对两个分类变量是否有关进行检验,
对于A,参加体育锻炼有喜欢、不喜欢,性别有男女,是对两个分类变量是否有关进行检验;
对于B,喝酒者得胃病的概率不涉及分类变量,不可以用独立性检验解决;
对于C,喝酒有喜欢、不喜欢,性别有男女,是对两个分类变量是否有关进行检验;
对于D,学习成绩有好与坏,体重有轻与重,是对两个分类变量是否有关进行检验.
故选:B
【典例14】某校对学生进行心理障碍测试,得到的数据如下表:
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( )
A.焦虑 B.说谎 C.懒惰 D.以上都不对
【答案】B
【分析】
分别求出三种关系的观测值,比较后可得结论.
【详解】
解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为,
由表中数据可得:
,
,
,
因为的值最大,所以说谎与性别关系最大.
故选:B.
【典例15】千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
夜晚天气
日落云里走
下雨
未下雨
出现
25
5
未出现
25
45
临界值表
P()
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
并计算得到,下列小波对地区A天气判断不正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有的把握认为夜晚会下雨
【答案】D
【解析】
【分析】把频率看作概率,即可判断的正误;根据独立性检验可判断的正误,即得答案.
【详解】由题意,把频率看作概率可得:
夜晚下雨的概率约为,故正确;
未出现“日落云里走”夜晚下雨的概率约为,故正确;
由,根据临界值表,可得有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故正确;故错误.故选:.
【点睛】本题考查独立性检验,属于基础题.
【典例16】(多选)对甲、乙两个班级共105名学生的数学考试成绩按照优秀和不优秀统计人数后,得到下表:
成绩情况
班级
优秀
不优秀
总计
甲班
10
乙班
30
总计
已知在这105名学生中随机抽取1人,成绩优秀的概率为,则( )
A.列联表中的值为20,的值为45 B.列联表中的值为15,的值为50
C.有95%的把握认为成绩是否优秀与班级有关系 D.没有95%的把握认为成绩是否优秀与班级有关系
【答案】AC
【分析】成绩优秀的学生人数和不优秀的学生人数可计算,,再代入卡方公式计算,即可得到答案;
【解析】由题意,知成绩优秀的学生人数是,成绩不优秀的学生人数是,所以,,选项A正确,B错误.
因为,所以有95%的把握认为成绩是否优秀与班级有关系,选项C正确,D错误.
故选:AC
【典例17】(多选)2020年2月,全国“停课不停学”期间,各地教师通过网络直播、微课推送等方式来指导学生线上学习.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,则被调查的男、女学生的总人数可能为( )
A.120 B.130 C.240 D.250
【答案】AB
【解析】
【分析】
根据题意设男、女生的人数各为,建立列联表,计算,列不等式组求出的取值范围,即可确定满足条件的选项.
【详解】
解:依题意,设男、女学生的人数均为(),则被调查的男、女学生的总人数为.建立下表:
喜欢网络课程的情况
性别
喜欢
不喜欢
总计
男
女
总计
则.由题意可知,即.故A,B符合题意.
故选:AB
【典例18】某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,得到如下所示的列联表,经计算,则( )
单位:人
性别
满意程度
合计
满意
不满意
男
18
9
27
女
8
15
23
合计
26
24
50
A.该俱乐部的男性会员对运动场所满意的概率的估计值为
B.该俱乐部的男性会员比女性会员对俱乐部的运动场所更满意
C.根据的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异
D.根据的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异
【答案】BC
【解析】
【分析】
根据表格中的数据,可计算男、女会员对运动场所满意的概率,可判断A,B;将值与临界值比较,可判断C,D
【详解】
该俱乐部男性会员对运动场所满意的概率的估计值为,故A错误;
该俱乐部女性会员对运动场所满意的概率的估计值为,又,故B正确;
因为,所以根据的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异,故C正确;
因为,所以根据的独立性检验,无法推断男性会员、女性会员对运动场所的满意程度有差异,故D错误.
故选:BC
【典例19】在吸烟与患肺病是否相关的判断中,有下面的说法:
①若,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是___________.
【答案】③
【解析】
【分析】
根据独立性检验的基本思想,对各个命题分析判断即可
【详解】
对于①,若,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,是指有99%的把握认为这个推理是正确的,有1%的人可能认为推理出理错误,并不是说在100人中必有99人患有肺病,所以①错误,
对于②,从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,是指有99%的把握认为这个推理是正确的,有1%的人可能认为推理出理错误,并不是某人吸烟,则他有99%的可能患有肺病,所以②错误,
对于③,从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误,所以③正确,
故答案为:③
【典例20】有人发现,多看手机容易使人变近视,下表是一个调查机构对此现象的调查结果:
近视
不近视
合计
少看手机
20
38
58
多看手机
68
42
110
合计
88
80
168
则在犯错误的概率不超过______的前提下,可以认为多看手机与人变近视有关系.
附:
0.005
0.001
7.879
10.828
【答案】0.001
【分析】根据公式求出,再对照临界值表即可得出结论
【解析】由题意题中数据可得,,
由临界值表可得,所以在犯错误的概率不超过的前提下,可以认为多看手机与人变近视有关系.故答案为:0.001.
【典例21】某企业有两个分厂生产某种零件,按规定,内径尺寸(单位:mm)的值落在的件为优质品,从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下:
甲厂:
分组
频数
12
63
86
182
分组
频数
92
61
4
乙厂:
分组
频数
29
71
85
159
分组
频数
76
62
18
(1)试分别估计两个分厂生产的零件为优质品的概率;
(2)由以上统计数据填下面的列联表,依据的独立性检验,分析两个分厂生产的零件的质量是否有差异.
甲厂
乙厂
合计
优质品
非优质品
合计
附:,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)甲厂生产的零件为优质品的概率约为;乙厂生产的零件为优质品的概率约为.
(2)列联表见解析,认为两个分厂生产的零件的质量有差异
【分析】(1)直接按照古典概型计算概率即可;
(2)先完成列联表,再计算与参考值比较,做出判断即可.
【解析】(1)甲厂生产的零件为优质品的概率约为;
乙厂生产的零件为优质品的概率约为.
(2)列联表如下:
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1000
零假设为:两个分厂生产的零件的质量无差异,由表中数据得
,
依据的独立性检验,推断不成立,即认为两个分厂生产的零件的质量有差异.
【典例22】新生儿为应对某疾病要接种三次疫苗,假设每次接种之间互不影响,每人每次接种成功的概率相等,为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:/次剂量组与/次剂量组,试验结果如表.
接种成功
接种不成功
合计(人)
/次剂量组
900
100
1000
/次剂量组
973
27
1000
合计(人)
1873
127
2000
(1)根据数据说明哪种方案接种效果好.能否认为该疾病疫苗接种成功与两种接种方案有关?
(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1000人的成功人数比此剂量只接种一次的成功人数平均提高多少?
参考公式:,其中.
参考附表:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)能认为该疾病疫苗接种成功与两种接种方案有关;(2)273.
【分析】(1)先根据两种接种方案的人数直观感知第二种方案好,再利用列联表计算,再利用临界值表进行判定;
(2)设出接种一次成功的概率为p,利用独立事件同时发生的概率求出,再利用二项分布求出期望值即可作出判断.
【解析】(1)由于两种接种方案都是1000人接受临床试验,接种成功人数:
/次剂量组900人,/次剂量组973人,且,
所以方案/次剂量组接种效果好.
因为,
所以能认为该疾病疫苗接种成功与两种接种方案有关.
(2)假设/次剂量组临床试验接种一次成功的概率为p,
由数据知,三次接种后成功的概率为,不成功的概率为,
由于三次接种之间互不影响,每人每次接种成功的概率相等,
所以,解得.
设参与试验的1000人此剂量只接种一次成功的人数为X,
显然,,
参与试验的1000人此剂量只接种一次成功的人数平均为700,.
故试验选用/次剂量组方案,参与该试验的1000人的成功人数比此剂量只接种一次的成功人数平均提高273.
分层提分
题组A 基础过关练
1.在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是 ( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
【答案】C
【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
2. 在吸烟与患肺病是否有病的研究中,下列属于两个分类变量的是( )
A.吸烟,不吸烟 B.患病,不患病
C.是否吸烟,是否患病 D.以上都不对
【答案】C
【解析】
【分析】
根据独立性检验的分类变量的概念判断即可.
【详解】
“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟.
“是否患病”是分类变量,它的两个不同取值:患病和不患病.
可知A,B都是一个分类变量所取的两个不同值.
故选:C.
3. 假设有两个变量x与y的2×2列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A. B.
C. D.
【答案】B
【解析】
【分析】
当与的差距越大,两个变量有关的可能性越大,检验四个选项中所给的与的差距即可得答案
【详解】
解:根据观测值求解公式可知,当与的差距越大,两个变量有关的可能性越大,
对于A,,
对于B,,
对于C,,
对于D,,
显然B的与的差距最大,
故选:B
4. 为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【答案】B
【解析】
【分析】
根据等高条形图中的数据即可得出选项.
【详解】
根据两个表中的等高条形图知,
药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,
所以药物A的预防效果优于药物B的预防效果,
故选:B.
5. 某村庄对该村内名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
年轻人
合计
已知抽取的老年人、年轻人各名,则对列联表数据的分析错误的是( )
A. B.
C. D.
【答案】D
【解析】
根据题中信息可得出关于、、、、、的等式,进而可判断各选项的正误.
【详解】
由题意得,,,,,,
所以,,,,,则.
故选:D.
6. 有关独立性检验的四个命题,其中不正确的是( )
A.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大
B.对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的可信程度越小
C.从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病
D.从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关
【答案】C
【解析】
【分析】
根据独立性检验的原理与知识,对选项中的命题判断正误即可.
【详解】
对于A,两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大,所以A正确;
对于B,对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的可信程度越小,所以B正确;
对于C,从独立性检验可知:有95%的把握认为秃顶与患心脏病有关,不是说某人秃顶,那么他有95%的可能患有心脏病,C错误;
对于D,从独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,所以D正确.
故选:C.
【点睛】
本题考查独立性检验相关知识,考查基本分析判断能力,属基础题.
7. 某大学体育部为了解学生的身高是否与地域有关,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
单位:人
地域
身高
合计
不低于170cm
低于170cm
北方
60
20
80
南方
10
10
20
合计
70
30
100
若认为学生的身高与地域有关,则该推断犯错误的概率不超过( )
A.0.05 B.0.01 C.0.005 D.0.001
【答案】A
【解析】
【分析】
利用2×2列联表中的数据,求得,然后与临界值表对照下结论.
【详解】
零假设为H0:学生的身高与地域无关.
将2×2列联表中的数据代入公式计算,得,
根据小概率值的独立性检验,
我们推断H0不成立,即认为学生的身高与地域有关,此推断犯错误的概率不超过.
故选:A.
8. 福建省采用“3+1+2”新高考模式,其中“3”为全国统考科目语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的120人,选考历史的80人,统计各选科人数如下表,则下列说法正确的是( )
选择科目
选考类别
思想政治
地理
化学
生物
物理类
35
50
90
65
历史类
50
45
30
35
附:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
B.物理类的学生中选择生物的比例比历史类的学生中选择生物的比例低
C.有以上的把握认为选择生物与选考类别有关
D.没有以上的把握认为选择生物与选考类别有关
【答案】D
【解析】
【分析】
计算物理类中选择地理和生物的比例、历史类中选择地理和生物的比例,并进行比较,即可判断AB的正误,根据物理类和历史类中选不选生物的人数分布计算,并与附表中数据比较,即可判断CD的正误.
【详解】
依据表中数据可知,物理类中选择地理的比例为,历史类中选择地理的比例为,所以,即物理类的学生中选择地理的比例比历史类的学生中选择地理的比例低,A错误;
物理类中选择生物的比例为,历史类中选择生物的比例为,
所以,物理类的学生中选择生物的比例比历史类的学生中选择生物的比例高,故B错误;
由表格知,物理类中选考生物和不选生物的人数分别是65、55,合计120人;
历史类中选考生物和不选生物的人数分别是35、45,合计80人;
200人中选生物和不选生物的人数均是100.
故,
由知,没有以上的把握认为选择生物与选考类别有关,故C错误;
由知,没有以上的把握认为选择生物与选考类别有关,故D正确.
故选:D.
9. 某医疗研究所为了检验新开发的流感疫苗对流感的预防作用,根据1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作出如下的的列联表,并提出假设“这种疫苗不能起到预防流感的作用”’则下列说法正确是( )
患流感
未患流感
合计
注射疫苗
200
800
1000
未注射疫苗
260
740
1000
合计
460
1540
2000
附:.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
A.这种疫苗能起到预防流感的有效率为99%;
B.若某人未使用该疫苗,则他在半年中有超过99%的可能性得流感;
C.有1%的把握认为“这种疫苗能起到预防流感的作用”;
D.有99%的把握认为“这种疫苗能起到预防流感的作用”.
【答案】D
【解析】
【分析】
根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度约为99%,即这种疫苗不能起到预防甲型Hln1流感的作用不合理的程度约为99%,得到正确答案.
【详解】
,
由临界值表可知,有99%的把握认为“这种疫苗能起到预防流感的作用”,
故选:D
10. 某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力 C.智商 D.阅读量
【答案】D
【解析】
【分析】根据公式分别计算得观察值,比较大小即可得结果.
【详解】根据公式分别计算得:A.;
;
;
选项D的值最大,所以与性别有关联的可能性最大,故选D.
【点睛】
本题主要考查独立性检验的应用,意在考查灵活应用所学知识解决实际问题的能力,属于中档题.
11. 有两个分类变量X,Y,其列联表如下所示,
a
其中a,均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( )A.8 B.9 C.8或9 D.6或8
【答案】C
【解析】
【分析】先利用列联表计算,再利用临界值表得到关于的不等式,逐个验证进行求解.
【详解】因为且,,所以或7或8或9,
根据公式,得:
,即,
当时,;
当时,;
当时,;
当时,;
即当或9时满足题意.故选:C.
12. 在某次独立性检验中,得到如下列联表:
A
总计
B
200
800
1000
180
a
总计
380
最后发现,没有90%的把握认为A与B有关,则a的值可能是( )
A.300 B.400
C.500 D.600
【答案】D
【解析】
【分析】
根据选项a的值,逐一代入求出观测值,利用独立性检验的基本思想即可求解.
【详解】
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以没有90%的把握认为A与B有关.
故选:D.
题组B 能力提升练
1. (多选题)为了调查,两种药物预防某种疾病的效果,某研究所进行了动物试验.已知参与两种药物试验的动物的品种,状态,数量均相同,图1是药物试验结果对应的等高堆积条形图,图2是药物试验结果对应的等高堆积条形图,则( )
A.服用药物的动物的患病比例低于未服用药物的动物的患病比例
B.服用药物对预防该疾病没有效果
C.在对药物的试验中,患病动物的数量约占参与药物试验动物总数量的60%
D.药物比药物预防该种疾病的效果好
【答案】AD
【解析】
【分析】
根据两个等高堆积条形图,逐个分析选项即可判断出结论.
【详解】
根据题中两组等高堆积条形图,可知服用药物的动物的患病比例低于未服用药物的动物的患病比例,所以正确;
服用药物未患病的动物的频率明显大于未服用药物的,所以可以认为服用药物对预防该疾病有一定效果,所以B不正确;
在对药物的试验中,患病动物的数量占参与药物试验动物总数量的比例为,所以C不正确;
药物试验结果对应的等高堆积条形图显示未服用药与服用药动物的患病数量的差异较药物试验的大,所以药物比药物预防该种疾病的效果好,所以D正确.故选:AD.
2. (多选题)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:
根据图中(35岁以上含35岁)的信息,下列结论中一定正确的是( )
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁以上
C.样本中35岁以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的人对地铁1号线的开通关注度更高
【答案】ABD
【解析】
根据等高条形图数据分析即可依次判断.
【详解】
设等高条形图对应2×2列联表如下:
35岁以上
35岁以下
总计
男性
a
c
a+c
女性
b
d
b+d
总计
a+b
c+d
a+b+c+d
根据第1个等高条形图可知,35岁以上男性比35岁以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.
根据第2个等高条形图可知,男性中35岁以上的比35岁以下的多,即a>c;女性中35岁以下的比35岁以下的多,即b>d.
对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;
对于B,35岁以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;
对于C,35岁以下男性人数为c,35岁以上女性人数为b,无法从图中直接判断b与c的大小关系,所以C不一定正确;
对于D,35岁以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d,所以D正确.
故选:ABD.
3. (多选题)下列说法正确的是( )
A.在统计学中,独立性检验是检验两个随机事件是否有关系的一种统计方法
B.在两个随机事件的样本数据的列联表中,对角线上数据的乘积相差越大,两个事件有关系的可能性就越小
C.对随机事件X与Y的随机变量的,越小,“X与Y有关系”的可信程度越小
D.两个有线性相关关系的变量x,y的相关系数为r,则越接近于0,x与y之间的线性相关程度越强
【答案】AC
【解析】
【分析】
根据独立性检验的定义和变量的相关系数性质对选项一一判断即可.
【详解】
A显然正确;
对于B,对角线上数据的乘积相差越大,越大,两个事件有关系的可能性就越大,B错误;
对于C,易知越小,“X与Y有关系”的可信程度越小,C正确;
对于D,越接近于0,相关程度越弱,越接近于1,相关程度越强,D错误.
故选:AC.
4. (多选题)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若依据的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为( )
A.25 B.45 C.60 D.75
【答案】BCD
【解析】
【分析】
设男生的人数为5n(),求出,解不等式即得解.
【详解】
解:设男生的人数为5n(),根据题意列出2×2列联表如下所示:
单位:人
喜爱度
性别
合计
男生
女生
喜欢航天
4n
3n
7n
不喜欢航天
n
2n
3n
合计
5n
5n
10n
则,
∵依据的独立性检验,认为是否喜欢航天与学生性别有关,∴,
即,得,∴,又,
∴结合选项知B,C,D正确.
故选:BCD.
5. (多选题)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的2×2列联表(个别数据暂用字母表示):
单位:人
阅读量
幸福感
合计
幸福感强
幸福感弱
阅读量多
m
18
72
阅读量少
36
n
78
合计
90
60
150
计算得,对于下面的选项,正确的为( )
A.
B.
C.根据小概率值的独立性检验,可以认为“阅读量多少与幸福感强弱无关”
D.根据小概率值的独立性检验,可以在犯错误的概率不超过0.005的前提下认为“阅读量多少与幸福感强弱有关”
【答案】AD
【解析】
【详解】
∵,,∴,,∴A正确,B错误;∵,,,
∴,,∴根据小概率值的独立性检验,可以在犯错误的概率不超过0.01的前提下认为“阅读量多少与幸福感强弱有关”,
根据小概率值的独立性检验,可以在犯错误的概率不超过0.005的前提下认为“阅读量多少与幸福感强弱有关”,∴C错误,D正确.
故选:AD.
6. (多选题)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试.为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:
未发病
发病
合计
未注射疫苗
20
注射疫苗
30
合计
50
50
100
现从试验动物中任取一只,取得“注射疫苗”的概率为,则下列判断中正确的是( )
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为
C.能在犯错概率不超过0.001的前提下,认为疫苗有效
D.该疫苗的有效率为75%
【答案】ABC
【解析】
【分析】
由独立检验和古典概型定义对每一选项进行判断即可.
【详解】
由题可知注射疫苗的动物共只,则未注射为60只,补充列联表如下:
未发病
发病
合计
未注射疫苗
20
40
60
注射疫苗
30
10
40
合计
50
50
100
由此可得A,B正确;
计算得,
故能在犯错概率不超过0.001的前提下,认为疫苗有效,故C正确,D错误.
故选:ABC.
7. (多选题)有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
0.050
0.010
0.001
k
3.841
6.635
10.828
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为20, b的值为45
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
【答案】BC
【解析】
【分析】
由成绩优秀的概率,可求的成绩优秀的人数,进而求出非优秀人数,得到的值,计算的观测值,对照题目中的表格,即可得到统计的结论.
【详解】
由题意,在全部的105人中随机抽取1人,成绩优秀的概率为,
所以成绩又由的人数为人,非优秀的人数为人,
所以,
则的观测值,
若按95%的可靠性要求,能认为“成绩与班级有关系”.
故选:BC.
【点睛】
本题主要考查了独立性检验的应用问题,同时考查了运算与求解能力,属于基础题.
8.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:
不喜欢西班牙队
喜欢西班牙队
总计
40岁以上
50
不高于40岁
15
35
50
总计
100
已知工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.
参考公式与临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.702
2.706
3.841
5.024
6.635
7.879
10.828
【答案】
【解析】
【分析】
由题意可知,可得a、b、p、q的值,由公式可得的观测值,可得结论.
【详解】
设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件,
由已知得,
所以,,,,
,
故有超过的把握认为年龄与西班牙队的被喜欢程度有关.
故答案为:.
【点睛】本题考查独立性检验,考查学生的数据分析能力与计算能力.
9. 某学生对其30名亲属的饮食习惯进行了一次调查,依据统计所得数据可得到如下的列联表:
喜欢吃蔬菜
喜欢吃肉类
总计
50岁以下
8
50岁以上
16
2
18
总计
30
根据以上列联表中的数据,可得的观测值__________,__________(填“有”或“没有”)的把握认为其亲属的饮食习惯与年龄有关.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】 10 有
【解析】
【分析】
根据列联表,求得的值,利用公式,求得的值,结合附表,即可得到结论.
【详解】
由列联表可得,,,,
可得,
所以有的把握认为其亲属的饮食习惯与年龄有关.
故答案为:;有.
10. 2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被新冠病毒感染
未被新冠病毒感染
总计
注射疫苗
10
50
未注射疫苗
30
总计
a
100
表中的值为__________;计算可知,在犯错误的概率最多不超过__________的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
参考公式:,.
参考数据:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】 30
【解析】
根据题意完善列联表代入公式计算即可.
【详解】
解:完善列联表如下:
被新冠病毒感染
未被新冠病毒感染
总计
注射疫苗
10
40
50
未注射疫苗
20
30
50
总计
30
70
100
所以
因为
又
所以在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
故答案为:30;
11. 下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
知道想学专业
不知道想学专业
合计
男生
63
117
180
女生
42
82
124
合计
105
199
304
根据表中数据,下列说法正确的是______.(填序号)
①性别与知道想学专业有关;
②性别与知道想学专业无关;
③女生比男生更易知道想学专业.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】②
【解析】
【分析】
计算的值,小于0.1的临界值,即可认为性别与知道想学专业无关.
【详解】
,
所以性别与知道想学专业无关,故②正确.
12. 有两个分类变量X和Y,其中一组观测值为如下的列联表:
Y
X
合计
a
15
50
合计
20
45
65
其a,均为大于5的整数,则______时,在犯错误的概率不超过0.01的前提下认为“X和Y之间有关系”.
【答案】9
【解析】
【分析】
由,可求得的范围,从而得结论.
【详解】
由题意知,
则,解得或.因为且,,所以.
故答案为:9
13. 某中学共有学生5000名,其中男生3500名,女生1500名,为了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现用分层随机抽样的方法从中收集300名学生每周平均体育锻炼时间的样本数据(单位:),其频率分布直方图如下:
已知在样本数据中,有60名女生的每周平均体育锻炼时间不少于4h,根据独立性检验原理,我们有______的把握认为该校学生每周平均体育锻炼时间与性别有关.
【答案】95%
【解析】
【分析】
根据频率分布直方图可得男女同学每周锻炼时间少于4小时和不少于4小时的列联表,计算,根据临界值作出结论即可.
【详解】
由题意,得从5000名学生中抽取一个容量为300的样本,其中男生、女生各抽取的人数为,,由频率分布直方图,可知每周平均体育锻炼时间不少于4h的人数的频率为0.75,所以在300名学生中每周平均体育锻炼时间不少于的人数为,又在每周平均体育锻炼时间不少于的学生中,女生有60名,所以男生有(名),可得如下列联表:
性别
体育锻炼情况
男
女
总计
每周平均体育锻炼时间少于
45
30
75
每周平均体育锻炼时间不少于
165
60
225
总计
210
90
300
由列联表可得,因为,
所以有95%的把握认为该校学生每周平均体育锻炼时间与性别有关.
故答案为:95%
C 培优拔尖练
1. 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.请利用等高堆积条形图判断学生学习成绩与经常上网是否有关.
【答案】可以认为学习成绩与经常上网有关.
【解析】
【分析】根据已知条件列出列联表,计算经常上网和不经常上网的学生的期末考试不及格和及格的频率,画出等高堆积条形图,从图观察看发现经常上网学生的成绩不及格的频率明显高于不经常上网学生的成绩不及格的频率,即得结论.
【详解】根据题目所给的数据得到如下列联表:
学习成绩
上网
合计
经常
不经常
不及格
80
120
200
及格
120
680
800
合计
200
800
1000
经常上网的学生中期末考试不及格和及格的频率分别为和;
不经常上网的学生中期末考试不及格和及格的频率分别为和.
得出等高堆积条形图如图所示:
比较图中阴影部分的高度可以发现经常上网学生的成绩不及格的频率明显高于不经常上网学生的成绩不及格的频率,因此可以认为学习成绩与经常上网有关.
2. 某省进行高中新课程革,为了解教师对新课程教学模式的使用情况,某校对一线教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师中对新课程教学模式赞同的有10人,不赞同的有10人;青年教师中对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)试根据小概率值的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.
【答案】(1)列联表见解析;
(2)新课程教学模式的赞同情况与教师年龄无关.
【分析】
(1)根据共调查了50人,其中有老教师20人,青年教师30人.老教师中对新课程教学模式赞同的有10人,不赞同的有10人;青年教师中对新课程教学模式赞同的有24人,不赞同的有6人完成列联表;
(2)根据列联表求得,再与临界值表对照,结合判断.
【解析】(1)列联表如下:
教师年龄
对新课程教学模式
合计
赞同
不赞同
老教师
10
10
20
青年教师
24
6
30
合计
34
16
50
(2)零假设为:对新课程教学模式的赞同情况与教师年龄无关.
由公式得,
根据小概率值的独立性检验,没有充分证据推断不成立,
即认为对新课程教学模式的赞同情况与教师年龄无关.
3.为了提高生产线的运行效率,工厂对生产线的设备进行了技术改造,为了对比技术改造前后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)数据,并绘制了如下茎叶图:
改造前
改造后
9
8
6
5
5
1
8
8
6
6
5
4
3
2
2
1
0
2
2
6
7
9
5
4
4
1
3
2
3
3
4
5
6
7
7
8
9
0
4
1
1
2
2
3
(1)设所采集的40个连续正常运行时间的中位数为m,并将连续正常运行时间超过m和不超过m的次数填入列联表:
超过m
不超过m
改造前
a
b
改造后
c
d
试写出a,b,c,d的值;
(2)根据(1)中的列联表,能否有99%的把握认为生产线技术改造前后的连续正常运行时间有差异?
附:.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1),,,;
(2)有99%的把握认为生产线技术改造前后的连续正常运行时间有差异.
【分析】
(1)根据茎叶图的数据先求得中位数,进而得到,,,,完成列联表;
(2)根据(1)中的列联表将数据代入,求得,然后与临界表对比下结论.
【解析】
(1)由题中茎叶图易知把40个数据从小到大排列位于中间位置的两数为29,31,
故,
所以,,,.
(2)由于,
所以有99%的把握认为生产线技术改造前后的连续正常运行时间有差异.
4. 某校在高一部分学生中调查男女同学对某项体育运动的喜好情况,其二维条形图如图(黑色代表喜欢,白色代表不喜欢,单位:人).
(1)写出列联表;
(2)依据的独立性检验,分析喜欢这项体育运动是否与性别有关;
(3)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.
附表及公式:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
,其中.
【答案】(1)列联表见解析;;(2)认为喜欢这项体育运动与性别无关;(3).
【分析】
(1)由题图数据列表
(2)由公式计算卡方后判断
(3)由古典概型求解
【解析】
(1)观察题中二维条形图,可得
被调查的男生总共45人,其中喜欢这项运动的有15人,不喜欢的有30人;
被调查的女生总共45人,其中喜欢这项运动的有5人,不喜欢的有40人.
由此写出列联表如下:
单位:人
喜欢
不喜欢
合计
男
15
30
45
女
5
40
45
合计
20
70
90
(2)零假设为:喜欢这项体育运动与性别无关.计算可得
,
所以依据的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为喜欢这项体育运动与性别无关.
(3)设喜欢这项体育运动的一名男生和两名女生分别为,,.
任选两人的情况有,,,选一名男生和一名女生的情况有,,所以恰是一男一女的概率.
5. 2020年寒假是特殊的寒假,因为抗击疫情全体学生只能在家进行网上在线学习.为了研究学生在网上学习的情况,某学校在网上随机抽取120名学生对线上教育进行调查,其中男生与女生的人数之比为11:13,其中男生中有30名表示对线上教育满意,女生中有15名表示对线上教育不满.
(1)完成2×2列联表,依据小概率值的独立性检验,能否认为对线上教育是否满意与性别有关?
满意
不满意
合计
男生
30
女生
15
合计
120
(2)从被调查的对线上教育满意的学生中,利用分层抽样抽取8名学生,再从这8名学生中抽取3名学生,作线上学习的经验分享,其中抽取男生的人数为,求出的分布列及数学期望.
附:,.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)填表见解析;可以认为对线上教育是否满意与性别有关 ;(2)分布列见解析;期望为.
【解析】
【分析】
(1)由题设数据完成列联表,计算出,与6.635比较即可得解;
(2)由题意结合超几何分布的知识运算即可得解.
【详解】
(1)男生人数为,女生人数为120-55=65,
所以2×2列联表如下:
满意
不满意
合计
男生
30
25
55
女生
50
15
65
合计
80
40
120
令假设为:对线上教育是否满意与性别无关.
根据列联表中的数据,得到:
,
根据的独立性检验,我们可以推断不成立,
即认为对线上教育是否满意与性别有关,该推断犯错误的概率不超过0.01;
(2)由(1)可知男生抽取3人,女生抽取5人.
依题可知的所有可能取值为0,1,2,3,并且服从超几何分布.
则,,
,.
可得的分布列为
0
1
2
3
所以.
6. 随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动.
(1)完成下列2×2列联表:
运动
非运动
总计
男性
女性
总计
(2)如果在犯错误的概率不超过0.05的前提下,可认为性别与休闲方式有关,那么本次被调查的至少:有多少人?
【答案】(1)
运动
非运动
总计
男性
女性
总计
(2)
【分析】
(1)根据题意补充表格即可;
(2)根据题意得,代入公式计算即可.
【解析】
(1)因为某机构随机调查了个人,其中男性占调查人数的,所以男性总人数为,女生总人数为,又男性中有一半的人的休闲方式是运动,所以男性中运动的有,非运动有;因为女性中只有的人的休闲方式是运动,所以女性中运动的有,非运动有,所以表格如下:
运动
非运动
总计
男性
女性
总计
(2)若在犯错误的概率不超过0.05的前提下,可认为性别与休闲方式有关,
则,
由于的观测值,故,即,
又因为,故,故若在犯错误的概率不超过0.05的前提下,可认为性别与休闲方式有关,那么本次被调查的至少有140人.
7. 为调查了解某高等院校毕业生参加工作后,从事的工作与大学所学专业是否专业对口,该校随机调查了80位该校2017年毕业的大学生,得到具体数据如下表:
专业对口
专业不对口
合计
男
30
10
40
女
35
5
40
合计
65
15
80
(1)能否在犯错误的概率不超过5%的前提下,认为“毕业生从事的工作与大学所学专业对口与性别有关”?
(2)求这80位毕业生从事的工作与大学所学专业对口的概率,并估计该校近3年毕业的2000名大学生从事的工作与大学所学专业对口的人数;
(3)若从从事工作与所学专业不对口的15人中选出男生甲、乙,女生丙、丁,让他们两两进行一次10分钟的职业交流,该校宣传部对每次交流都一一进行视频记录,然后随机选取一次交流视频上传到学校的网站,试求选取的视频恰为异性交流视频的概率.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能在犯错误的概率不超过5%的前提下,认为“毕业生从事的工作与大学所学专业对口与性别有关”.(2),1625.(3).
【分析】
(1)根据数据计算卡方值参考数据即可判断结果;
(2)根据相关概率即可求解所要求的数据;
(3)选取的视频恰为异性交流视频的概率为.
【解析】
(1)由列联表中的数据,得,所以不能在犯错误的概率不超过5%的前提下,认为“毕业生从事的工作与大学所学专业对口与性别有关”.
(2)这80位毕业生从事的工作与大学所学专业对口的概率为,由此估计该校近3年毕业的2000名大学生中从事的工作与大学所学专业对口的人数为.
(3)选取的视频恰为异性交流视频的概率为.
8.中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许
多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天
体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100
名学生进行调查,调查样本中有40名女生.如图是根据样本的调查结果绘制的等高堆积条形图.
单位:人
关注
没关注
合计
男生
女生
合计
附:
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
,其中.
(1)完成列联表,并依据的独立性检验,分析对“嫦娥五号”的关注程度与性别是否有关;
(2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量,求的分布列及数学期望.
【答案】(1)列联表见详解,对“嫦娥五号”的关注程度与性别有关,理由见解析;
(2)随机变量的分布列见详解,数学期望是.
【分析】
(1)根据等高堆积条形图完善列联表,代入公式求出卡方,与3.841比较带下,得出结论;(2)得到X服从二项分布,从而求出相应的概率及分布列,利用二项分布求期望公式得到期望值.
【解析】
(1)列联表如下:单位:人
关注
没关注
合计
男生
30
30
60
女生
12
28
40
合计
42
58
100
零假设为:对“嫦娥五号”的关注程度与性别无关.
经计算可得,
依据的独立性检验,推断不成立,即对“嫦娥五号”的关注程度与性别有关.
(2)由题意得随机选一个高三的女生,对此事关注的概率为,因此,
所以;;
;,
则随机变量的分布列为
0
1
2
3
故.
【同步讲义】(人教A版2019)高中数学选修第三册:8.3 列联表与独立性检验 讲义: 这是一份【同步讲义】(人教A版2019)高中数学选修第三册:8.3 列联表与独立性检验 讲义,文件包含同步讲义人教A版2019高中数学选修第三册83列联表与独立性检验原卷版docx、同步讲义人教A版2019高中数学选修第三册83列联表与独立性检验解析版docx等2份试卷配套教学资源,其中试卷共60页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精品测试题: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精品测试题,文件包含83列联表与独立性检验-2023-2024学年高二数学考点讲解练人教A版2019选择性必修第三册解析版docx、83列联表与独立性检验-2023-2024学年高二数学考点讲解练人教A版2019选择性必修第三册原卷版docx等2份试卷配套教学资源,其中试卷共63页, 欢迎下载使用。
数学选择性必修 第三册8.3 分类变量与列联表复习练习题: 这是一份数学选择性必修 第三册8.3 分类变量与列联表复习练习题,文件包含人教A版2019选择性必修三高中数学同步83列联表与独立性检验解析版01docx、人教A版2019选择性必修三高中数学同步83列联表与独立性检验原卷版01docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。