高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表课后复习题
展开8.3 列联表与独立性检验
8.3.1 分类变量与列联表 8.3.2 独立性检验
A级 必备知识基础练
1.(2022河南期中)在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )
A.在100个肥胖的人中至少有99人患有高血压
B.肥胖的人至少有99%的概率患有高血压
C.在100个高血压患者中一定有肥胖的人
D.在100个高血压患者中可能没有肥胖的人
2.若由一个2×2列联表中的数据计算得χ2=4.013,那么认为两个变量有关系犯错误的概率不大于( )
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
A.0.05 B.0.001 C.0.01 D.0.005
3.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关联”进行了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.零假设为H0:追星和性别无关联.若依据α=0.05的独立性检验认为追星和性别有关联,则男生的人数至少为( )
参考数据及公式如下:
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
A.12 B.11 C.10 D.18
4.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下的列联表.零假设为H0:男、女生对该食堂的服务评价无差异.经计算χ2≈4.762,则可以推断出( )
性别
满意
不满意
合计
男
30
20
50
女
40
10
50
合计
70
30
100
附:
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.该学校男生对食堂服务满意的概率的估计值为45
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.依据α=0.05的独立性检验认为男、女生对该食堂服务的评价有差异
D.依据α=0.01的独立性检验认为男、女生对该食堂服务的评价有差异
5.在对某小学的学生进行吃零食的调查中,得到数据如下表:
性别
吃零食
不吃零食
合计
男
27
34
61
女
12
29
41
合计
39
63
102
根据上述数据分析,可得χ2约为 .
6.在独立性检验中,xα有两个临界值:3.841和6.635.当χ2≥3.841时,依据α=0.05的独立性检验认为两个事件有关联;当χ2≥6.635时,依据α=0.01的独立性检验认为两个事件有关联;当χ2<3.841时,依据α=0.05的独立性检验认为两个事件无关联.在一项打鼾与患心脏病的调查中,共调查了2 000人,零假设为H0:打鼾与患心脏病之间无关联.经计算χ2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间 .(填“有关联”或“无关联”)
7.有人发现了一个有趣的现象,中国人的邮箱名称里含有数字比较多,而外国人邮箱名称里含有数字比较少.为了研究国籍和邮箱名称里含有数字的关系,小明收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表;
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关联,你能依据α=0.05的独立性检验帮他判断一下吗?
附:
α
0.10
0.05
0.01
xα
2.706
3.841
6.635
B级 关键能力提升练
8.某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录进行比较,零假设为H0:这种血清与预防感冒之间无关联.利用2×2列联表计算得χ2≈3.918.下列叙述中正确的是( )
A.依据α=0.05的独立性检验认为这种血清与预防感冒之间有关联
B.若有人未使用该血清,则他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
9.(多选题)针对时下流行的某社交平台,某高校对学生性别和喜欢该平台是否有关联进行了一次调查,其中被调查的男生、女生人数相同,男生喜欢该平台的人数占男生人数的45,女生喜欢该平台的人数占女生人数的35.零假设为H0:喜欢该平台和性别无关联.若依据α=0.05的独立性检验认为喜欢该平台和性别有关联,则调查人数中男生的人数可能为( )
附表:
α
0.05
0.01
xα
3.841
6.635
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
A.25 B.45 C.60 D.75
10.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:
日落云里走
夜晚天气
合计
下雨
未下雨
出现
25
5
30
未出现
25
45
70
合计
50
50
100
临界值表:
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
计算得到χ2≈19.05,下列小波对地区A天气判断不正确的是( )
A.夜晚下雨的概率约为12
B.未出现“日落云里走”夜晚下雨的概率约为514
C.在犯错误的概率不大于0.001的前提下,认为“日落云里走”与“当晚下雨”有关联
D.出现“日落云里走”,在犯错误的概率不大于0.001的前提下,认为夜晚会下雨
11.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:
性别
同意限定区域停车
不同意限定区域停车
合计
男
20
5
25
女
10
15
25
合计
30
20
50
则依据α= 的独立性检验认为同意限定区域停车与家长的性别有关联.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.05
0.005
0.001
xα
3.841
7.879
10.828
12.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不大于 .
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
α
0.05
0.010
0.001
xα
3.841
6.635
10.828
13.书籍是文化的重要载体,读书是继承文化的重要方式.某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求n,p的值;
(2)根据已知条件完成下面的2×2列联表,依据α=0.05的独立性检验能否认为“读书之星”与性别有关联?
性别
非读书之星
读书之星
合计
男
女
10
55
合计
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中随机抽取3名学生,每次抽取1名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量X,求X的分布列和均值E(X).
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
C级 学科素养创新练
14.某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造前后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:
改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21
改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36
(1)完成下面的列联表,依据α=0.01的独立性检验,能否据此判断技术改造前后的连续正常运行时间有差异?
时间
超过30天
不超过30天
合计
改造前
改造后
合计
(2)工厂的生产设备需要进行维护,工厂对生产设备的维护费用包括正常维护费和保障维护费两种.对生产设备设定维护周期为T天,即从开工运行到第kT天(k∈N*)进行维护.生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还会产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次保障维护费增加0.2万元.现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内维护费用的分布列及均值.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
8.3.1 分类变量与列联表
8.3.2 独立性检验
1.D “高血压与肥胖有关”,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患高血压没有关系,也不是说“肥胖的人就是至少有99%的概率患有高血压”,只有选项D正确.
2.A 零假设H0:两变量之间没有关系.由一个2×2列联表中的数据计算得χ2=4.013,
因为3.841<4.013<6.635,
则P(χ2≥xα)=0.05,
根据小概率值α=0.05的独立性检验,那么我们推断H0不成立,即认为两个变量有关系,此推断犯错误的概率不超过0.05.
3.A 设男生人数为x,依题意可得如下2×2列联表:
性别
喜欢追星
不喜欢追星
合计
男生
x6
5x6
x
女生
x3
x6
x2
合计
x2
x
3x2
若依据α=0.05的独立性检验认为喜欢追星和性别有关联,
则χ2≥3.841.
由χ2=3x2(x236-5x218)2x2·x·x·x2=38x≥3.841,解得x≥3 841375.
因为x2,x6为整数,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为喜欢追星和性别有关联,男生的人数至少为12.故选A.
4.C 对于选项A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A错误;
对于选项B,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错误;
因为χ2≈4.762>3.841=x0.05,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不大于0.05,故C正确,D错误.
故选C.
5.2.334 χ2=102×(27×29-34×12)239×63×61×41≈2.334.
6.有关联 因为χ2=20.87>6.635,所以依据α=0.01的独立性检验,我们推断H0不成立,即认为两者有关联.
7.解(1)2×2列联表如下:
类型
中国人
外国人
合计
有数字
43
27
70
无数字
21
33
54
合计
64
60
124
(2)零假设为H0:国籍和邮箱名称里是否含有数字无关联.
由表中数据得χ2=124×(43×33-27×21)270×54×64×60≈6.201>3.841=x0.05.
依据α=0.05的独立性检验,我们推断H0不成立,即认为国籍和邮箱名称里是否含有数字有关联,此推断犯错误的概率不大于0.05.
8.A 因为χ2≈3.918>3.841=x0.05,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为这种血清与预防感冒之间有关联,此推断犯错误的概率不大于0.05.
故选A.
9.BC 设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下:
类型
男生
女生
合计
喜欢该平台
4n
3n
7n
不喜欢该平台
n
2n
3n
合计
5n
5n
10n
则χ2=10n×(4n×2n-3n×n)25n×5n×7n×3n=10n21.
因为依据α=0.05的独立性检验,我们推断H0不成立,即认为喜欢该平台和性别有关联,
所以6.635>χ2≥3.841,
即6.635>10n21≥3.841,
解得13.933 5>n≥8.066 1,
因为n∈N*,
所以根据选项调查人数中男生人数的可能值为45或60.
故选BC.
10.D 由题意,把频率看作概率可得夜晚下雨的概率约为25+25100=12,故A正确;未出现“日落云里走”夜晚下雨的概率约为2525+45=514,故B正确;由χ2≈19.05>10.828=x0.001,根据临界值表,可得在犯错误的概率不大于0.001的前提下,认为“日落云里走”与“当晚下雨”有关联,故C正确,D错误.
11.0.005 零假设为H0:同意限定区域停车与家长的性别无关联.因为χ2=50×(20×15-5×10)225×25×30×20≈8.333>7.879=x0.005,
所以依据α=0.005的独立性检验,我们推断H0不成立,即认为同意限定区域停车与家长的性别有关联,此推断犯错误的概率不大于0.005.
12.0.05 2×2列联表如下:
培训方式
通过
未通过
合计
集中培训
45
10
55
分散培训
30
20
50
合计
75
30
105
零假设为H0:“能否一次考试通过与是否集中培训无关”.
∴χ2=105×(45×20-30×10)275×30×50×55≈6.109>3.841=x0.05,
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为“能否一次考试通过与是否集中培训有关”,此推断犯错误的概率不大于0.05.
13.解(1)因为(0.005+p+0.018+0.020+0.022+0.025)×10=1,
所以p=0.01.
所以n=100.1=100.
(2)因为n=100,所以“读书之星”有100×[(0.02+0.005)×10]=25(人).
从而2×2列联表如下所示:
性别
非读书之星
读书之星
合计
男
30
15
45
女
45
10
55
合计
75
25
100
零假设为H0:“读书之星”与性别无关联.将2×2列联表中的数据代入公式计算得
χ2=100×(30×10-15×45)245×55×75×25=10033≈3.030<3.841=x0.05.
依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为“读书之星”与性别无关联.
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为14.
由题意可知X~B3,14.
所以P(X=0)=C30140×(1-14)3=2764;
P(X=1)=C3114×(1-14)2=2764;
P(X=2)=C32142×1-14=964;
P(X=3)=C33143=164.
所以X的分布列为
X
0
1
2
3
P
2764
2764
964
164
E(X)=3×14=34.
14.解(1)零假设为H0:技术改造前后的连续正常运行时间无差异.由题意可得列联表如下:
时间
超过30天
不超过30天
合计
改造前
5
15
20
改造后
15
5
20
合计
20
20
40
根据列联表中的数据,经计算得到χ2=40×(5×5-15×15)220×20×20×20=10>6.635=x0.01.
依据α=0.01的独立性检验,我们推断H0不成立,即认为技术改造前后的连续正常运行时间有差异,此推断犯错误的概率不大于0.01.
(2)由题知,生产周期内有4个维护周期,一个维护周期为30天.在一个维护周期内,生产线需保障维护的概率为P=14.
设一个生产周期内需保障维护的次数为ξ,可知ξ~B4,14.一个生产周期内的正常维护费为0.5×4=2(万元),保障维护费为0.2ξ×(ξ+1)2=(0.1ξ2+0.1ξ)(万元).所以一个生产周期内需保障维护ξ次时的维护费用为(0.1ξ2+0.1ξ+2)万元.
设一个生产周期内的维护费用为X,则X的所有可能取值为2,2.2,2.6,3.2,4,
且P(X=2)=(1-14)4=81256;
P(X=2.2)=C41(1-14)314=2764;
P(X=2.6)=C42(1-14)2142=27128;
P(X=3.2)=C431-14143=364;
P(X=4)=144=1256.
所以X的分布列为
X
2
2.2
2.6
3.2
4
P
81256
2764
27128
364
1256
所以E(X)=2×81256+2.2×2764+2.6×27128+3.2×364+4×1256=162+237.6+140.4+38.4+4256=582.4256=2.275.
所以一个生产周期内生产维护费的均值为2.275万元.
人教版高中数学选择性必修第三册8.3分类变量与列联表同步训练(含答案): 这是一份人教版高中数学选择性必修第三册8.3分类变量与列联表同步训练(含答案),共23页。试卷主要包含了列联表,独立性检验等内容,欢迎下载使用。
人教版高中数学选择性必修第三册8.3分类变量与列联表同步精练(含解析): 这是一份人教版高中数学选择性必修第三册8.3分类变量与列联表同步精练(含解析),共45页。
人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精练: 这是一份人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精练,共5页。试卷主要包含了多空题下面是一个2×2列联表,由a+15=b,得b=50等内容,欢迎下载使用。