数学选择性必修 第三册8.3 分类变量与列联表学案设计
展开新知探究
饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.
问题 人的身体健康状况与饮用水的质量之间有关系吗?
提示 我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.
1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
拓展深化
[微判断]
1.分类变量中的变量与函数中的变量是同一概念.(×)
提示 分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.
2.列联表中的数据是两个分类变量的频数.(√)
3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.(√)
[微训练]
1.下列不是分类变量的是( )
A.近视 B.成绩
C.血压 D.饮酒
解析 近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案 B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
解析 由题意得eq \b\lc\{(\a\vs4\al\c1(24+m=50,,56+44=n,))
解得eq \b\lc\{(\a\vs4\al\c1(m=26,,n=100.))
答案 26 100
[微思考]
1.是否吸烟、是否患肺癌是什么变量?
提示 分类变量.
2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示 不是.
题型一 用2×2列联表分析两分类变量间的关系
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用eq \f(a,a+b)与eq \f(c,c+d)判断二者是否有关系.
解 2×2列联表如下:
将表中数据代入公式得
eq \f(a,a+b)=eq \f(43,64)=0.671 875.eq \f(c,c+d)=eq \f(27,60)=0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
规律方法 (1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq \f(a,a+b)与eq \f(c,c+d) eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
【训练1】 假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
解析 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
答案 C
题型二 用等高堆积条形图分析两分类变量间的关系
【例2】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
解 作列联表如下:
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
规律方法 利用等高堆积条形图判断两个分类变量是否相关的步骤:
【训练2】 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
解 根据题目给出的数据作出如下的列联表:
根据列联表作出相应的等高堆积条形图:
从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.
一、素养落地
1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.
2.列联表与等高堆积条形图
列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.
二、素养训练
1.与表格相比,能更直观地反映出相关数据总体状况的是( )
A.列联表 B.散点图
C.残差图 D.等高堆积条形图
答案 D
2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.
答案
3.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).
解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
答案 有
4.(多空题)下面是一个2×2列联表:
则表中a=________,b=__________.
解析 由题意得eq \b\lc\{(\a\vs4\al\c1(a+21=73,,a+2=b,))解得eq \b\lc\{(\a\vs4\al\c1(a=52,,b=54.))
答案 52 54
5.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
试用等高条形图分析服用药和患病之间是否有关系.
解 根据列联表所给的数据可得出服用药患病的频率为eq \f(10,55)≈0.18,未服用药患病的频率为eq \f(20,50)=0.4,两者的差距是|0.18-0.4|=0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病有关系.
基础达标
一、选择题
1.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
解析 观察等高条形图发现eq \f(x1,x1+y1)和eq \f(x2,x2+y2)相差越大,就判断两个分类变量之间关系越强.
答案 D
2.可以粗略地判断两个分类变量是否有关系的是( )
A.散点图 B.等高堆积条形图
C.残差图 D.以上都不对
解析 用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.
答案 B
3.(多选题)分类变量X和Y的列联表如下:
则下列说法不正确的是( )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
解析 |ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.
答案 ABD
4.已知两分类变量的列联表如下:
最后发现,这两个分类变量没有任何关系,则a的值可能是( )
A.200B.720
C.100 D.180
解析 由于A和B没有任何关系,根据列联表可知eq \f(200,1 000)和eq \f(180,180+a)基本相等,检验可知,B满足条件,故选B.
答案 B
5.(多选题)如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的百分比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的百分比为40%
解析 由题图知女生中喜欢理科的百分比为20%,男生不喜欢理科的百分比为40%,男生比女生喜欢理科的可能性大些,故A,B不正确,C,D正确.
答案 CD
二、填空题
6.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是__________________________________________________________.
答案 男正教授人数,男副教授人数;女正教授人数,女副教授人数
7.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列给出的________最具说服力(填序号).
①回归直线方程;②平均数与方差;③等高堆积条形图.
解析 由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,应用等高堆积条形图最具说服力.
答案 ③
8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__________(填“是”或“否”).
解析 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即eq \f(b,a+b)=eq \f(18,58),eq \f(d,c+d)=eq \f(27,42),两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
答案 是
三、解答题
9.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
10.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
解 由题目所给的数据得2×2列联表:
相应的等高条形图如图所示.
图中两个深色条的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
能力提升
11.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )
A.eq \f(a,a+b)与eq \f(c,c+d) B.eq \f(a,c+d)与eq \f(c,a+b)
C.eq \f(a,a+d)与eq \f(c,b+c) D.eq \f(a,b+d)与eq \f(c,a+c)
解析 由题意,eq \b\lc\|\rc\|(\a\vs4\al\c1(\f(a,a+b)-\f(c,c+d)))=eq \b\lc\|\rc\|(\a\vs4\al\c1(\f(ac+ad-ac-bc,(a+b)(c+d))))=eq \b\lc\|\rc\|(\a\vs4\al\c1(\f(ad-bc,(a+b)(c+d)))),因为|ad-bc|的值越大,两个分类变量有关系的可能性就越大,故选A.
答案 A
12.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
解 等高条形图如图所示:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
创新猜想
13.(多选题)已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
若两个分类变量X,Y没有关系,则下列结论正确的 ( )
A.ad≈bc
B.eq \f(a,a+b)≈eq \f(c,c+d)
C.eq \f(c+d,a+b+c+d)≈eq \f(b+d,a+b+c+d)
D.eq \f(c+a,a+b+c+d)≈eq \f(b+d,a+b+c+d)
解析 因为分类变量X,Y没有关系,所以eq \f(a,a+b)≈eq \f(c,c+d),化简得ad≈bc,所以A,B正确,C,D显然不正确.
答案 AB
14.(多空题)下表是关于男婴与女婴出生时间调查的列联表:
那么,A=__________,B=__________,C=__________,D=__________,E=__________.
解析 由列联表知识得eq \b\lc\{(\a\vs4\al\c1(45+E=98,,98+D=180,,A+35=D,,E+35=C,,B+C=180,))解得eq \b\lc\{(\a\vs4\al\c1(A=47,,B=92,,C=88,,D=82,,E=53.))
答案 47 92 88 82 53
课标要求
素养要求
1.通过实例,理解2×2列联表的统计意义.
2.理解判断两个分类变量是否有关系的常用方法.
通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
80分及80分以上
80分以下
合计
试验班
32
18
50
对照班
24
m
50
合计
56
44
n
年龄在六十岁以上
年龄在六十岁以下
合计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
合计
70
54
124
y1
y2
x1
10
18
x2
m
26
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
色盲
不色盲
合计
男
38
442
480
女
6
514
520
合计
44
956
1 000
喜欢吃甜食
不喜欢吃甜食
合计
男
117
413
530
女
492
178
670
合计
609
591
1 200
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
患病
未患病
合计
服用药
10
45
55
未服用药
20
30
50
合计
30
75
105
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
A
eq \(A,\s\up6(-))
合计
B
200
800
1 000
eq \(B,\s\up6(-))
180
a
180+a
合计
380
800+a
1 180+a
文艺节目
新闻节目
合计
20至40岁
40
18
58
大于40岁
15
27
42
合计
55
45
100
组别
阳性数
阴性数
合计
铅中毒病人
29
7
36
对照组
9
28
37
合计
38
35
73
阳性例数
阴性例数
合计
穿新防护服
5
70
75
穿旧防护服
10
18
28
合计
15
88
103
子女吸烟
子女不吸烟
合计
父母吸烟
237
678
915
父母不吸烟
83
522
605
合计
320
1 200
1 520
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
晚上
白天
合计
男婴
45
A
B
女婴
E
35
C
合计
98
D
180
人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表优秀导学案: 这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表优秀导学案,共7页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,参考答案等内容,欢迎下载使用。
数学选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表学案设计: 这是一份数学选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表学案设计,共5页。学案主要包含了规律方法,变式训练1,变式训练2,变式训练3等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表导学案: 这是一份人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表导学案,共17页。学案主要包含了等高堆积条形图的应用,由χ2进行独立性检验等内容,欢迎下载使用。