数学选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表学案设计
展开第6课时 分类变量与列联表
|
1.分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为 分类变量 .
分类变量是区别不同的现象和性质的一种特殊的随机变量.
分类变量的取值可以用实数来表示.例如男性、女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.
2.2×2列联表
列出的成对分类变量数据的交叉分类频数表,称为 2×2列联表 .
2×2列联表
| B1 | B2 | 总计 |
A1 | a | b | a+b |
A2 | c | d | c+d |
总计 | a+c | b+d | n=a+b+c+d |
在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0, 因此|ad-bc|越小, 关系越弱; |ad-bc|越大, 关系越强.
3.等高堆积条形图
等高堆积条形图与表格相比,图形更能直观地反映出两个分类变量间是否 相互影响 , 常用等高堆积条形图展示列表数据的 频率特征 .
1.可以粗略地判断两个分类变量是否有关系的是( D )
A.列联表 B.散点图
C.残差图 D.等高堆积条形图
2.如图是调查某学校高三年级男女学生是否喜欢数学的等高堆积条形图,阴影部分的高表示喜欢数学的频率.已知该年级男生女生各500名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层随机抽样的方式抽取32人,则抽取的男生人数为( C )
A.16 B.32
C.24 D.8
解析: 由等高堆积条形图可知,喜欢数学的女生和男生的比为1∶3,所以抽取的男生数为24人.故选C.
3.假设有两个变量x与y的2×2列联表如表,对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( B )
| y1 | y2 |
x1 | a | b |
x2 | c | d |
A.a=2,b=3,c=4,d=5
B.a=5,b=3,c=3,d=4
C.a=3,b=6,c=2,d=5
D.a=5,b=3,c=4,d=3
解析: 根据观测值求解的公式可以知道,当ad与bc差距越大,两个变量有关的可能性就越大,检验四个选项中所给的ad与bc的差距.
A:ad-bc=10-12=-2.
B:ad-bc=20-9=11.
C:ad-bc=15-12=3.
D:ad-bc=15-12=3.
显然B中|ad-bc|最大.
4.根据如下图甲所示的等高堆积条形图可知吸烟与患肺病 有 (填“有”或“没有”)关系.
甲
解析: 从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
| y1 | y2 | 总计 |
x1 | a | b | 55 |
x2 | c | d |
|
总计 |
|
| 120 |
乙
5.上表乙是不完整的2×2列联表,其中3a=c,b=2d,则a= 15 .
解析: 由题意得
又3a=c,b=2d,
所以解得a=15.
等高堆积条形图
【例1】 在等高堆积条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )
A.与 B.与
C.与 D.与
解析: 由等高堆积条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.
答案: C
【规律方法】
1.等高堆积条形图可以直观分析两个分类变量的差异特点.
2.画图和分析图形要理清变量,搞清图形的意义,才能准确识图.
【变式训练1】 观察下列各图,其中两个分类变量x,y之间关系最强的是( D )
A B
C D
解析: 观察等高堆积条形图发现与相差很大,就判断两个分类变量之间关系最强.
2×2列联表
【例2】 在湖南省科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏.根据以上数据建立一个2×2的列联表.
解析: 2×2列联表
游戏态度 | 性别 | 合计 | |
男生 | 女生 | ||
喜欢玩电脑游戏 | 18 | 9 | 27 |
不喜欢玩电脑游戏 | 8 | 15 | 23 |
合计 | 26 | 24 | 50 |
【规律方法】
1.2×2列联表根据两个变量将研究对象分为4类,通过图表可以比较清晰看出变量之间的差异.
2.能够根据列联表的特点,由局部变量取值求其他取值.
【变式训练2】 下面是一个2×2列联表:
| y1 | y2 | 总计 |
x1 | a | 21 | 73 |
x2 | 2 | 25 | 27 |
总计 | b | 46 |
|
则表中a,b处的值分别为( C )
A.94,96 B.52,50
C.52,54 D.54,52
解析: 由得
列联表的应用
【例3】 在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:
分数段 | 29~40 | 41~50 | 51~60 | 61~70 | 71~80 | 81~90 | 91~100 |
午休考生人数 | 23 | 47 | 30 | 21 | 14 | 31 | 14 |
不午休考生人数 | 17 | 51 | 67 | 15 | 30 | 17 | 3 |
(1)根据上述表格完成列联表:
| 及格人数 | 不及格人数 | 合计 |
午休 |
|
|
|
不午休 |
|
|
|
合计 |
|
|
|
(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?
解析: (1)根据题表中数据可以得到列联表如下:
| 及格人数 | 不及格人数 | 合计 |
午休 | 80 | 100 | 180 |
不午休 | 65 | 135 | 200 |
合计 | 145 | 235 | 380 |
(2)计算可知,午休的考生及格率为P1==,不午休的考生的及格率为P2==,则P1>P2.因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.
【规律方法】
1.通过2×2列联表可以比较清晰看出变量之间的差异,并且经过适当的加工处理可以得出一些有用数据.
2.根据列联表的特点,通过比例关系可以粗略判断出变量之间的差异.
【变式训练3】 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
| y1 | y2 | 合计 |
x1 | a | b | a+b |
x2 | c | d | c+d |
合计 | a+c | b+d | a+b+c+d |
对同一样本,以下数据能说明X与Y有关的可能性最大的一组为( D )
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5
解析: 对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于A,B,C都有|ad-bc|=|10-12|=2;对于D,有|ad-bc|=|15-8|=7,显然7>2.
1.2×2列联表根据两个变量将研究对象分为4类,并且每一类都有具体意义.
2.可通过对2×2列联表中的数据进行加工,分析数据间的特点.
3.通过数据分析判断两类变量之间的相关性的强弱区别.
人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表优秀导学案: 这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表优秀导学案,共7页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,参考答案等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表导学案: 这是一份人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表导学案,共17页。学案主要包含了等高堆积条形图的应用,由χ2进行独立性检验等内容,欢迎下载使用。
2020-2021学年第八章 成对数据的统计分析8.3 分类变量与列联表学案设计: 这是一份2020-2021学年第八章 成对数据的统计分析8.3 分类变量与列联表学案设计,共18页。