高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表教学演示课件ppt
展开
这是一份高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表教学演示课件ppt,共54页。PPT课件主要包含了读教材·知识梳理,研题型·典例精析,扣课标·素养提升,频率特征,是否相互影响,无关系,不成立,所以X的分布列为等内容,欢迎下载使用。
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.
问题 你知道是如何判定吸烟有害健康的吗?
知识点一 分类变量与列联表1.分类变量用以区别不同的____或____的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.本节我们主要讨论取值于{0,1}的分类变量的关联性问题.
2.2×2列联表在实践中,由于保存原始数据的成本太高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将下表这种形式的数据统计表称为2×2列联表.
3. 等高堆积条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图.等高堆积条形图可以展示列联表数据的________,能够直观地反映出两个分类变量间____________.
知识点二 独立性检验1.分类变量X和Y独立如果{X=0}与{Y=0}独立;{X=0}与{Y=1}独立;{X=1}与{Y=0}独立;{X=1}与{Y=1}独立.我们就称分类变量X与Y独立.2.独立性检验(1)小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得下面的关系成立:P(χ2≥xα)=α.我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大;
3.小概率值α的检验规则当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ23.841=x0.050,根据小概率值α=0.05的独立性检验,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
|通性通法|解决独立性检验问题的基本步骤(1)根据已知的数据作出列联表;(2)作出相应的等高堆积条形图,可以利用图形做出相应判断;(3)求χ2的观测值;(4)判断可能性:与临界值比较,得出事件有关的可能性大小.
(2020·新高考全国Ⅰ卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
解:根据抽查数据,可得2×2列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
由于7.484>6.635=x0.010,根据小概率值α=0.010的独立性检验,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
角度二 无关联性检验【例3】 下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
根据表中数据,则下列说法正确的是________.(填序号)①性别与知道想学专业有关;②性别与知道想学专业无关;③女生比男生更易知道所学专业.
|通性通法|独立性检验解决实际问题的主要环节(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老年教师20人,青年教师30人.老年教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;
解:2×2列联表如下表所示:
(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.解:零假设为H0:对新课程教学模式的赞同情况与教师年龄无关.
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即认为对新课程教学模式的赞同情况与教师年龄无关.
1.某班主任对全班50名学生进行了作业量的调查,数据如下表:
则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过 ( )A.0.01 B.0.005 C.0.05 D.0.001
2.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是 ( )A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.
3.根据如图所示的等高堆积条形图可知喝酒与患胃病________关系.(填“有”或“没有”)
解析:从等高堆积条形图上可以明显地看出喝酒患胃病的频率远远大于不喝酒患胃病的频率.
4.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:
根据上述数据能得出结论:有________以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.
1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图 B.回归分析C.独立性检验 D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出χ2的观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.
2.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是( )A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果
解析:从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.
3.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=12,则所得到的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为( )A.0.1% B.0.5%C.99.5% D.99.9%解析:因为χ2=12>10.828=x0.001,所以认为性别与喜欢乡村音乐有关系的把握有99.9%.
4.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:
则可以说其亲属的饮食习惯与年龄有关的把握为( )A.95% B.99% C.99.5% D.99.9%
5.下列关于回归分析与独立性检验的说法正确的是 ( )A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系解析:由回归分析及独立性检验的特点知,选项C正确.
6.独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量χ2.如果χ2较大,那么在一定程度上说明假设________.解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量χ2来判断假设是否成立.
7.博鳌亚洲论坛2018年年会于4月8日至11日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与会俄语”的2×2列联表中,a-b+d=________.
解析:由2×2列联表的性质,可得:a=18-6=12,b=20-12=8,6+d=30-20,可得d=4,所以a-b+d=8.
8.用两种检验方法对某食品做沙门氏菌检验,结果如下表:
(1)利用等高堆积条形图判断采用荧光抗体法与检验结果呈阳性是否有关系;解:作出等高堆积条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.
(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?
9.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c=( )A.3 B.4 C.5 D.6
解析:列2×2列联表如下:
10. 某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩的平均分(采用百分制),剔除平均分在30分以下的学生后,共有男生300名,女生200名.现采用分层随机抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;
(2)规定80分以上为优秀(含80分),请你根据已知条件补全2×2列联表,并判断是否在犯错误的概率不超过0.1的前提下认为数学成绩与性别有关.
解:由频数分布表可知,在抽取的100名学生中,“男生组”中数学成绩优秀的有15人,“女生组”中数学成绩优秀的有15人,据此可得2×2列联表如下:
11.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:
(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?
根据小概率值α=0.1的χ2独立性检验,没有充足的理由认为反感“中国式过马路”与性别有关.
(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X,求X的分布列和均值.
解:X的可能取值为0,1,2,
相关课件
这是一份高中数学8.3 分类变量与列联表教学ppt课件,共21页。PPT课件主要包含了独立性检验及其应用等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表多媒体教学ppt课件,共39页。PPT课件主要包含了目录索引,探究点一独立性检验,本节要点归纳等内容,欢迎下载使用。
这是一份高中人教A版 (2019)8.3 分类变量与列联表完整版ppt课件,共33页。PPT课件主要包含了学习目标,2×2列联表,常考题型等内容,欢迎下载使用。