数学第一章 统计案例1.2独立性检验的基本思想及其初步应用说课课件ppt
展开【阅读教材】 根据下面的知识结构图阅读教材,了解独立性检验的基本步骤及基本思想.
【知识链接】1.散点图散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系.2.用样本估计总体的两种情况(1)用样本的频率分布估计总体分布.(2)用样本的数字特征估计总体数字特征.
主题一:列联表与等高条形图【自主认知】1.某班主任对全班50名学生作了一次调查,所得数据如表:
喜欢玩电脑游戏的学生中认为作业多的所占的比例是多少?不喜欢玩电脑游戏的学生中认为作业多的呢?提示:喜欢玩电脑游戏的学生中认为作业多的所占的比例是 ,不喜欢玩电脑游戏的学生中认为作业多的所占的比例是 .
2.某校对学生课外活动(文娱和体育)进行调查,结果整理成下图(两个深色条的高分别表示男生与女生样本中喜欢文娱的学生的频率):
喜欢文娱的学生中是男生还是女生所占的比例多?提示:女生.
根据以上探究,完成以下填空.1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的_________,这样的变量称为分类变量.
(2)列联表:①列出的_____分类变量的_______,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
2.等高条形图直观性:与表格相比,等高条形图更能直观地反映出两个分类变量间是否_________.用途:(1)常用等高条形图展示列联表数据的_________.(2)判断两个分类变量之间有关系可以通过观察等高条形图相差很大的两个量是_____和_____.
【合作探究】1.分类变量的值就是指的一些具体实数吗?提示:这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等.
2.等高条形图与列联表相比有何优点?提示:更直观,更明了.3.利用等高条形图能否精确地判断两个分类变量是否有关系?为什么?提示:不能,因为通过等高条形图,可以粗略地判断两个分类变量是否有关系,但这种判断无法精确地给出所得结论的可靠程度.
【过关小练】1.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
【解析】选D.在四幅图中,D图中两个阴影的高相差最明显,说明两个分类变量之间关系最强.
2.对两个分类变量进行独立性检验的主要作用是 ( )A.判断模型的拟合效果B.对两个变量进行相关分析C.给出两个分类变量有关系的可靠程度D.估计预报变量的平均值【解析】选C.独立性检验的目的就是明确两个分类变量有关系的可靠程度.
主题二:独立性检验的基本思想【自主认知】1.列联表中|ad-bc|的值与两个分类变量之间相关的强弱有什么关系?提示:在列联表中,若两个分类变量没有关系,则|ad-bc|≈0,所以|ad-bc|的值越小,两个分类变量之间的关系越弱;|ad-bc|的值越大,两个分类变量之间的关系越强.
2.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K2≥6.635)≈0.01的含义是什么?提示:P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关.
根据以上探究,完成以下填空.独立性检验的基本思想(1)定义:利用_________K2来判断“两个分类变量_______”的方法称为独立性检验.(2)公式:K2= ,其中n=a+b+c+d.
(3)独立性检验的具体步骤:①定上界:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定________.②计算:利用公式计算随机变量K2的________.③下结论:如果_____,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在_____________不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_________________支持结论“X与Y有关系”.
【合作探究】根据下表数据,回答下列问题:
(1)在判断变量是否有关系时,若K2的观测值k=7.123,则判断两变量有关系犯错误的概率不超过 .提示:由表格可知P(K2≥6.635)≈0.010,而k=7.123>6.635,故应填0.010.答案:0.010
(2)若求得K2的观测值k=0.70,则由表格数据可知,两变量之间的关系应该表述为 .提示:由于P(K2≥0.455)≈0.50,故由相关性可知,没有足够证据说明两变量有关系.答案:没有足够证据说明两变量有关系
(3)若求得K2的观测值k=56.35,则在说明两变量有关系时应用表格中k0的值为 .提示:由于k的数据比较大,故应利用P(K2≥10.828)≈0.001中的k0=10.828这一数据.答案:10.828
【过关小练】1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是 ( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有
【解析】选D.独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.
2.有两个分类变量X与Y的一组数据,由其列联表计算得k≈4.523,则认为“X与Y有关系”犯错误的概率为 ( )A.95% B.90%C.5% D.10%【解析】选C.P(K2≥3.841)≈0.05,而k≈4.523>3.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.
【归纳总结】分类变量的概念及等高条形图的三个关注点(1)分类变量的取值特点:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等.(2)分类变量的表示:分类变量的不同取值可以用数字来表示,这时的数字没有其他的含义,不同值之间的大小没有意义.(3)分类变量的图示:作图应注意单位统一,图形准确,但它不能给出两个分类变量有关或无关的精确的可信程度.
【拓展延伸】假设检验的思想与反证法的关系
类型一:列联表与等高条形图【典例1】(2015·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
【解题指南】先作出2×2列联表,再根据列联表数据作等高条形图,最后对比乘积的差距判断两个分类变量是否有关.
【解析】作列联表如下:
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.
【规律总结】1.利用等高条形图判断两个分类变量是否相关的步骤
2.直观判断两个分类变量是否有关的思路(1)利用列联表直接计算ad-bc,如果两者相差很大,就判断两个分类变量之间有关系.(2)在等高线条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
【巩固训练】为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无相关关系?
【解析】根据列联表作出等高条形图(如图).由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.
【补偿训练】在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A.男、女患色盲的频率分别为0.038,0.006B.男、女患色盲的概率分别为C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关
【解析】选C.男人中患色盲的比例为 要比女人中患色盲的比例 大,其差值为 ≈0.0676,差值较大.
类型二:独立性检验【典例2】在对人们休闲方式的一次调查中,共调查120人,其中女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表.(2)休闲方式与性别是否有关?【解题指南】(1)利用题目中所给的数据列表.(2)利用公式求出K2的观测值k的值.再利用临界值的大小来判断.
【解析】(1)2×2的列联表为
(2)计算K2的观测值为k= ≈3.429.而2.706<3.429<3.841,因为P(K2>2.706)≈0.10,P(K2>3.841)≈0.05,所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.
【延伸探究】本题条件不变的情况下,画出等高条形图.【解析】
【规律总结】解决一般的独立性检验问题的三个步骤(1)通过所给列联表确定a,b,c,d,n的值.(2)利用K2= 求随机变量K2的观测值.(3)将所得K2的观测值与相关临界值比较,得出两个变量是否有关系的结论.
【巩固训练】(2015·昆明高二检测)国家虽然出台了多次限购令,但各地房地产市场依然热火朝天,主要是利益的驱使,有些开发商不遵守职业道德,违规使用未经淡化海砂;为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了如下的2×2列联表:
补充完整表中的数据:利用独立性检验的方法判断,能否在犯错误的概率不超过0.01的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?
【解析】列联表如表所示:
假设:是否使用淡化海砂与混凝土耐久性是否达标无关,由已知数据可求得:k= =7.5>6.635,因此,能在犯错误的概率不超过0.01的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.
【补偿训练】在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?
【解析】根据题意,列出2×2列联表如下:
假如在天气恶劣的飞行航程中,男乘客不比女乘客更容易晕机.由公式可得K2的观测值k= ≈3.689>2.706,故能在犯错误的概率不超过0.1的前提下,认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”.
类型三:独立性检验的综合应用【典例3】(2015·吉林高二检测)某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了若干名学生的体检表,并得到如下直方图:
(1)若直方图中前三组的频率成等比数列,后四组的频率成等差数列,试估计全年级视力在5.0以下的人数.(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次在1~50名和951~1000名的学生进行了调查,得到如下数据:
根据表中的数据,能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系?附:K2=
【解题指南】(1)利用直方图中前三组的频率成等比数列,后四组的频率成等差数列,求出视力在5.0以下的频率,即可估计全年级视力在5.0以下的人数.(2)求出K2,与临界值比较,即可得出结论.
【解析】(1)设各组的频率为fi(i=1,2,3,4,5,6),依题意,前三组的频率成等比数列,后四组的频率成等差数列,故f1=0.15×0.2=0.03,f2=0.45×0.2=0.09,f3= =0.27,所以由 =1-(0.03+0.09),得f6=0.17,所以视力在5.0以下的频率为1-0.17=0.83,故全年级视力在5.0以下的人数约为1000×0.83=830.
(2)k= ≈4.110>3.841,因此能在犯错误的概率不超过0.05的前提下认为视力与学习成绩有关系.
【规律总结】判定事件A与B是否有关问题的具体步骤(1)采集样本数据,列出2×2列联表.(2)由K2= 计算K2的观测值.(3)统计推断,根据临界值表下结论.
【巩固训练】为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在现场时,990件产品中有合格品982件,次品8件;甲不在现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条形图、独立性检验的方法分析质量监督员甲对产品质量好坏有无影响,能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?
【解析】(1)2×2列联表如下:
由列联表可得|ad-bc|=|982×17-493×8|=12750.这个数值较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(2)画等高条形图.如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(3)由2×2列联表中数据,计算得到K2的观测值为k= ≈13.097>10.828,因此,在犯错误的概率不超过0.001的前提下,认为质量监督员甲在不在生产现场与产品质量有关系.
【补偿训练】两分类变量M和N的取值分别为{m1,m2}和{n1,n2},在一次独立性检验中,得出列联表如下:
最后发现,两个分类变量M和N没有任何关系,则a的可能值是( )A.200 B.720 C.100 D.180
【解析】选B.计算K2的观测值k=当a=200时,k=≈103.37>3.841,此时两个分类变量M和N有关系;当a=720时,知此时两个分类变量M和N没有关系,则a的可能值是720.
高中人教版新课标A第二章 推理与证明2.1合情推理与演绎推理多媒体教学课件ppt: 这是一份高中人教版新课标A第二章 推理与证明2.1合情推理与演绎推理多媒体教学课件ppt,共60页。PPT课件主要包含了一般性,特殊情况下,逻辑推理,一般原理,特殊情况等内容,欢迎下载使用。
数学选修1-21.2独立性检验的基本思想及其初步应用图文ppt课件: 这是一份数学选修1-21.2独立性检验的基本思想及其初步应用图文ppt课件,共39页。PPT课件主要包含了分类变量,54%,28%,患肺癌比例,不患肺癌比例,等高条形图,引入一个随机变量,通过公式计算,独立性检验的定义,独立性检验的一般步骤等内容,欢迎下载使用。
人教版新课标A选修1-21.2独立性检验的基本思想及其初步应用评课ppt课件: 这是一份人教版新课标A选修1-21.2独立性检验的基本思想及其初步应用评课ppt课件,共56页。PPT课件主要包含了不同类别,频数表,相互影响,频率特征,独立性检验,a+b+c+d,临界值k0,观测值k,k≥k0,犯错误的概率等内容,欢迎下载使用。