高中数学人教B版 (2019)选择性必修 第二册4.3.2 独立性检验图文ppt课件
展开4.3.2 独立性检验
学 习 任 务 | 核 心 素 养 |
1.通过实例,理解2×2列联表的统计意义.(重点) 2.通过实例,了解2×2列联表独立性检验及其应用.(难点) | 1.通过2×2列联表统计意义的学习,体会数学抽象的素养. 2.借助χ2计算公式进行独立性检验,培养数学运算和数据分析的素养. |
一则“双黄连口服液可抑制新冠病毒”消息热传后,引起部分市民抢购.人民日报官微称,抑制不等于预防和治疗,勿自行服用.上海专家称是否有效还在研究中.
问题:如何判断其有效?如何收集数据?收集哪些数据?
[提示] 略.
知识点1 2×2列联表
(1)定义:如果随机事件A与B的样本数据整理成如下的表格形式.
| A | 总计 | |
B | a | b | a+b |
c | d | c+d | |
总计 | a+c | b+d | a+b+c+d |
因为这个表格中,核心数据是中间4个格子,所以这样的表格通常称为2×2列联表.
(2)χ2计算公式:χ2=,其中n=a+b+c+d.
拓展:列联表的统计意义
记n=a+b+c+d,则由上表可知:
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
其他事件的概率类似可求.
1.下面是2×2列联表.
| y1 | y2 | 总计 |
x1 | a | 21 | 73 |
x2 | 2 | 25 | 27 |
总计 | b | 46 | 100 |
则表中a=________,b=________.
52 54 [a=73-21=52,b=a+2=52+2=54.]
知识点2 独立性检验
任意给定一个α(称为显著性水平,通常取为0.05,0.01等),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数),就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,就称不能得到前述结论.这一过程通常称为独立性检验.
提醒:(1)χ2<k的统计意义
A与B独立时,也称为A与B无关.当χ2<k成立时,一般不直接说A与B无关.也就是说,独立性检验通常得到的结果,或者是有1-α的把握认为A与B有关,或者没有1-α的把握认为A与B有关.
(2)常用的显著性水平α以及对应的分位数k对照表
α=P(χ2≥k) | 0.1 | 0.05 | 0.01 | 0.005 | 0.001 |
k | 2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
2.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”( )
A.χ2=2.700 B.χ2=2.710
C.χ2=3.765 D.χ2=5.014
D [∵5.014>3.841,故D正确.]
3.若由一个2×2列联表中的数据计算得χ2=4.013,那么在犯错误的概率不超过__________的前提下认为两个变量之间有关系.
5% [查阅χ2表知有95%的把握认为两个变量之间有关系,故在犯错误的概率不超过5%的前提下,认为两个变量之间有关系.]
类型1 由χ2进行独立性检验
【例1】 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.
| 未感冒 | 感冒 | 总计 |
使用血清 | 258 | 242 | 500 |
未使用血清 | 216 | 284 | 500 |
总计 | 474 | 526 | 1 000 |
[思路点拨] 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.
[解] 假设感冒与是否使用该种血清没有关系.
由列联表中的数据,求得
χ2=≈7.075.
χ2=7.075>6.635,P(χ2≥6.635)=0.01,
故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.
独立性检验的具体做法
1.根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值k.
2.利用公式χ2=计算随机变量χ2.
3.如果χ2≥k推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
1.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:
| 患胃病 | 未患胃病 | 总计 |
生活不规律 | 60 | 260 | 320 |
生活有规律 | 20 | 200 | 220 |
总计 | 80 | 460 | 540 |
根据以上数据,能否有99%的把握判断40岁以上的人患胃病与生活规律有关?
[解] 由公式得χ2=≈9.638.
∵9.638>6.635,
∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.
类型2 独立性检验的综合应用
1.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?
[提示] 利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.
2.在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)=0.01和P(χ2≥7.879)=0.005,哪种说法是正确的?
[提示] 两种说法均正确.P(χ2≥6.635)=0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)=0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.
【例2】 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
| 喜爱打篮球 | 不喜爱打篮球 | 总计 |
男生 |
| 6 |
|
女生 | 10 |
|
|
总计 |
|
| 48 |
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整(不用写计算过程);
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
[思路点拨] (1)由古典概型的概率求得2×2列联表.
(2)计算χ2,判断P(χ2>3.841)=0.05是否成立.
(3)结合超几何分布求解.
[解] (1)列联表补充如下:
| 喜爱打篮球 | 不喜爱打篮球 | 总计 |
男生 | 22 | 6 | 28 |
女生 | 10 | 10 | 20 |
总计 | 32 | 16 | 48 |
(2)由χ2=≈4.286.
因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X | 0 | 1 | 2 |
P |
X的均值为E(X)=0++=1.
1.检验两个变量是否相互独立,主要依据是计算χ2的值,再利用该值与分位数k进行比较作出判断.
2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.
3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.
2.2020年寒假,因为“新冠”疫情全体学生只能在家进行网上学习,为了研究学生网上学习的情况,某学校随机抽取100名学生对线上教学进行调查,其中男生与女生的人数之比为9∶11,抽取的学生中有30名男生对线上教学满意,有10名女生对线上教学不满意.
(1)完成2×2列联表,并回答能否有90%的把握认为对线上教学是否满意与性别有关;
| 满意 | 不满意 | 总计 |
男生 |
|
|
|
女生 |
|
|
|
总计 |
|
| 100 |
(2)从被调查的对线上教学满意的学生中,利用分层抽样抽取5名学生,再在这5名学生中抽取2名学生,作线上学习的经验介绍,求恰好抽到1名男生与1名女生的概率.
[解] (1)
| 满意 | 不满意 | 总计 |
男生 | 30 | 15 | 45 |
女生 | 45 | 10 | 55 |
总计 | 75 | 25 | 100 |
χ2=≈3.030.
查表可得P(χ2≥2.706)=0.1,由于3.030>2.706,
故有90%的把握认为对线上教学是否满意与性别有关.
(2)由题可知,从被调查的对线上教学满意的学生中,利用分层抽样抽取5名学生,其中女生3名,男生2名.从这5名学生中抽取2名学生的情况有C种,其中抽取一名男生与一名女生的情况有CC种,故从这5名学生中恰好抽到1名男生与1名女生的概率为=.
1.随机调查某校110名学生是否喜欢跳舞,由公式χ2=(其中n=a+b+c+d)计算出χ2的值,并由此得出结论:有99%的把握认为学生是否喜欢跳舞与性别有关,则χ2可以为( )
P(χ2≥k) | 0.10 | 0.05 | 0.025 | 0.010 |
k | 2.706 | 3.841 | 5.024 | 6.635 |
A.3.565 B.4.204
C.5.233 D.6.842
D [因为有99%的把握认为学生是否喜欢跳舞与性别有关,所以χ2>6.635,故选D.]
2.利用独立性检验来考查两个变量A,B是否有关系,当随机变量χ2的值( )
A.越大,“A与B有关系”成立的可能性越大
B.越大,“A与B有关系”成立的可能性越小
C.越小,“A与B有关系”成立的可能性越大
D.与“A与B有关系”成立的可能性无关
A [用独立性检验来考查两个分类是否有关系时,算出的随机变量χ2的值越大,说明“A与B有关系”成立的可能性越大,由此可知A正确.故选A.]
3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
| 男 | 女 | 总计 |
爱好 | 40 | 20 | 60 |
不爱好 | 20 | 30 | 50 |
总计 | 60 | 50 | 110 |
经计算得
χ2=≈7.8.
则正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
C [根据独立性检验的思想方法,正确选项为C.]
4.在一个2×2列联表中,由其数据计算得χ2=13.097,认为“两个变量有关系”犯错误的概率不超过________.
0.001 [如果χ2>10.828时,认为“两变量有关系”犯错误的概率不超过0.001.]
5.博鳌亚洲论坛2021年年会于4月18日至21日在海南博鳌镇举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在下面“性别与会俄语”的2×2列联表中,a-b+d=________.
| 会俄语 | 不会俄语 | 总计 |
男 | a | b | 20 |
女 | 6 | d |
|
总计 | 18 |
| 50 |
28 [由题得解得所以a-b+d=28.]
回顾本节内容,自我完成以下问题:
1.2×2列联表的用途是什么?由样本得到的P(A),P(B),P(AB)来判断事件A与B的独立性是否合理?
[提示] (1)2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系.
(2)因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用P(AB)=P(A)P(B)是否成立来判断A与B是否独立是不合理的.
2.解决独立性检验问题的基本步骤是什么?
[提示]
人教B版 (2019)选择性必修 第二册4.3.2 独立性检验集体备课课件ppt: 这是一份人教B版 (2019)选择性必修 第二册4.3.2 独立性检验集体备课课件ppt,共35页。PPT课件主要包含了目录索引,参考数据,答案AB等内容,欢迎下载使用。
人教B版 (2019)选择性必修 第二册4.3.2 独立性检验教课内容课件ppt: 这是一份人教B版 (2019)选择性必修 第二册4.3.2 独立性检验教课内容课件ppt,文件包含人教B版高中数学选择性必修第二册432《独立性检验》课件ppt、人教B版高中数学选择性必修第二册432《独立性检验》教案doc等2份课件配套教学资源,其中PPT共47页, 欢迎下载使用。
高中数学人教B版 (2019)选择性必修 第二册4.3.2 独立性检验课堂教学ppt课件: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.2 独立性检验课堂教学ppt课件,共31页。PPT课件主要包含了学习目标,知识梳理·自主探究,师生互动·合作探究,知识探究,探究点一,独立性检验,方法总结,探究点二,当堂检测等内容,欢迎下载使用。