备战2024年高考数学大一轮复习(人教A版-理)第十一章 §11.5 列联表与独立性检验
展开
这是一份备战2024年高考数学大一轮复习(人教A版-理)第十一章 §11.5 列联表与独立性检验,共17页。试卷主要包含了635)=0,003 7 D.2,5+3+4+4,17,,024等内容,欢迎下载使用。
§11.5 列联表与独立性检验
考试要求 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.
知识梳理
1.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.列联表:列出的两个分类变量的频数表,称为列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
3.独立性检验:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)2×2列联表中的数据是两个分类变量的频数.( √ )
(2)两个分类变量的独立性检验无关,即两个分类变量互不影响.( × )
(3)K2的大小是判断两个分类变量是否相关的统计量.( √ )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间的关系越强.( × )
教材改编题
1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,下列最适合的统计方法是( )
A.均值 B.方差
C.独立性检验 D.回归分析
答案 C
解析 由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.
2.如表是2×2列联表,则表中a,b的值分别为( )
y1
y2
总计
x1
a
8
35
x2
11
34
45
总计
b
42
80
A.27,38 B.28,38
C.27,37 D.28,37
答案 A
解析 a=35-8=27,b=a+11=27+11=38.
3.已知P(K2≥6.635)=0.01,P(K2≥10.828)=0.001.在检验喜欢某项体育运动是否与性别有关的过程中,某研究员搜集数据并计算得到K2=7.235,则有________的把握认为喜欢该项体育运动与性别有关.
答案 99%
解析 因为6.63510.828,
∴根据临界值表可知有99.9%的把握认为“数学成绩达标”与“运动达标”有关.
思维升华 独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且K2的公式一般会在原题中给出.
跟踪训练3 某奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.
x(个)
2
3
4
5
6
y(十万元)
2.5
3
4
4.5
6
参考公式:=,=-;
K2=,n=a+b+c+d.
临界值表:
P(K2≥k0)
0.1
0.05
0.01
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
(1)该公司经过初步判断,可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;
(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,分店一每天的顾客平均为30人,其中5人会购买该品牌奶茶,分店二每天的顾客平均为80人,其中20人会购买该品牌奶茶.根据列联表判断是否有90%的把握认为顾客下单与分店所在地段有关.
解 (1)由题意可得,==4,
==4,
iyi=2×2.5+3×3+4×4+5×4.5+6×6=88.5,
=22+32+42+52+62=90,
设y关于x的线性回归方程为=x+,
则===0.85,
=-=4-0.85×4=0.6,
∴y关于x的线性回归方程为=0.85x+0.6.
(2)由题意可知2×2列联表如表所示:
不下单
下单
总计
分店一
25
5
30
分店二
60
20
80
总计
85
25
110
∴K2==≈0.8632.706,且2.97410.828,
所以根据独立性检验,有99.9%的把握认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是=,所以C错误.
7.如表是对于“喜欢运动与性别是否有关”的2×2列联表,依据表中的数据,得到K2≈________(结果保留到小数点后3位).
喜欢运动
不喜欢运动
总计
男
40
28
68
女
5
12
17
总计
45
40
85
答案 4.722
解析 K2=≈4.722.
8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
则K2≈________(精确到小数点后三位),依据独立性检验________95%的把握认为注意力的稳定性与性别有关.(选填“有”或“没有”)
参考数据:
P(K2≥k0)
0.1
0.05
0.01
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
答案 0.538 没有
解析 由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,
根据K2=,
计算可知
K2=
≈0.5386.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
10.某花圃为提高某品种花苗质量,开展技术创新活动,某研究所在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取花苗各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80 及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中位数;
(2)填写下面的2×2列联表,并根据独立性检验,判断能否有99.9%的把握认为优质花苗与培育方法有关,请说明理由.
优质花苗
非优质花苗
总计
甲培育法
20
乙培育法
10
总计
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.1
0.05
0.01
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
解 (1)由频率分布直方图的性质可知,0.005×10+0.010×10+0.025×10+10a+0.020×10=1,
解得a=0.040,
因为(0.005+0.010+0.025)×10=0.40.5,
所以中位数位于[80,90)内,
设中位数为x,则有0.4+0.040×(x-80)=0.5,解得x=82.5.
故综合评分的中位数为82.5.
(2)由(1)得优质花苗的频率为0.6,
所以样本中优质花苗的数量为60,
2×2列联表如下:
优质花苗
非优质花苗
总计
甲培育法
20
30
50
乙培育法
40
10
50
总计
60
40
100
K2=≈16.667>10.828,
所以根据独立性检验,有99.9%的把握认为优质花苗与培育方法有关.
11.某中学共有1 000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:每周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图所示.已知在样本中,有40位女生每周平均体育锻炼的时间超过4小时,根据独立性检验原理,下列说法正确的是( )
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.10
0.05
0.01
0.005
k0
2.706
3.841
6.635
7.879
A.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”
B.有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”
C.有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”
D.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”
答案 B
解析 由频率分布直方图可知, 每周平均体育锻炼时间不少于4小时的频率为2×(0.15+0.125+0.075+0.025)=0.75,故经常进行体育锻炼的学生有200×0.75=150(人).又其中有40位女生每周平均体育锻炼的时间超过4小时,故有150-40=110(位)男生经常锻炼.根据分层抽样的方法可知,样本中男生的人数为×200=140,女生的人数为×200=60.列出2×2列联表有:
男生
女生
总计
经常锻炼
110
40
150
不经常锻炼
30
20
50
总计
140
60
200
故K2=≈3.17,
因为2.706
相关试卷
这是一份2024年数学高考大一轮复习第十一章 §11.5 列联表与独立性检验,共7页。
这是一份2024年数学高考大一轮复习第十章 §10.5 列联表与独立性检验(附答单独案解析),共7页。
这是一份2024年数学高考大一轮复习第十章 §10.5 列联表与独立性检验(附答单独案解析),共8页。试卷主要包含了635)=0,003 7 D.2,706,841,879等内容,欢迎下载使用。