高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系同步练习题
展开1.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为
对同一样本,以下数据能说明X与Y有关的可能性最大的一组为( )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=3,b=2,c=4,d=5
2.下面是一个2×2列联表:
则表中a、b处的值分别为( )
A.94,96B.52,50
C.52,54D.54,52
3.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
4.利用独立性检验对两个分类变量是否有关系进行研究时,若犯错误的概率不超过0.5%,认为事件A和事件B有关系,则具体计算出的数据应该是( )
A.χ2≥6.635B.χ2<6.635
C.χ2≥7.879D.χ2<7.879
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( )
A.0.01B.0.005
C.0.025D.0.001
6.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )
A.3B.4
C.5D.6
附:
7.某高校有10000名学生,其中女生3000名,男生7000名,为调查爱好体育运动是否与性别有关,用分层抽样的方法抽取120名学生,制成独立性检验的2×2列联表如表,则a-b=________.(用数字作答)
8.某学校为了采取治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:
则在犯错误的概率不超过________的前提下认为“是否同意限定区域停车与家长的性别有关”.
9.2020年1月22日,国新办发布消息:新型冠状病毒来源于武汉一家海鲜市场非法销售的野生动物.专家通过全基因组比对发现此病毒与2003年的非典冠状病毒以及此后的中东呼吸综合征冠状病毒,分别达到70%和40%的序列相似性.这种新型冠状病毒对人们的健康生命带来了严重威胁,因此,某生物疫苗研究所加紧对新型冠状病毒疫苗进行实验,并将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如表:
现从所有试验小白鼠中任取一只,取到“注射疫苗”小白鼠的概率为eq \f(2,5).
(1)求2×2列联表中的数据x,y,A,B的值;
(2)能否推断注射此种疫苗对预防新型冠状病毒有关?
附:χ2=eq \f(n(ad-bc)2,(a+b)(a+c)(c+d)(b+d)),n=a+b+c+d.
10.某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(己知本次测试合格线是50分,两校合格率均为100%)
甲校高二年级数学成绩:
乙校高二年级数学成绩:
(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分).
(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异?”
[提能力]
11.(多选题)某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表
经计算得χ2=eq \f(100×(35×28-15×22)2,50×50×57×43)≈6.895.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是( )
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
12.(多选题)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男生人数相同,并绘制如图等高条形图,则( )
参考公式:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),n=a+b+c+d.
A.参与调查的学生中喜欢攀岩的男女生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男女生人数均为100人,则在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关
D.无论参与调查的男女生人数为多少,都在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关
13.某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为是否持乐观态度与国内外差异有关.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
14.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
设H:服用此药的效果与患者的性别无关,则χ2≈________(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的概率为________.
15.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
[战疑难]
16.某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分优秀哪个关系较大?
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.
课时作业(十六)
1.解析:对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于A,B,C都有|ad-bc|=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然7>2.故选D.
答案:D
2.解析:由 eq \b\lc\{(\a\vs4\al\c1(a+21=73,a+2=b)) 得 eq \b\lc\{(\a\vs4\al\c1(a=52,b=54)) .故选C.
答案:C
3.解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.故选D.
答案:D
4.解析:根据小概率值和相应的临界值可知犯错误的概率为0.5%,对应的xα=7.879,由独立性检验的思想可知应为χ2≥7.879.故选C.
答案:C
5.解析:由公式得χ2= eq \f(50×(18×15-8×9)2,26×24×27×23) ≈5.059>5.024=x0.025,∴犯错误的概率不超过0.025,故选C.
答案:C
6.解析:列2×2列联表如下:
χ2= eq \f(66×[10(35-c)-21c]2,31×35×(10+c)(56-c)) ≥5.024.
把选项A,B,C,D代入验证可知选A.
答案:A
7.解析:根据分层抽样原理,计算抽取男生120× eq \f(7 000,10 000) =84(人),
女生120× eq \f(3 000,10 000) =36(人),
所以a=84-28=56(人),
b=36-9=27(人),
所以a-b=56-27=29(人).
答案:29
8.解析:经计算得χ2= eq \f(50×(20×15-5×10)2,25×25×30×20) ≈8.333>7.879=x0.005,
所以在犯错误的概率不超过0.005的前提下认为“是否同意限定区域停车与家长的性别有关”.
答案:0.005
9.解析:(1)由已知条件可知:
B= eq \f(2,5) ×100=40,A=100-B=60,
x=60-20=40,y=40-30=10.
故x=40,y=10,A=60,B=40.
(2)零假设H0:注射此种疫苗对预防新型冠状病毒无关,
根据列联表中的数据,得χ2= eq \f(100×(20×10-30×40)2,50×50×60×40) ≈16.667>10.828=x0.001,
根据小概率值α=0.001的独立性检验,推断H0不成立,即推断注射此种疫苗对预防新型冠状病毒有关.
10.解析:(1)依题意知甲校应抽取110人,乙校应抽取90人,∴x=10,y=15,
估计两个学校的平均分,甲校的平均分为
eq \f(55×10+65×25+75×35+85×30+95×10,110) ≈75.
乙校的平均分为
eq \f(55×15+65×30+75×25+85×15+95×5,90) ≈71.
(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表
χ2= eq \f(200(40×70-20×70)2,60×140×110×90) ≈4.174>3.841=x0.05
故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.
11.解析:χ2≈6.895>6.635=x0.010,A对,B错;男生的标准差为4,女生的标准差为3,C错,D对.故选AD.
答案:AD
12.解析:对于选项A:因为参加调查的男女生人数相同,而男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,所以选项A正确;对于选项B:参与调查的女生中喜欢攀岩的人数占30%,不喜欢攀岩的人数占70%,所以参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,所以选项B错误;对于选项C:若参与调查的男女生人数均为100人,根据图表,列出2×2列联表如下:
∴χ2= eq \f(200×(80×70-20×30)2,110×90×100×100) = eq \f(1 000,99) ≈10.101>6.635=x0.01,
∴在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关,C正确;对于选项D:如果不确定参与调查的男女生人数,无法计算χ2,D错误.故选AC.
答案:AC
13.解析:根据题目所给数据得到如下2×2的列联表:
则χ2= eq \f(200×(60×60-40×40)2,100×100×100×100) =8>6.635=x0.01
所以能在犯错误的概率不超过0.01的前提下认为是否持乐观态度与国内外差异有关.
答案:能
14.解析:由公式计算得χ2≈4.882>3.841=x0.05,
所以在犯错误的概率不超过0.05的前提下认为服用此药的效果与患者的性别有关.
答案:4.882 0.05
15.解析:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:
(2)一天中到该公园锻炼的平均人次的估计值为
eq \f(1,100) (100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表:
根据列联表得
χ2= eq \f(100×(33×8-22×37)2,55×45×70×30) ≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
16.解析:(1)数学与物理优秀与否的列联表如下:
根据列联表中数据,得
χ eq \\al(\s\up1(2),\s\d1(1)) = eq \f(1 240×(228×737-132×143)2,360×880×371×869) ≈270.114 3;
(2)数学与化学优秀与否的列联表如下:
根据列联表中数据,得
χ eq \\al(\s\up1(2),\s\d1(2)) = eq \f(1 240×(225×724-135×156)2,360×880×381×859) ≈240.611 2;
(3)数学与总分优秀与否的列联表如下:
根据列联表中数据,得
χ eq \\al(\s\up1(2),\s\d1(3)) = eq \f(1 240×(267×781-93×99)2,360×880×366×874) ≈486.122 5.
由于χ eq \\al(\s\up1(2),\s\d1(3)) >χ eq \\al(\s\up1(2),\s\d1(1)) >χ eq \\al(\s\up1(2),\s\d1(2)) >6.635,所以有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但是与总分优秀关系最大,与化学优秀关系最小.
Y
X
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
认为作业量大
认为作业量不大
合计
男生
18
9
27
女生
8
15
23
合计
26
24
50
α
0.05
0.025
xα
3.841
5.024
男
女
合计
爱好体育运动
a
9
?
不爱好体育运动
28
b
?
合计
?
?
120
同意限定区域停车
不同意限定区域停车
合计
男
20
5
25
女
10
15
25
合计
30
20
50
未感染病毒
感染病毒
合计
未注射疫苗
20
x
A
注射疫苗
30
y
B
合计
50
50
100
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
10
25
35
30
x
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
15
30
25
y
5
甲校
乙校
合计
优秀
非优秀
合计
男
女
合计
爱好拳击
35
22
57
不爱好拳击
15
28
43
合计
50
50
100
α
0.50
0.05
0.010
0.005
0.001
xα
0.455
3.841
6.635
7.897
10.828
α
0.05
0.01
xα
3.841
6.635
α
0.050
0.010
0.005
0.001
xα
3.841
6.635
7.879
10.828
无效
有效
合计
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
人次≤400
人次>400
空气质量好
空气质量不好
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
物理优秀
化学优秀
总分优秀
数学优秀
228
225
267
数学非优秀
143
156
99
x1
x2
总计
y1
10
21
31
y2
c
d
35
总计
10+c
21+d
66
甲校
乙校
合计
优秀
40
20
60
非优秀
70
70
140
合计
110
90
200
喜欢
不喜欢
合计
男
80
20
100
女
30
70
100
合计
110
90
200
乐观
不乐观
合计
国内代表
60
40
100
国外代表
40
60
100
合计
100
100
200
空气质量等级
1
2
3
4
概率的估计值
0.43
0.27
0.21
0.09
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
物理优秀
物理非优秀
合计
数学优秀
228
132
360
数学非优秀
143
737
880
合计
371
869
1 240
化学优秀
化学非优秀
合计
数学优秀
225
135
360
数学非优秀
156
724
880
合计
381
859
1 240
总分优秀
总分非优秀
合计
数学优秀
267
93
360
数学非优秀
99
781
880
合计
366
874
1 240
高中人教A版 (2019)8.3 分类变量与列联表复习练习题: 这是一份高中人教A版 (2019)8.3 分类变量与列联表复习练习题,共11页。试卷主要包含了001的前提下,认为该疫苗有效等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精练: 这是一份人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表精练,共5页。试卷主要包含了多空题下面是一个2×2列联表,由a+15=b,得b=50等内容,欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表课时作业: 这是一份高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表课时作业,共7页。