人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系复习练习题
展开
这是一份人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系复习练习题,共20页。
第八章 成对数据的统计分析(B卷提高卷)
参考答案与试题解析
一.选择题(共8小题)
1.(2019•新疆模拟)对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
【解答】解:给出一组样本数据,总可以作出相应的散点图,故C正确,
但不一定能分析出两个变量的关系,故A不正确,
更不一定符合线性相关,不一定用一条直线近似的表示,故B不正确,
两个变量的统计数据不一定有函数关系,故D不正确.
故选:C.
2.(2020春•郑州期末)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程x必过样本中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数为r=﹣0.9362,则变量y和x之间具有线性相关关系
【解答】解:样本中心点在直线上,故A正确,
残差平方和越小的模型,拟合效果越好,故B正确,
R2越大拟合效果越好,故C不正确,
当r的值大于0.75时,表示两个变量具有线性相关关系,
故选:C.
3.(2020•2月份模拟)已知变量x,y的关系可以用模型y=cekx拟合,设z=lny,其变换后得到一组数据下:
x
16
17
18
19
z
50
34
41
31
由上表可得线性回归方程,则c=( )
A.﹣4 B.e﹣4 C.109 D.e109
【解答】解:17.5,39.
代入,得39=﹣4,则.
∴,
由y=cekx,得lny=ln(cekx)=lnc+lnekx=lnc+kx,
令z=lny,则z=lnc+kx,∴lnc=109,则c=e109.
故选:D.
4.(2020•泉州模拟)如图是某地区2010年至2019年污染天数y(单位:天)与年份x的折线图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型b1x+a1,,则( )
A.b1<b2<b3,a1<a2<a3 B.b1<b3<b2,a1<a3<a2
C.b2<b3<b1,a1<a3<a2 D.b2<b3<b1,a3<a2<a1
【解答】解:不妨设l1:b1x+a1,l2:,l3:,
由线性回归方程恒过样本点的中心,可知三条回归直线方程的大致形状如图:
由图可知,b2<b3<b1,a1<a3<a2.
故选:C.
5.(2020•金安区校级模拟)某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如表:
xi
0.04
1
4.84
10.24
yi
1.1
2.1
2.3
3.3
4.2
若依据表中数据画出散点图,则样本点(xi,yi)(i=1,2,3,4,5)都在曲线附近波动.但由于某种原因表中一个x值被污损,将方程作为回归方程,则根据回归方程和表中数据可求得被污损数据为( )
A.﹣4.32 B.1.69 C.1.96 D.4.32
【解答】解:设缺失的数据为x,(i=1,2,3,4,5),则样本(mi,yi)的数据如下表所示:
mi
0.2
1
2.2
3.2
yi
1.1
2.1
2.3
3.3
4.2
其回归直线方程为,由表中数据额可得,,
由线性回归方程,得1.6,
即,解得x=1.96.
故选:C.
6.(2019•湛江二模)有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:
男
女
合计
无
40
35
75
有
15
10
25
合计
55
45
100
附:K2
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
据此表,可得( )
A.认为机动车驾驶技术与性别有关的可靠性不足50%
B.认为机动车驾驶技术与性别有关的可靠性超过50%
C.认为机动车驾驶技术与性别有关的可靠性不足60%
D.认为机动车驾驶技术与性别有关的可靠性超过60%
【解答】解:由表中数据,计算K20.3367<0.455,
∴认为机动车驾驶技术与性别有关的可靠性不足50%;
故选:A.
7.(2020•德州二模)某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理( )
附:,其中n=a+b+c+d.
P(K2≥k0)
0.10
0.05
0.01
0.005
k0
2.706
3.841
6.635
7.879
A.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”
B.有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”
C.有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”
D.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”
【解答】解:根据题意知,200位学生中男生有200140(人),
女生有60人,其中有40位女生的每周平均体育锻炼时间超过4小时,
由频率分布直方图知,男生每周平均体育锻炼时间超过4小时的人数是(1﹣0.025×2﹣0.100×2)×200﹣40=110,
由此填写列联表,如下;
性别/
平均锻炼时间t
男生
女生
总计
t≤4
30
20
50
t>4
110
40
150
总计
140
60
200
由表中数据,计算K23.175>2.706,
所以有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”.
故选:B.
8.(2019秋•高安市校级期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.若有95%的把握认为是否追星和性别有关,则男生至少有( )
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参考数据及公式如下:
K2
A.12 B.11 C.10 D.18
【解答】解:设男生人数为x,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
x
女生
总计
x
若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则K2>3.841,
由K23.841,解得x>10.24,
∵,都为整数,
∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,
则男生至少有12人.
故选:A.
二.多选题(共4小题)
9.(2020春•奎文区校级月考)已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的回归直线方程为1.5x+0.5,3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的回归方程为
C.去除后y的估计值增加速度变快
D.去除后,当x=4时,y的估计值为6.2
【解答】解:由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的回归直线方程为1.5x+0.5,3,所以1.5×3+0.5=5,
因为重新求得的回归直线l的斜率为1.2,是正相关,
设新的数据所有横坐标的平均值,则(n﹣2)n(1.2+4.8)=3n﹣6=3(n﹣2),故3,
纵坐标的平均数为,则(n﹣2)n(2.2+7.8)=n10=5n﹣10=5(n﹣2),5,
设新的线性回归方程为y=1.2x+b,把(3,5)代入5=1.2×3+b,b=1.4,
所以新的线性回归方程为y=1.2x+1.4.
所以A,B正确,
因为斜率为1.2<1.5,所以y的估计值增长速度变慢,C错误;
把x=4代入,得y=1.2×4+1.4=6.2,所以D正确.
故选:ABD.
10.(2020•烟台模拟)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男女生人数相同,并绘制如图等高条形图,则( )
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
参考公式:,n=a+b+c+d.
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男女生人数均为100人,则有99%的把握认为喜欢攀岩和性别有关
D.无论参与调查的男女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关
【解答】解:对于选项A:因为参加调查的男女生人数相同,而男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,所以选项A正确;
对于选项B:参与调查的女生中喜欢攀岩的人数占30%,不喜欢攀岩的人数占70%,所以参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多,所以选项B错误;
对于选项C:若参与调查的男女生人数均为100人,根据图表,列出2×2列联表如下:
喜欢
不喜欢
总计
男
80
20
100
女
30
70
100
总计
110
90
200
∴K210.101>6.635,
∴有99%的把握认为喜欢攀岩和性别有关,所以选项C正确;
对于选项D:如果不确定参与调查的男女生人数,无法计算是否有99%的把握认为喜欢攀岩和性别有关,所以选项D错误;
故选:AC.
11.(2020春•琼山区校级月考)已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的回归直线方程为1.5x+0.5,且3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的回归方程为1.2x+1.4
C.去除后y的估计值增加速度变快
D.去除后相应于样本点(2,3.75)的残差为0.05
【解答】解:3,代入1.5x+0.5,5,因为重新求得的回归直线l的斜率为1.2,故正相关,
设新的数据所以横坐标的平均值,则(n﹣2)n(1.2+4.8)=3n﹣6=3(n﹣2),故3,
纵坐标的平均数为,则(n﹣2)n(2.2+7.8)=n10=5n﹣10=5(n﹣2),5,
设新的线性回归方程为y=1.2x+b,把(3,2)代入5=1.2×3+b,b=1.4,
故新的线性回归方程为y=1.2x+1.4,
故A,B正确,
因为斜率为1.2不变,所以y的增长速度不变,C错误,
把x=2代入,y=3.8,3.75﹣3.8=﹣0.05,故D错误,
故选:AB.
12.(2020•山东模拟)某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表
男
女
合计
爱好拳击
35
22
57
不爱好拳击
15
28
43
合计
50
50
100
经计算得K2.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是( )
P(K2≥k)
0.50
0.05
0.010
0.005
0.001
k
0.455
3.841
6.635
7.897
10.828
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
【解答】解:K2≈6.895>6.635,A对,
显然B错,
男生标准差为4,C错,
显然D对,
故选:AD.
三.填空题(共4小题)
13.(2020•蚌埠三模)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则 能 (填“能”或“不能”)有99%以上的把握认为是否持乐观态度与国内外差异有关.
P(K2≥k)
0.050
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
附.
【解答】解:根据题目所给数据得到如下2×2的列联表:
乐观
不乐观
总计
国内代表
60
40
100
国外代表
40
60
100
总计
100
100
200
则K 的观测值:K28>6.635
所以有99%的把握认为认为是否持乐观态度与国内外差异有关,
故答案为:能.
14.(2020•宜昌模拟)某种品牌汽车的销量y(万辆)与投入宣传费用x(万元)之间具有线性相关关系,样本数据如表所示:
宣传费用x
3
4
5
6
销量y
2.5
3
4
4.5
经计算得回归直线方程的斜率为0.7,若投入宣传费用为8万元,则该品牌汽车销量的预报值为 5.95 万辆.
【解答】解:由题意可得4.5;
3.5;
回归直线方程的斜率为0.7,可得,
所以3.5,可得0.35,
回归直线方程为:,
投入宣传费用为8万元,则该品牌汽车销量的预报值为:0.7×8+0.35=5.95(万辆).
故答案为:5.95.
15.(2019秋•雅安期末)已知x,y的取值如表所示:从散点图分析,y与x线性相关,且,则 2.8 .
x
0
1
3
4
y
2.2
4.3
4.8
6.7
【解答】解:,,
∴样本点的中心的坐标为(2,4.5),
代入,得4.5=0.85,
解得.
故答案为:2.8.
16.(2019春•山西期中)已知一组数据的回归直线方程为,且,发现有两组数据(﹣1.7,2.9),(﹣2.3,5.1)的误差较大,去掉这两组数据后,重新求得回归直线方程为,则当x′=﹣3时, 5 .
【解答】解:由回归直线方程过样本中心点,可将代入,得,
所以原数据的样本中心点为(﹣2,4),
去掉两组数据(﹣1.7,2.9),(﹣2.3,5.1)后的新数据的,,
所以新数据的样本中心点为(﹣2,4),
因为新数据的回归直线方程为,将(﹣2,4)代入得,
所以,
当x'=﹣3时,.
故答案为:5.
四.解答题(共5小题)
17.(2020•南平三模)为了解高新产业园引进的甲公司前期的经营状况,市场研究人员对该公司2019年下半年连续六个月的利润进行了统计,统计数据列表如表:
月份
7月
8月
9月
10月
11月
12月
月份代码
1
2
3
4
5
6
月利润(万元)
110
130
160
150
200
210
(1)请用相关系数说明月利润y(单位:万元)与月份代码x之间的关系的强弱(结果保留两位小数),求y关于x的线性回归方程,并预测该公司2020年1月份的利润;
(2)甲公司新研制了一款产品,需要采购一批新型材料,已知生产新型材料的乙企业对A、B两种型号各100件新型材料进行模拟测试,统计两种新型材料使用寿命频数如表所示:
使用寿命
材料类型
1个月
2个月
3个月
4个月
总计
A
15
40
35
10
100
B
10
30
40
20
100
现有采购成本分别为10万元/件和12万元/件的A、B两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,不同类型的新型材料损坏的时间各不相同,经甲公司测算,平均每件新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每件新型材料的使用寿命都是整数月,且以频率估计每件新型材料使用寿命的概率,如果你是甲公司的负责人,以每件新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?
参考公式:相关系数;
回归直线方程为,其中,.
参考数据:,,,.
【解答】解:(1)由题意知,相关系数r0.96,
所以月利润y(单位:万元)与月份代码x之间的关系很强;
计算(1+2+3+4+5+6)=3.5,
(110+130+160+150+200+210)=160,
20,
160﹣20×3.5=90,
所以y关于x的线性回归方程是20x+90,
计算x=7时,20×7+90=230,
所以预测该公司2020年1月份的利润为230万元;
(2)由频率估计概率,每件A型新材料可使用1个月,2个月,3个月和4个月的概率分别为0.15,0.40,0.35和0.1,
所以每件A型新材料可产生的利润的平均值为(5﹣10)×0.15+(10﹣10)×0.40+(15﹣10)×0.35+(20﹣10)×0.1=2.9(万元),
每件B型新材料可使用1个月,2个月,3个月和4个月的概率分别为0.1,0.3,0.4和0.2,
所以每件B型新材料可产生的利润的平均值为(5﹣12)×0.1+(10﹣12)×0.3+(15﹣12)×0.4+(20﹣12)×0.2=1.5(万元),
由2.9>1.5,
所以应该采购A型新材料甲公司新型材料产生利润的期望值更高.
18.(2020•三模拟)2020年春节前后,一场突如其来的新冠肺炎疫情在武汉出现并很快地传染开来(已有证据表明2019年10月、11月国外已经存在新冠肺炎病毒),人传人,传播快,传播广,病亡率高,对人类生命形成巨大危害.在中华人民共和国,在中共中央、国务院强有力的组织领导下,全国人民万众一心抗击、防控新冠肺炎,疫情早在3月底已经得到了非常好的控制(累计病亡人数3869人).然而,国外因国家体制、思想观念与中国的不同,防控不力,新冠肺炎疫情越来越严重.据美国约翰斯•霍普金斯大学每日下午6时公布的统计数据,选取5月6日至5月10日的美国的新冠肺炎病亡人数如表(其中t表示时间变量,日期“5月6日”、“5月7日”对应于“t=6“、“t=7“,依次下去):
日期
5月6日
5月7日
5月8日
5月9日
5月10日
新冠肺炎累计病亡人数
72271
75477
76938
78498
80037
新冠肺炎累计病亡人数近似值
(对个位十位进行四舍五入)
72300
75500
76900
78500
80000
时间t
6
7
8
9
10
由如表求得累计病亡人数与时间的相关系数r=0.98.
(1)在5月6日~10日,美国新冠肺炎病亡人数与时间(日期)是否呈现线性相关性?
(2)选择对累计病亡人数四舍五入后个位、十位均为0的近似数,求每日累计病亡人数y随时间t变化的线性回归方程;
(3)请估计美国5月11日新冠肺炎病亡累计人数,请初步预测病亡人数达到9万的日期
附:回归方程中斜率和截距最小二乘估计公式分别为,.
【解答】解:(1)每日累计病亡人数与时间的相关系数r≈0.98>0.7,
(建议r≈0.98>0.75,或者比0.75大的也可给分,没有说明的但是答案正确扣分),
所以每日病亡累计人数y与时间t呈现强线性相关性,
(可以建立线性回归方程来进行估计,可以删掉);
(2)5天5个时间的平均值为,
5天5个病亡累计人数的平均值为;
计算5个时间与其均值的差,计算5个累计病亡人数与其均值的差,制作下表:
日 期
5月6日
5月7日
5月8日
5月9日
5月10日
均值
时间t
6
7
8
9
10
新冠肺炎
累计病亡人数
72300
75500
76900
78500
80000
﹣2
﹣1
0
1
2
﹣4340
﹣1140
260
1860
3360
用公式进行计算:
(可以不用列表,照样给分);
,
所以每日累计病亡人数y随时间t变化的线性回归方程是;
(3)日期5月11日对应时间t=11,,
所以,估计5月11日累计病亡人数是82160;
令,解得t≥15.26,
所以病亡人数要达到或超过9万,必须且只需t≥16,
且t=16对应于5月16日,
因此预测5月16日美国新冠肺炎病亡人数超过9万人.
19.(2020•淄博模拟)新生儿某疾病要接种三次疫苗免疫(即0、1、6月龄),假设每次接种之间互不影响,每人每次接种成功的概率相等为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10μg/次剂量组与20μg/次剂量组,试验结果如表:
接种成功
接种不成功
总计(人)
10μg/次剂量组
900
100
1000
20μg/次剂量组
973
27
1000
总计(人)
1873
127
2000
(1)根据数据说明哪种方案接种效果好?并判断能否有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关?
(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1000人的成功人数比此剂量只接种一次的成功人数平均提高多少人.
参考公式:,其中n=a+b+c+d.
参考附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
【解答】解:(1)由于两种接种方案都是1000人接受临床试验,接种成功人数10μg/次剂量组900人,
20μg/次剂量组973人,且973>900,
所以方案20μg/次剂量组接种效果好;
计算K244.806>10.828,
所以有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关;
(2)假设20μg/次剂量组临床试验接种一次成功的概率为p,
由数据知,三次接种成功的概率为0.973,不成功的概率为0.027,
由于三次接种之间互不影响,每人每次接种成功的概率相等,
所以(1﹣p)3=0.027,解得p=0.7;
设参与试验的1000人此剂量只接种一次成功的人数为X,
显然X~B(1000,0.7),E(X)=1000×0.7=700,
参与试验的1000人此剂量只接种一次成功的人数平均为700人,
且973﹣700=273,
试验选用20μg/次剂量组方案,参与该试验的1000人比此剂量只接种一次的成功人数平均提高273人.
20.(2020•泉州二模)FEV1(一秒用力呼气容积)是肺功能的一个重要指标.为了研究某地区10~15岁男孩群体的FEV1与身高的关系,现从该地区A、B、C三个社区10~15岁男孩中随机抽取600名进行FEV1与身高数据的相关分析.
(1)若A、B、C三个社区10~15岁男孩人数比例为1:3:2,按分层抽样进行抽取,请求出三个社区应抽取的男孩人数.
(2)经过数据处理后,得到该地区10~15岁男孩身高x(cm)与FEV1y(L)对应的10组数据(xi,yi)(i=1,2,…,10),并作出如图散点图:
经计算得:,,152,2.464,(xi,yi)(i=1,2,…,10)的相关系数r≈0.987.
①请你利用所给公式与数据建立y关于x的线性回归方程,并估计身高160cm的男孩的FEV1的预报值y0.
②已知,若①中回归模型误差的标准差为s,则该地区身高160cm的男孩的FEV1的实际值落在(y0﹣3s,y0+3s)内的概率为99.74%.现已求得s=0.1,若该地区有两个身高160cm的12岁男孩M和N,分别测得FEV1值为2.8L和2.3L,请结合概率统计知识对两个男孩的FEV1指标作出一个合理的推断与建议.
附:样本(xi,yi)(i=1,2,…,n)的相关系数r,
其回归方程的斜率和截距的最小二乘法估计分别为,,.
【解答】解:(1)A社区抽取人数:600人;B社区抽取人数:600人;
C社区抽取人数:600人;
(2)①对比与r的公式,可得
.
.
∴所求的线性回归方程为.
当x=160时,预报y0=0.047×160﹣4.68=2.84;
②∵s=0.1,∴y0﹣3s=2.84﹣3×0.1=2.54,y0+3s=2.84+3×0.1=3.14.
即该地区身高160cm的男孩的FEV1的实际值落在区间(2.54,3.14)内的概率为99.74%.
即该地区身高160cm的男孩的EFV1值不在这个区间内的概率极小,
仅有0.26%,M的EFV1值落在这个区间内,我们推断他的EFV1是正常的,
N的EFV1值低于该区间的下限,我们推断他的EFV1是不正常的,建议他去找一下不正常的原因.
21.(2020•香坊区校级二模)近期,湖北省武汉市等多个地区发生新型冠状病毒感染的肺炎疫情.为了尽快遏制住疫情,我国科研工作者坚守在科研一线,加班加点、争分夺秒与病毒抗争,夜以继日地进行研究.新型冠状病毒的潜伏期检测是疫情控制的关键环节之一.在传染病学中,通常把从致病刺激物侵入机体或对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.钟南山院士带领的研究团队统计了武汉市某地区10000名医学观察者的相关信息,并通过咽拭子核酸检测得到1000名确诊患者的信息如表格:
潜伏期(单位:天)
[0,7]
(7,14]
(14,21]
(21,28]
人数
800
190
8
2
(1)求这1000名确诊患者的潜伏期样本数据的平均数(同一组数据用该组数据区间的中点值代表).
(2)新型冠状病毒的潜伏期受诸多因素影响,为了研究潜伏期与患者性别的关系,以潜伏期是否超过7天为标准进行分层抽样,从上述1000名患者中抽取100名,得到如下列联表.请将列联表补充完整,并根据列联表判断是否有90%的把握认为潜伏期与患者性别有关.
潜伏期≤7天
潜伏期>7天
总计
男性患者
38
12
50
女性患者
42
8
50
总计
80
20
100
(3)由于采样不当、标本保存不当、采用不同类型的标本以及使用不同厂家试剂都可能造成核酸检测结果“假阴性”而出现漏诊.当核酸检测呈阴性时,需要进一步进行血清学IgM/IgG抗体检测,以弥补核酸检测漏诊的缺点.现对10名核酸检测结果呈阴性的人员逐一地进行血清检测,记每个人检测出IgM(IgM是近期感染的标志)呈阳性的概率为p(0<p<1)且相互独立,设至少检测了9个人才检测出IgM呈阳性的概率为f(p),求f(p)取得最大值时相应的概率p.
附:,其中n=a+b+c+d.
P(K2≥k0)
0.100
0.050
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
【解答】解:(1).
(2)补充完整的2×2列联表如下所示,
潜伏期<7天
潜伏期>7天
总计
男性患者
38
12
50
女性患者
42
8
50
总计
80
20
100
∴2.706,
∴不能有90%的把握认为潜伏期与患者性别有关.
(3)由f(p)=p(1﹣p)8+p(1﹣p)9,化简得f(p)=p(1﹣p)8(2﹣p),
令1﹣p=x∈(0,1),则p=1﹣x,f(p)=(1﹣x)x8(1+x)=(1﹣x2)x8,
令g(x)=(1﹣x2)x8,x∈(0,1),则g'(x)=2x7(4﹣5x2),
令g'(x)>0,则;令g'(x)<0,则,
∴g(x)在上单调递增,在上单调递减,
∴g(x)有唯一的极大值为,也是最大值.
∴当,即时,f(p)取得最大值.
相关试卷
这是一份人教版高中数学选择性必修第三册第八章成对数据的统计分析 章末单元测试(含解析),共32页。试卷主要包含了多选题,填空题,解答题等内容,欢迎下载使用。
这是一份第8章 成对数据的统计分析——【期末复习】高中数学章节知识点梳理(人教A版2019选择性必修第三册),共2页。试卷主要包含了1 成对数据的统计相关性,一元线性回归模型,经验回归方程,独立性检验,635,879等内容,欢迎下载使用。
这是一份【2023高考奠基】高中数学(人教A版2019)选择性必修第三册 第8章《成对数据的统计分析》基础知识汇总,共3页。试卷主要包含了1 成对数据的统计相关性,一元线性回归模型,经验回归方程,独立性检验,635,879等内容,欢迎下载使用。