人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.1 成对数据的相关关系课后测评
展开1.下列说法中正确的是( )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的
D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的
2.若经验回归方程为eq \(y,\s\up6(^))=2-3.5x,则变量x增加一个单位,变量y平均( )
A.减少3.5个单位B.增加2个单位
C.增加3.5个单位D.减少2个单位
3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
由χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得χ2=eq \f(110×(40×30-20×20)2,60×50×60×50)≈7.8.
附表:
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动和性别有关”
B.有99%以上的把握认为“爱好该项运动和性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
4.某考察团对全国十大城市的职工人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,发现y与x具有线性相关关系,经验回归方程为eq \(y,\s\up6(^))=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.86%B.72%
C.67%D.83%
5.某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:
则利润y对科研费用支出x的经验回归方程为( )
A.eq \(y,\s\up6(^))=2x+20B.eq \(y,\s\up6(^))=2x-20
C.eq \(y,\s\up6(^))=20x+2D.eq \(y,\s\up6(^))=20x-2
6.独立检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(K2≥6.635)=0.010表示的意义是( )
A.变量X与变量Y有关系的概率为1%
B.变量X与变量Y没有关系的概率为99.9%
C.变量X与变量Y没有关系的概率为99%
D.变量X与变量Y有关系的概率为99%
7.根据某班学生数学、外语成绩得到的2×2列联表如下:
那么随机变量χ2约等于( )
A.10.3B.8
C.4.25D.9.3
8.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d为样本容量.
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项符合题目要求.全部选对的得5分,部分选对的得3分,有选错的得0分)
9.独立性检验中,为了调查变量X与变量Y的关系,经过计算得到χ2≥6.635=x0.01表示的意义是( )
A.有99%的把握认为变量X与变量Y没有关系
B.有1%的把握认为变量X与变量Y有关系
C.有99%的把握认为变量X与变量Y有关系
D.有1%的把握认为变量X与变量Y没有关系
10.在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的经验回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),那么下面说法正确的是( )
A.经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
B.经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))必经过点(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))
C.经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))表示最接近y与x之间真实关系的一条直线
D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
11.已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的经验回归方程为eq \(y,\s\up6(^))=1.5x+0.5,且eq \(x,\s\up6(-))=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的经验回归方程为eq \(y,\s\up6(^))=1.2x+1.4
C.去除后y的估计值增加速度变快
D.去除后相应于样本点(2,3.75)的残差为0.05
12.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的eq \f(4,5),女生喜欢抖音的人数占女生人数eq \f(3,5),若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人
附表:
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
A.25B.45
C.60D.75
三、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上)
13.下列是关于出生男婴与女婴调查的列联表
那么A=________,B=________,C=________,D=________,E=________.
14.已知样本数为11,计算得eq \i\su(i=1,11,x)i=66,eq \i\su(i=1,11,y)i=132,经验回归方程为eq \(y,\s\up6(^))=0.3x+eq \(a,\s\up6(^)),则eq \(a,\s\up6(^))=________.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=-2.现预测当气温为-4℃时,用电量的度数约为________.
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表
在犯错误的概率不超过________的前提下认为性别与休闲方式有关系.
四、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)
在改革开放40年成就展上有某地区某农产品近几年的产量统计如表:
(1)根据表中数据,建立y关于x的经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
(2)根据经验回归方程预测2020年该地区该农产品的年产量.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,)(xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\i\su(i=1,n,)(xi-\(x,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)),(参考数据:eq \i\su(i=1,6,)(xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=2.8,计算结果保留到小数点后两位)
18.(本小题满分12分)
在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏.
(1)根据以上数据建立一个2×2的列联表;
(2)根据以上数据,在犯错误的概率不超过0.025的前提下,能否认为“喜欢玩电脑游戏与性别有关系”?
19.(本小题满分12分)
某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的eq \f(1,2),男生喜欢韩剧的人数占男生人数的eq \f(1,6),女生喜欢韩剧的人数占女生人数的eq \f(2,3),若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?
20.(本小题满分12分)
某省级示范高中高三年级对各科考试的评价指标中,有“难度系数”和“区分度”两个指标中,难度系数=eq \f(年级总平均分,满分),区分度=eq \f(实验班的平均分-普通班的平均分,满分).
(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确到0.01).
(2)如下表表格是该校高三年级6次数学考试的统计数据:
①计算相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用经验回归模型描述y与x的关系(精确到0.01).
②ti=|xi-0.74|(i=1,2,…,6),求出y关于t的经验回归方程,并预测x=0.75时y的值(精确到0.01).
附注:参考数据:eq \i\su(i=1,6,x)iyi=0.9309,eq \r(\i\su(i=1,6,)(xi-\(x,\s\up6(-)))2\i\su(i=1,6,)(yi-\(y,\s\up6(-)))2)≈0.0112,eq \i\su(i=1,6,t)iyi=0.0483,eq \i\su(i=1,6,)(ti-eq \(i,\s\up6(-)))2=0.0073
参考公式:相关系数r=eq \f(\i\su(i=1,n,)(xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\i\su(i=1,n,)(xi-\(x,\s\up6(-)))2\i\su(i=1,n,)(yi-\(y,\s\up6(-)))2)),经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,)(xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\i\su(i=1,n,)(xi-\(x,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
21.(本小题满分12分)
某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
25周岁以上(含25周岁)组 25周岁以下组
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不小于80件者为“生产能手”,请你根据已知条件画出2×2列联表,并判断是否在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?
(注:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)))
22.(本小题满分12分)
某地区在一次考试后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:
根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:
eq \i\su(i=1,42,x)i=4641,eq \i\su(i=1,42,y)i=3108,eq \i\su(i=1,42,x)iyi=350350,eq \i\su(i=1,42,)(xi-eq \(x,\s\up6(-)))2=13814.5,eq \i\su(i=1,42,)(yi-eq \(y,\s\up6(-)))2=5250,其中xi,yi分别表示这42名同学的数学成绩、物理成绩,i=1,2,…,42,y与x的相关系数r=0.82.
(1)若不剔除A,B两名考生的数据,用44组数据作回归分析,设此时y与x的相关系数为r0.试判断r0与r的大小关系,并说明理由;
(2)求y关于x的经验回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到个位);
(3)从概率统计规律看,本次考试该地区的物理成绩ξ服从正态分布N(μ,σ2).以剔除后的物理成绩作为样本,用样本平均数eq \(y,\s\up6(-))作为μ的估计值,用样本方差s2作为σ2的估计值.试求该地区5000名考生中,物理成绩位于区间(62.8,85.2)的人数Z的数学期望.
附:①经验回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,)(xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\i\su(i=1,n,)(xi-\(x,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
②若ξ~N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.6826,P(μ-2σ<ξ≤μ+2σ)=0.9544.
③eq \r(125)≈11.2.
章末质量检测(三)
1.解析:相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.故选C.
答案:C
2.解析:由经验回归方程可知 eq \(b,\s\up9(^)) =-3.5,则变量x增加一个单位, eq \(y,\s\up9(^)) 减少3.5个单位,即变量y平均减少3.5个单位.故选A.
答案:A
3.解析:∵χ2≈7.8>6.635=x0.01,∴犯错误的概率不超过α=0.01.故选A.
答案:A
4.解析:将 eq \(y,\s\up9(^)) =7.675,代入经验回归方程可计算,得x≈9.26,所以该城市大约消费额占人均工资收入的百分比为7.675÷9.26≈0.83,故选D.
答案:D
5.解析:设经验回归方程为 eq \(y,\s\up9(^)) = eq \(b,\s\up9(^)) x+ eq \(a,\s\up9(^)) .
由表中数据得, eq \(b,\s\up9(^)) = eq \f(1 000-6×5×30,200-6×52) =2,
∴ eq \(a,\s\up9(^)) = eq \(y,\s\up9(-)) - eq \(b,\s\up9(^)) eq \(x,\s\up9(-)) =30-2×5=20,
∴经验回归方程为 eq \(y,\s\up9(^)) =2x+20.故选A.
答案:A
6.解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.故选D.
答案:D
7.解析:由公式得χ2= eq \f(85×(34×19-17×15)2,51×34×49×36) ≈4.25.故选C.
答案:C
8.解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,代入公式得χ2= eq \f(100×(675-300)2,55×45×75×25) ≈3.030<3.841.
∵2.706<3.030<3.841,
∴在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别有关”.
答案:C
9.解析:独立性检验中,由χ2≥6.635=x0.01,它表示的意义是:有1%的把握认为变量X与变量Y没有关系,D正确;即有99%的把握认为变量X与变量Y有关系,C正确.故选CD.
答案:CD
10.解析:经验回归直线是最能体现这组数据的变化趋势的直线,不一定经过样本数据中的点,故A不正确,C正确;经验回归直线一定经过样本中心点,故B正确;相关系数r满足|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小,故D正确.故选BCD.
答案:BCD
11.解析: eq \(x,\s\up9(-)) =3,代入 eq \(y,\s\up9(^)) =1.5x+0.5, eq \(y,\s\up9(-)) =5,因为重新求得的经验回归直线l的斜率为1.2,故正相关,设新的数据所以横坐标的平均值 eq \(x,\s\up9(-)) ,则(n-2) eq \(x,\s\up9(-)) =n eq \(x,\s\up9(-)) -(1.2+4.8)=3n-6=3(n-2),故 eq \(x,\s\up9(-)) =3,纵坐标的平均数为 eq \(y,\s\up9(-)) ,则(n-2) eq \(y,\s\up9(-)) =n eq \(y,\s\up9(-)) -(2.2+7.8)=n eq \(y,\s\up9(-)) -10=5n-10=5(n-2), eq \(y,\s\up9(-)) =5,
设新的经验回归方程为 eq \(y,\s\up9(^)) =1.2x+ eq \(b,\s\up9(^)) ,把(3,5)代入5=1.2×3+ eq \(b,\s\up9(^)) , eq \(b,\s\up9(^)) =1.4,
故新的经验回归方程为 eq \(y,\s\up9(^)) =1.2x+1.4,故A,B正确,因为斜率为1.2不变,所以y的增长速度不变,C错误,把x=2代入,y=3.8,3.75-3.8=-0.05,故D错误,故选AB.
答案:AB
12.解析:设男生可能有x人,依题意可得列联表如下:
若有95%的把握认为是否喜欢抖音和性别有关,则χ2>3.841,
由χ2= eq \f(2x,21) >3.841,解得x>40.335,
由题意知x>0,且x是5的整数倍,所以45,60和75都满足题意.故选BCD.
答案:BCD
13.解析:∵45+E=98,∴E=53,
∵E+35=C,∴C=88,
∵98+D=180,∴D=82,
∵A+35=D,∴A=47,
∵45+A=B,∴B=92.
答案:47 92 88 82 53
14.解析:∵ eq \i\su(i=1,11,x)i=66, eq \i\su(i=1,11,y)i=132,
∴ eq \(x,\s\up9(-))=6, eq \(y,\s\up9(-))=12,代入 eq \(y,\s\up9(^))=0.3x+ eq \(a,\s\up9(^)),
可得: eq \(a,\s\up9(^))=10.2.
答案:10.2
15.解析:由题意可知 eq \(x,\s\up9(-))= eq \f(1,4)(18+13+10-1)=10,
eq \(y,\s\up9(-))= eq \f(1,4)(24+34+38+64)=40, eq \(b,\s\up9(^))=-2.
又经验回归直线 eq \(y,\s\up9(^))=-2x+ eq \(a,\s\up9(^))过点(10,40),故 eq \(a,\s\up9(^))=60.
所以当x=-4时, eq \(y,\s\up9(^))=-2×(-4)+60=68.
答案:68
16.解析:由列联表中的数据,得
χ2= eq \f(89×(24×26-31×8)2,55×34×32×57)≈3.689>2.706,
因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
答案:0.10
17.解析:(1)由题意可知: eq \(x,\s\up9(-))=3.5, eq \(y,\s\up9(-))=7, eq \i\su(i=1,6, )(xi- eq \(x,\s\up9(-)))2=17.5,
所以 eq \(b,\s\up9(^))=0.16,又 eq \(a,\s\up9(^))=6.44,故y关于x的经验回归方程为 eq \(y,\s\up9(^))=0.16x+6.44.
(2)由(1)可得,当年份为2020年时,
年份代码x=7,此时 eq \(y,\s\up9(^))=0.16×7+6.44=7.56.
所以可预测2020年该地区该农产品的年产量约为7.56万吨.
18.解析:(1)2×2列联表
(2)χ2= eq \f(50×(18×15-8×9)2,27×23×24×26) ≈5.06,
又x0.025=5.024<5.06,故在犯错误的概率不超过0.025的前提下,可以认为“喜欢玩电脑游戏与性别有关系”.
19.解析:设男生人数为x,依题意可得列联表如下:
若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则χ2>3.841,
由χ2= eq \f(3,8) x>3.841,解得x>10.24,
∵ eq \f(x,2) , eq \f(x,6) 为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人.
20.解析:(1)实验班三人成绩的平均值为142,
普通班三人成绩的平均值为104,故估计本次考试的区分度为 eq \f(142-104,150) ≈0.25.
(2)①由题中的表格可知 eq \(x,\s\up9(-)) = eq \f(1,6) (0.64+0.71+0.74+0.76+0.77+0.82)=0.74,
eq \(y,\s\up9(-)) = eq \f(1,6) (0.18+0.23+0.24+0.24+0.22+0.15)=0.21,
故r= eq \f(\i\su(i=1,n, )(xi-\(x,\s\up9(-)))(yi-\(y,\s\up9(-))),\r(\i\su(i=1,n, )(xi-\(x,\s\up9(-)))2\i\su(i=1,n, )(yi-\(y,\s\up9(-)))2))≈-0.13.
因为|r|<0.75,所以相关性弱,故不能利用经验回归模型描述y与x的关系;
②y与t的值如下表
因为 eq \(b,\s\up9(^))= eq \f(\i\su(i=1,6,t)iyi-6\(t,\s\up9(-))·\(y,\s\up9(-)),\i\su(i=1,6, )(ti-\(t,\s\up9(-)))2)≈ eq \f(0.0483-6×\f(0.26,6)×0.21,0.007 3)≈-0.86,
所以 eq \(a,\s\up9(^))= eq \(y,\s\up9(-))- eq \(b,\s\up9(^)) eq \(t,\s\up9(-))=0.21+0.86× eq \f(0.26,6)≈0.25,
所以所求经验回归方程 eq \(y,\s\up9(^))=0.86t+0.25,
当x=0.75时,此时t=0.01,则y≈0.24.
21.解析:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P= eq \f(7,10) .
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),
据此可得2×2列联表如下:
所以得χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
= eq \f(100×(15×25-15×45)2,60×40×30×70) ≈1.79.
因为1.79<2.706.
所以在犯错误的概率不超过0.1的前提下不能认为“生产能手与工人所在的年龄组有关”.
22.解析:(1)r0
①异常点A,B会降低变量之间的线性相关程度.
②44个数据点与其经验回归直线的总偏差更大,回归效果更差,所以相关系数更小.
③42个数据点与其经验回归直线的总偏差更小,回归效果更好,所以相关系数更大.
④42个数据点更贴近其经验回归直线.
⑤44个数据点与其经验回归直线更离散.
(2)由题中数据可得: eq \(x,\s\up9(-))= eq \f(1,42) eq \i\su(i=1,42,x)i=110.5, eq \(y,\s\up9(-))= eq \f(1,42) eq \i\su(i=1,42,y)i=74,
所以 eq \i\su(i=1,42, )(xi- eq \(x,\s\up9(-)))(yi- eq \(y,\s\up9(-)))= eq \i\su(i=1,42,x)iyi-42 eq \(x,\s\up9(-)) eq \(y,\s\up9(-))=350 350-42×110.5×74=6 916.
又因为 eq \i\su(i=1,42, )(xi- eq \(x,\s\up9(-)))2=138 14.5,所以 eq \(b,\s\up9(^))= eq \f(\i\su(i=1,42, )(xi-\(x,\s\up9(-)))(yi-\(y,\s\up9(-))),\i\su(i=1,42, )(xi-\(x,\s\up9(-)))2)=0.501,
eq \(a,\s\up9(^))= eq \(y,\s\up9(-))- eq \(b,\s\up9(^)) eq \(x,\s\up9(-))=74-0.501×110.5≈18.64,所以 eq \(y,\s\up9(^))=0.50x+18.64.
将x=125代入,得y=0.50×125+18.64=62.5+18.64≈81,
所以估计B同学的物理成绩均为81分.
(3) eq \(y,\s\up9(-))= eq \f(1,42) eq \i\su(i=1,42,y)i=74,s2= eq \f(1,42) eq \i\su(i=1,42, )(yi- eq \(y,\s\up9(-)))2= eq \f(1,42)×5 250=125,
所以ξ~N(74,125),又因为 eq \r(125)≈11.2,
所以P(62.8<ξ<85.2)=P(74-11.2<ξ<74+11.2)=0.682 6,
因为Z~B(5 000,0.682 6),所以E(Z)=5 000×0.682 6=3 413,
即该地区本次考试物理成绩位于区间(62.8,85.2)的人数Z的数学期望为3 413.
男
女
合计
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
序号
科研费用支出xi
利润yi
xiyi
x eq \\al(\s\up1(2),\s\d1(i))
1
5
31
155
25
2
11
40
440
121
3
4
30
120
16
4
5
34
170
25
5
3
25
75
9
6
2
20
40
4
总计
30
180
1000
200
数优
数差
总计
外优
34
17
51
外差
15
19
34
总计
49
36
85
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
α
0.10
0.05
0.025
xα
2.706
3.841
5.024
α
0.050
0.010
xα
3.841
6.635
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
读书
健身
总计
女
24
31
55
男
8
26
34
总计
32
57
89
年份
2014
2015
2016
2017
2018
2019
年份代码x
1
2
3
4
5
6
年产量(万吨)
6.6
6.7
7
7.1
7.2
7.4
难度系数x
0.64
0.71
0.74
0.76
0.77
0.82
区分度y
0.18
0.23
0.24
0.24
0.22
0.15
α
0.100
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
喜欢抖音
不喜欢抖音
合计
男生
eq \f(4,5) x
eq \f(1,5) x
x
女生
eq \f(3,5) x
eq \f(2,5) x
x
合计
eq \f(7,5) x
eq \f(3,5) x
2x
性别
游戏态度
男生
女生
合计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
合计
26
24
50
喜欢韩剧
不喜欢韩剧
合计
男生
eq \f(x,6)
eq \f(5x,6)
x
女生
eq \f(x,3)
eq \f(x,6)
eq \f(x,2)
合计
eq \f(x,2)
x
eq \f(3x,2)
t
0.10
0.03
0
0.02
0.03
0.08
区别度y
0.18
0.23
0.24
0.24
0.22
0.15
生产能手
非生产能手
合计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
人教版高中数学选择性必修第三册第八章成对数据的统计分析 章末单元测试(含解析): 这是一份人教版高中数学选择性必修第三册第八章成对数据的统计分析 章末单元测试(含解析),共32页。试卷主要包含了多选题,填空题,解答题等内容,欢迎下载使用。
章末综合检测(三) 成对数据的统计分析(A、B卷): 这是一份章末综合检测(三) 成对数据的统计分析(A、B卷),共24页。试卷主要包含了单项选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系练习题: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系练习题,共4页。试卷主要包含了以下关于相关关系的说法错误的是,下列关系属于线性负相关的是,有下列关系等内容,欢迎下载使用。