- 第七章 章末素养提升课件PPT 课件 0 次下载
- 第七章章末检测 试卷 0 次下载
- 8.2.1一元线性回归模型课件PPT 课件 0 次下载
- 8.2.2 第一元线性回归模型参数的最小二乘估计课件PPT 课件 0 次下载
- 第八章 章末素养提升课件PPT 课件 0 次下载
第八章章末检测
展开第八章章末检测
(时间:120分钟,满分150分)
参考公式及数据:(1)回归方程=x+中斜率和截距的最小二乘估计公式分别为==,=-.(2)相关系数r=.(3)R2=1-.(4)χ2=,其中n=a+b+c+d.
α | 0.1 | 0.05 | 0.01 | 0.005 | 0.001 |
xα | 2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下列语句表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.名师出高徒
C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧
【答案】D 【解析】“喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选D.
2.下列结论不正确的是( )
A.函数关系是一种确定性关系
B.相关关系是一种非确定性关系
C.回归分析是对具有函数关系的两个变量进行统计分析的一种方法
D.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
【答案】C
3.若经验回归方程为y=2-3.5x,则变量x增加一个单位,变量y平均( )
A.减少3.5个单位 B.增加2个单位
C.增加3.5个单位 D.减少2个单位
【答案】A 【解析】由经验回归方程可知b=-3.5,则变量x增加一个单位,y减少3.5个单位,即变量y平均减少3.5个单位.
4.两个分类变量X与Y,可能的取值分别为{x1,x2}和{y1,y2},其样本频数满足a=5,b=15,c=40,d=10,则X与Y有关系的可信程度为( )
A.95% B.99%
C.99.5% D.99.9%
【答案】D
【解析】χ2=≈18.822>10.828,∴X与Y有关系的可信程度为1-0.001=0.999=99.9%.
5.某学校开展研究性学习活动,某同学获得一组试验数据如下表:
x | 1.99 | 3 | 4 | 5.1 | 6.12 |
y | 1.5 | 4.04 | 7.5 | 12 | 18.01 |
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( )
A.y=2x-2 B.y=(x2-1)
C.y=log2x D.y=x
【答案】B 【解析】根据表中的数据,可验证y=(x2-1)拟合程度最好.
6.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
【答案】A 【解析】由样本的中心(,)落在回归直线上可知A正确;x和y的相关系数表示x与y之间的线性相关程度,不表示直线l的斜率,故B错误;x和y的相关系数应在-1到1之间,故C错误;分布在回归直线两侧的样本点的个数并不绝对平均,跟样本点个数是奇数还是偶数无关,故D错误.
7.根据某班学生数学、外语成绩得到的列表如下:
外语 | 数学 | 合计 | |
优 | 差 | ||
优 | 34 | 17 | 51 |
差 | 15 | 19 | 34 |
合计 | 49 | 36 | 85 |
那么χ2约等于( )
A.10.3 B.8
C.4.25 D.9.3
【答案】C 【解析】由公式得χ2=≈4.25.
8.下列是x与y之间的一组数据
x | 0 | 1 | 2 | 3 |
y | 1 | 3 | 5 | 7 |
若y关于x的回归方程为=x+,对应的直线必过点( )
A. B.
C.(2,2) D.(1,2)
【答案】A 【解析】为样本点的中心,一定在回归直线上.
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列说法中正确的是( )
A.通过回归方程=x+,可以估计和观测变量的取值和变化趋势
B.设有一个经验回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位
C.设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强
D.在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大
【答案】AD 【解析】A正确;变量x增加一个单位时,y平均减小5个单位,故B不正确;设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越弱,故C错误;D正确.
10.小明同学在做市场调查时得到如下样本数据.
x | 1 | 3 | 6 | 10 |
y | 8 | a | 4 | 2 |
他由此得到回归方程为=-2.1x+15.5,则下列说法正确的是( )
A.变量x与y线性负相关
B.当x=2时可以估计y=11.3
C.a=6
D.变量x与y之间是函数关系
【答案】ABC 【解析】由回归方程为=-2.1x+15.5,可知变量x与y之间线性负相关,故A正确;当x=2时,y=-2.1×2+15.5=11.3,故B正确;∵=5,=,∴样本点的中心坐标为,代入=-2.1x+15.5,得=-2.1×5+15.5,解得a=6,故C正确;变量x与y之间具有线性负相关关系,不是函数关系,故D错误.
11.下列结论正确的是( )
A.回归分析中,可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好
B.回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高
C.回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好
D.回归分析中,可用R2判断模型的拟合效果,R2越大,模型的拟合效果越好
【答案】BD 【解析】A应改为|r|越大,模型拟合效果越好;C的判断正好相反;B,D正确.
12.有甲、乙两个班级进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下所示的列联表:
班级 | 成绩 | 合计 | |
优秀 | 非优秀 | ||
甲班 | 10 | b |
|
乙班 | c | 30 |
|
合计 |
|
|
|
已知在全部105人中随机抽取1人,成绩优秀的概率为,则( )
A.列联表中b的值为35
B.列联表中c的值为20
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,在犯错误的概率不超过0.05的前提下,能认为“成绩与班级有关系”
【答案】BCD 【解析】由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,A错误,B正确.根据列联表中的数据,χ2=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,即在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”,C,D正确.
三、填空题:本大题共4小题,每小题5分,共20分.
13.已知x,y的取值如下表:
x | 2 | 3 | 5 | 6 |
y | 2.7 | 4.3 | 6.1 | 6.9 |
从散点图分析y与x具有线性相关关系,且回归方程为=1.02x+,则=________.
【答案】0.92 【解析】由题意得=4,=5,又(,)在直线y=1.02x+上,所以=5-1.02×4=0.92.
14.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i | 1 | 2 | 3 | 4 | 5 |
数学成绩x | 80 | 75 | 70 | 65 | 60 |
物理成绩y | 70 | 66 | 68 | 64 | 62 |
现已知其经验回归方程为=0.36x+,则=______,根据此经验回归方程估计数学得90分的同学的物理成绩为______(四舍五入到整数).
【答案】40.8 73 【解析】==70,==66,所以66=0.36×70+,即=40.8,即经验回归方程为=0.36x+40.8.当x=90时,=0.36×90+40.8=73.2≈73.
15.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如下表:
不同剂量 的电离辐射 | 小白鼠 | 合计 | |
死亡 | 存活 | ||
第一种剂量 | 14 | 11 | 25 |
第二种剂量 | 6 | 19 | 25 |
合计 | 20 | 30 | 50 |
进行统计分析时的统计假设是________________.
【答案】小白鼠的死亡与剂量无关 【解析】根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关”.
16.若一组观测值(x1,y1),(x1,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2为________.
【答案】1 【解析】若ei=0,此时回归方程为=bx+a,故i=yi,所以R2=1-=1.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
新生 | 饮食习惯 | 合计 | |
喜欢甜品 | 不喜欢甜品 | ||
南方学生 | 60 | 20 | 80 |
北方学生 | 10 | 10 | 20 |
合计 | 70 | 30 | 100 |
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?
解:将列表中的数据代入公式计算,得χ2===≈4.762.
由于4.762>3.841=x0.05,
所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
18.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
性别 | 观众 | 合计 | |
非体育迷 | 体育迷 | ||
男 |
|
|
|
女 |
| 10 | 55 |
合计 |
|
|
|
解:(1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.
“非体育迷”人数为75,则据题意完成2×2列联表:
性别 | 观众 | 合计 | |
非体育迷 | 体育迷 | ||
男 | 30 | 15 | 45 |
女 | 45 | 10 | 55 |
合计 | 75 | 25 | 100 |
将2×2列联表的数据代入公式计算,得χ2=≈3.030>2.706=x0.1.
所以有90%的把握认为“体育迷”与性别有关.
19.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 | 12月1日 | 12月2日 | 12月3日 | 12月4日 | 12月5日 |
温差x/℃ | 10 | 11 | 13 | 12 | 8 |
发芽数y/颗 | 23 | 25 | 30 | 26 | 16 |
该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求经验回归方程,再对被选取的2组数据进行检验.
(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的经验回归方程y=bx+a;
(2)若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的经验回归方程是可靠的,试问(1)中所得的经验回归方程是否可靠?
解:(1)=12,=27,iyi=977,=434,
∴===2.5,=-=27-2.5×12=-3,∴=2.5x-3.
(2)由(1)知,当x=10时,y=22,误差不超过2颗;当x=8时,y=17,误差不超过2颗.故所求得的经验回归方程是可靠的.
20.某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时).
(1)应收集多少位女生的样本数据?
(2)在样本数据中,有165位男生的每周平均体育运动时间超过4时,60位女生的每周平均体育运动时间超过4时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
解:(1)300×=90,所以应收集90位女生的样本数据.
(2)由(1)及题中数据,得每周平均体育运动时间与性别列联表如下:
每周平均体 育运动时间 | 性别 | 合计 | |
男生 | 女生 | ||
不超过4小时 | 45 | 30 | 75 |
超过4小时 | 165 | 60 | 225 |
合计 | 210 | 90 | 300 |
结合列联表可算得χ2==≈4.762>3.841=x0.05.
所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
21.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件列表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
解:(1)由已知得,样本中有“25周岁以上组”工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人),故所求的概率p=1-=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可列表如下:
年龄组 | 工人 | 合计 | |
生产能手 | 非生产能手 | ||
25周岁以上 (含25周岁)组 | 15 | 45 | 60 |
25周岁以下组 | 15 | 25 | 40 |
合计 | 30 | 70 | 100 |
所以得χ2=
=≈1.79.
因为1.79<2.706=x0.1,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
22.某二手车经销商对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
使用 年数x | 2 | 3 | 4 | 5 | 6 | 7 |
售价y | 20 | 12 | 8 | 6.4 | 4.4 | 3 |
z=ln y | 3.00 | 2.48 | 2.08 | 1.86 | 1.48 | 1.10 |
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数r加以说明;
(2)求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少(,小数点后保留两位有效数字)?
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?
参考数据:iyi=187.4,izi=47.64,=139,≈4.18,≈13.96,≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.
解:(1)因为=×(2+3+4+5+6+7)=4.5,
=×(3+2.48+2.08+1.86+1.48+1.10)=2,
且izi=47.64,≈4.18,
≈1.53,所以
r=≈≈-0.99.
所以|r|≈0.99,说明z与x的线性相关程度很高.
(2)==≈-0.36,
所以=-=2+0.36×4.5=3.62.
所以z与x的线性回归方程是=-0.36x+3.62.
又z=ln y,所以y关于x的回归方程是=e-0.36x+3.62.
令x=9,得=e-0.36×9+3.62≈1.46,
即预测某辆A型号二手车当使用年数为9年时售价约1.46万元.
(3)当≥0.711 8时,e-0.36x+3.62≥0.711 8=eln 0.711 8=e-0.34,所以-0.36x+3.62≥-0.34,解得x≤11.
因此预测在收购该型号二手车时车辆的使用年数不得超过11年.