高二数学知能优化训练 湘教版必修5:12.4 《数据的相关性》
展开1.下列关系中为相关关系的有( )
①学生的学习态度和学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①② B.①③
C.②③ D.②④
解析:选A.由相关关系的定义知,①②为相关关系,③④无相关关系.
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求回归直线方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:选D.由线性回归分析的步骤可知.
3.(2011年高考山东卷)某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元) | 4 | 2 | 3 | 5 |
销售额y(万元) | 49 | 26 | 39 | 54 |
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:选B.由表可计算==,==42,因为点(,42)在回归直线=x+上,且为9.4,所以42=9.4×+,解得=9.1,故回归方程为=9.4x+9.1,令x=6得=65.5,选B.
4.下列关系中,属于相关关系的是________.
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
解析:在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
答案:②④
一、选择题
1.下列变量之间的关系是函数关系的是( )
A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.父母的身高和子女的身高
解析:选A.B、C、D选项是相关关系.故选A.
2.试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( )
解析:选C.在图A中点的分布毫无规则,横轴、纵轴表示的两个变量之间的相关程度很小.在图B中所有的点严格地分布在一条直线上,横轴、纵轴表示的两个量之间有确定的关系——函数关系.在图C中,点的分布基本上集中在一个带状区域内,横轴、纵轴表示的两个变量之间有相关关系——当一个变量变化时,另一个变量的值虽然不能完全确定,但大体上总是落在带状区域内,这时我们可以寻找一条合适的直线来近似表示两个变量之间的关系(如图中的直线),即两个变量之间的关系可以近似地表示成线性关系,因此这两个变量具有线性相关关系.图D与图C类似,点的分布基本上也集中在由某条曲线两侧组成的带状区域内,因此横轴、纵轴表示的两个变量也有相关关系,只是它是非线性相关关系.
3.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:选C.图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据v随着u的增大而增大,因此u与v正相关.
4.(2010年高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:选A.可判断B、D正相关,C不合实际意义.
5.两个相关变量满足如下关系:
x | 10 | 15 | 20 | 25 | 30 |
y | 1003 | 1005 | 1010 | 1011 | 1014 |
两变量的回归直线方程为( )
A.y=0.56x+997.4 B.y=0.63x-231.2
C.y=50.2x+501.4 D.y=60.4x+400.7
解析:选A.b==0.56,
a=-b=997.4,
所以回归直线方程为=0.56x+997.4.所以选A.
6.在2011年3月15日那天,济宁市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商品的售价x元与销售量y件之间的一组数据如下表所示:
价格x | 9 | 9.5 | 10 | 10.5 | 11 |
销售量y | 11 | 10 | 8 | 6 | 5 |
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是:y=-3.2x+a,则a=( )
A.24 B.35.6
C.40 D.40.5
解析:选C.易求==10,
==8,
∴y=-3.2x+a一定过(10,8),
∴8=-3.2×10+a,∴a=40.
二、填空题
7.下列说法:
①回归方程适用于一切样本和总体;
②回归方程一般都有局限性;
③样本取值的范围会影响回归方程的适用范围;
④回归方程得到的预测值是预测变量的精确值.
正确的是________(将你认为正确的序号都填上).
解析:样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.
答案:②③
8.(2010年高考广东卷)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份 | 2005 | 2006 | 2007 | 2008 | 2009 |
收入x | 11.5 | 12.1 | 13 | 13.3 | 15 |
支出Y | 6.8 | 8.8 | 9.8 | 10 | 12 |
根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有__________线性相关关系.
解析:2005~2009年居民家庭的年平均收入按从小到大排列依次为:11.5、12.1、13、13.3、15,由中位数定义知年平均收入的中位数是13万元.由统计资料可知家庭年平均收入与年平均支出具有正线性相关关系.
答案:13 正
9.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,张红同学(20岁)身高178 cm,她的体重应该在________kg左右.
解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,y=0.72×178-58.2=69.96(kg).
答案:69.96
三、解答题
10.某调查机构为了了解某地区的家庭收入水平与消费支出的相关情况,抽查了多个家庭,根据调查资料得到以下数据:每户平均年收入为88000元,每户平均年消费支出为50000元,支出对于收入的回归系数为0.6.
(1)求支出对于收入的回归方程;
(2)年收入每增加100元,年消费支出平均增加多少元?
(3)若某家庭年消费支出为80000元,试估计该家庭的年收入为多少元?
解:(1)设年收入为x元,年支出为y元,知=88000元,=50000元,b=0.6,则a=-b=50000-0.6×88000=-2800.故支出对于收入的回归方程为y=0.6x-2800.
(2)年收入每增加100元,年消费支出平均增加60元.
(3)某家庭年消费支出为80000元,根据回归方程y=0.6x-2800,可得80000=0.6x-2800,解得x=138000,即估计该家庭的年收入为138000元.
11.要分析学生升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:
x | 63 | 67 | 45 | 88 | 81 | 71 | 52 | 99 | 58 | 76 |
y | 65 | 78 | 52 | 82 | 92 | 89 | 73 | 98 | 56 | 75 |
表中x是学生入学成绩,y是高一年级期末考试数学成绩.
(1)画出散点图,若y与x有线性相关关系,求回归直线方程;
(2)若小明的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?
解:(1)作出散点图如图所示,制表:
序号 | x | y | x2 | xy |
1 | 63 | 65 | 3969 | 4095 |
2 | 67 | 78 | 4489 | 5226 |
3 | 45 | 52 | 2025 | 2340 |
4 | 88 | 82 | 7744 | 7216 |
5 | 81 | 92 | 6561 | 7452 |
6 | 71 | 89 | 5041 | 6319 |
7 | 52 | 73 | 2704 | 3796 |
8 | 99 | 98 | 9801 | 9702 |
9 | 58 | 56 | 3364 | 3248 |
10 | 76 | 75 | 5776 | 5700 |
合计 | 700 | 760 | 51474 | 55094 |
从散点图可以看出,这两个变量具有线性相关关系.
可求得=(63+67+…+76)=70,
=(65+78+…+75)=76,
∴b==≈0.766,
a≈76-0.766×70=22.38.
所求的线性回归方程为y=0.766x+22.38.
(2)若小明的入学成绩为80分,代入(1)中的回归直线方程得y=0.766×80+22.38≈84(分).
12.下面是某市一周内申请领结婚证的新郎和新娘的年龄,记为(y,x),其中新郎年龄为y,新娘年龄为x.
(37,30),(30,27),(65,56),(45,40),(32,30),(28,26),(45,31),(29,24),(26,23),(28,25),(42,29),(36,33),(33,29),(24,22),(32,33),(21,29),(37,46),(28,25),(33,34),(21,23),(24,23),(49,44),(28,29),(30,30),(24,25),(22,23),(68,60),(25,25),(32,27),(42,37),(24,24),(24,22),(28,27),(36,31),(23,24),(30,26).
以下考虑y关于x的回归问题:
(1)如果每个新郎和新娘都同岁,穿过这些点的回归直线的斜率和截距等于什么?
(2)如果每个新郎都比新娘大5岁,穿过这些点的回归直线的斜率和截距等于什么?
(3)如果每个新郎都比新娘大10%,穿过这些点的回归直线的斜率和截距等于什么?
(4)对上面的实际年龄求回归方程,你从新郎和新娘的年龄模型中可得出什么结论?
解:(1)当y=x时,易得b=1,a=0.
故回归直线的斜率为1,截距为0.
(2)当y=x+5时,易得b=1,a=5.
故回归直线的斜率为1,截距为5.
(3)当y=x(1+10%)时,易得b=1.1,a=0.
故回归直线的斜率为1.1,截距为0.
(4)回归直线为y=1.1x-1.1.
从回归方程可以看出,新郎的年龄一般比新娘的年龄大,尤其是在大龄夫妇中.