所属成套资源:高考数学一轮复习考点测试刷题本(含答案解析)
高考数学一轮复习考点测试刷题本56 变量间的相关关系与统计案例(含答案解析)
展开
这是一份高考数学一轮复习考点测试刷题本56 变量间的相关关系与统计案例(含答案解析),共10页。
2020高考数学(文数)考点测试刷题本56 变量间的相关关系与统计案例 一 、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:则试验结果体现A,B两变量有更强的线性相关性的是( )A.甲 B.乙 C.丙 D.丁 2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A.100个吸烟者中至少有99人患肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有 3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 4.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 5.某公司一种型号的产品近期销售情况如下表:根据上表可得到回归直线方程=0.75x+,据此估计,该公司7月份这种型号产品的销售额约为( )A.19.5万元 B.19.25万元 C.19.15万元 D.19.05万元 6.某城市收集并整理了该市2018年1月份至10月份每月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.已知该市每月的最低气温与当月的最高气温两变量具有较好的线性关系,则根据该折线图,下列结论错误的是( )A.每月的最低气温与当月的最高气温两变量为正相关B.10月份的最高气温不低于5月份的最高气温C.月温差(最高气温减最低气温)的最大值出现在1月份D.最低气温低于0 ℃的月份有4个 7.观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( ) 8.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合 二 、填空题9.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=________. 10.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:利用列联表的独立性检验估计,则成绩与班级________.(填“有关”或“无关”) 11.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算i=11,i=13,=21,则实数b的值为________.12.对于回归方程,当x=28时,y的估计值是 。三 、解答题13.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=, 14.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).K2=. 15.为了解学生的课外阅读时间情况,某学校随机抽取了50人进行统计分析,把这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:若把每天阅读时间在60分钟以上(含60分钟)的同学称为“阅读达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图. (1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表);(2)根据已知条件完成下面的2×2列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?附:参考公式:K2=,其中n=a+b+c+d.临界值表: 16.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但蔬菜上市时仍存在少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表: (1)在右面的坐标系中,描出散点图,并判断变量x与y是正相关还是负相关;(2)若用解析式=cx2+d作为蔬菜上农药残留量与用水量x的回归方程,令w=x2,计算平均值与,完成以下表格,求出与x的回归方程(c,d保留两位有效数字);(3)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到0.1,参考数据:≈2.236)附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为=,=-.
答案解析1.答案为:D;解析:r越大,m越小,线性相关性越强,丁同学的试验结果体现A,B两变量有更强的线性相关性.故选D. 2.答案为:D;解析:统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生.故选D. 3.答案为:D;解析:由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本点的中心(,),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确. 4.答案为:A解析:对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A. 5.答案为:D解析:由表可知=×(2+3+4+5+6)=4,=×(15.1+16.3+17+17.2+18.4)=16.8,则样本中心点(4,16.8)在线性回归直线上,故16.8=0.75×4+,得=13.8.故当x=7时,=0.75×7+13.8=19.05.故选D. 6.答案为:D解析:由图观察可得,当最低气温较大时,最高气温也较大,故A正确;10月份的最高气温大于20 ℃,而5月份的最高气温不超过20 ℃,故B正确;从各月的温差看,1月份的温差最大,故C正确;而最低气温低于0 ℃的月份是1,2,4三个月份.故选D. 7.答案为:D解析:在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强.故选D. 8.答案为:A解析:由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心.故选A. 9.答案为:e4解析:因为y=cekx,所以两边取对数,可得ln y=ln (cekx)=ln c+ln ekx=ln c+kx,令z=ln y,可得z=ln c+kx.因为z=0.3x+4,所以ln c=4,所以c=e4. 10.答案为:无关;解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系.由公式得K2的观测值K2=≈0.653<2.706,所以成绩与班级无关. 11.答案为:;解析:令t=x2,则曲线的回归方程变为线性回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.12.39013.解:(1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.)(2)由茎叶图知m==80.列联表如下:(3)由于K2的观测值k==10>6.635,所以有99%的把握认为两种生产方式的效率有差异.14.解:(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A的概率的估计值为0.62×0.66=0.4092.(2)根据箱产量的频率分布直方图得列联表由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法产量的中位数的估计值为50+≈52.35(kg). 15.解:(1)该校学生的每天平均阅读时间为10×+30×+50×+70×+90×+110×=1.6+6+12+15.4+12.6+4.4=52(分钟).(2)由频数分布表得“阅读达人”的人数是11+7+2=20(人),根据等高条形图得2×2列联表如下:K2==≈4.327,由于4.327<6.635,故没有99%的把握认为“阅读达人”跟性别有关. 16.解:(1) 变量x与y是负相关.(2)由题中表格易得=11,=38,c==-≈-2.0,d=-c=38--×11≈60,∴=-2.0w+60=-2.0x2+60.(3)当<20时,-2.0x2+60<20,即x>2≈4.5,∴为了放心食用该蔬菜,估计需要用4.5千克的清水清洗一千克蔬菜.
相关试卷
这是一份高考数学一轮复习考点测试刷题本48 双曲线(含答案解析),共8页。
这是一份高考数学一轮复习考点测试刷题本47 椭圆(含答案解析),共8页。
这是一份高考数学一轮复习考点测试刷题本46 圆与方程(含答案解析),共6页。