人教版新课标A选修2-3第三章 统计案例综合与测试一课一练
展开一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.有以下五组变量:
①某商品的销售价格与销售量;
②学生的学号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮的销售量;
⑤电瓶车的质量和行驶每千米的耗电量.
其中两个变量成正相关关系的是( )
A.①③B.②④C.②⑤D.④⑤
2.在一项调查中有两个变量x和y,如图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是( )
A.y=a+bxB.y=c+dx
C.y=m+nx2D.y=p+qcx(q>0)
3.已知四个命题:
①在回归分析中,R2可以用来刻画回归效果,R2的值越大,模型的拟合效果越好;
②在独立性检验中,随机变量K2的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程y^=0.2x+12中,当解释变量x每增加1个单位时,预报变量y^平均增加1个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1.
其中真命题是( )
A.①④B.②④C.①②D.②③
4.下图是变量x,y的散点图,现拟合模型为直线l1,在5个(x,y)数据中去掉D(3,10)后,重新拟合模型为直线l2,给出下列说法:①相关系数r变大;②相关指数R2变大;③残差平方和变小;④解释变量x与预报变量y的相关性变强.其中正确说法的个数为( )
A.1B.2C.3D.4
5.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,用最小二乘法建立的回归方程为y^=-5x+150,则下列结论正确的是( )
A.y与x具有正的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=-5
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
6.在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,x3,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-13x+2上,则这组样本数据的相关系数为( )
A.-13B.13C.1D.-1
7.下图是变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程:y^=b1x+a1,样本相关系数为r1;方案二:剔除点(10,32),根据剩下数据,得到经验回归方程:y^=b2x+a2,样本相关系数为r2,则( )
A.0
根据上表可得y与x之间的回归方程为y^=9.4x+9.1,则实数a的值为( )
A.37.3B.38C.39D.39.5
9.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则K2的观测值可能为( )
10.为了考察两个变量x和y之间的线性相关性,甲和乙两位同学各自独立做了10次和15次试验,并且利用最小二乘法求得回归直线分别为l1,l2.已知两人所得的试验数据中,变量x和y的数据的平均值都相等,分别是s,t,则下列说法正确的是( )
A.直线l1和l2一定有公共点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.必有直线l1∥l2
D.l1和l2必定重合
11.1972年调查某桑场采桑人员和不采桑人员的桑毛虫皮炎发病情况,结果如表所示,利用列联表的独立性检验估计“患桑毛虫皮炎病与采桑”是否有关.
附:由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)算得k=113×(18×78-12×5)230×83×23×90≈39.6011.
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过1%的前提下,认为“患桑毛虫皮炎病与采桑”有关
B.在犯错误的概率不超过1%的前提下,认为“患桑毛虫皮炎病与采桑”无关
C.有99.9%以上的把握认为“患桑毛虫皮炎病与采桑”有关
D.有99.9%以上的把握认为“患桑毛虫皮炎病与采桑”无关
12.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表,并计算得到k≈19.05.
下列小波对地区A天气判断不正确的是( )
A.夜晚下雨的概率约为12
B.未出现“日落云里走”夜晚下雨的概率为514
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中横线上)
13.下列是关于男婴与女婴出生调查的列联表:
单位:人
那么A= ,B= ,C= ,D= ,E= .
14.已知具有相关关系的两个随机变量的一组观测数据所对应的点均匀分布在函数y=3e2x+1的图象附近,则可通过转换得到的线性回归方程为 .
15.某工厂为研究某种产品产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了4组对应数据(x,y),如下表所示:
根据表中数据,得出y关于x的线性回归方程为y^=0.7x+a.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为 .
16.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行实验,得到如下列联表:
参照附表,在犯错误的概率最多不超过 的前提下,可认为“注射疫苗”与“感染流感”有关系.
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)某校高三(1)班在一次语文测试结束后,发现同学们在背诵内容方面失分较为严重.为了提升背诵效果,班主任倡议大家在早、晩读时间站起来大声诵读,为了解同学们对站起来大声诵读的态度,对全班50名同学进行调查,将调查结果进行整理后制成下表:
(1)欲使测试优秀率为30%,则优秀分数线应定为多少分?
(2)依据(1)的结果及样本数据研究是否赞成站起来大声诵读的态度与测试成绩是否优秀的关系,列出2×2列联表,并判断是否有90%的把握认为赞成与否的态度与成绩是否优秀有关系.
参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
18.(本小题满分12分)随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:
(1)若该小区私家车的数量y与年份编号x的关系可用线性回归模型来拟合,请求出y关于x的线性回归方程,并用相关指数R2分析其拟合效果(R2精确到0.01);
(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位?
参考数据:∑i=16yi=936,∑i=16xiyi=4081,∑i=16xi2=91,∑i=16(yi-y)2=37586.
附:回归方程中斜率和截距的最小二乘估计分别为b^=∑i=1nxiyi-nx·y∑i=1nxi2-nx2,a^=y-b^x,相关指数R2=1-∑i=1n(yi-y^i)2∑i=1n(yi-y)2,残差e^=y-y^.
19.(本小题满分12分)为普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.
(1)求a的值;
(2)估计这100名学生的平均成绩(同一组中的数据用该组区间的中点值为代表);
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”.
参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
20.(本小题满分12分)在微博知名美食视频某博主的引领下,大家越来越向往田园生活,一大型餐饮企业拟对一个生态农家乐进行升级改造,加入大量的农耕活动以及自己制作农产品活动,根据市场调研与模拟,得到升级改造投入x(万元)与升级改造直接收益y(万元)的数据统计如下:
当0
(1)根据下列表格中的数据,比较当0
附:刻画回归效果的相关指数R2=1-∑i=1n(yi-y^i)2∑i=1n(yi-y)2,17≈4.1.用最小二乘法求线性回归方程y^=b^x+a^的斜率和截距分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y-b^x.
21.(本小题满分12分)司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门随机调查了100名机动车司机,并得到以下统计结果:在55名男性司机中,开车时使用手机的有40人,不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,不使用手机的有25人.
(1)试完成“开车时是否使用手机与司机的性别”的2×2列联表,并判断是否有99.5%的把握认为“开车时使用手机与司机的性别”有关;
(2)用上述样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望E(X).
参考数据与公式:
K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
22.(本小题满分12分)根据公安部交管局下发的通知,自2020年6月1日起,将在全国开展“一盔一带”安全守护行动,其中就要求骑行摩托车、电动车需要佩戴头盔,为的就是让大家重视交通安全.某地交警部门根据某十字路口的监测数据,从通过该路口的骑行者中随机抽查了200人,得到如图所示的列联表:
(1)是否有97.5%的把握认为骑行者自觉戴头盔行为与性别有关?
(2)通过一定的宣传和相关处罚措施出台后,交警在一段时间内通过对某路口不戴头盔的骑行者统计,得到如下的散点图和数据:
观察散点图,发现两个变量不具有线性相关关系,现考虑用函数y=a+bx对两个变量的关系进行拟合,通过分析得y与1x有一定的线性相关关系,并得到以下参考数据其中w=1x:
请选择合适的参考数据求出y关于x的回归方程.
参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nuv∑i=1nui2-nu2,α^=v-β^u.
本章达标检测
一、选择题
1.D ①销售价格越高,销售量通常会越低,所以不是正相关关系;②学生的数学成绩与学号无关;③医学证明不吃早餐的人容易患胃病,因此吃早餐的人数和患胃病的人数之间是负相关关系;④气温越高,冷饮销量越高,故是正相关关系;⑤电瓶车越重,耗电量越大,所以是正相关关系.故选D.
2.B 散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.
3.C 对于①,在回归分析中,R2可以用来刻画回归效果,R2的值越大,模型的拟合效果越好,正确;对于②,在独立性检验中,随机变量K2的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回归方程y^=0.2x+12中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位,错误;对于④,两个随机变量相关性越强,则相关系数的绝对值越接近于1,错误.故选C.
4.D 由题意,散点图有5个(x,y)的数据,去掉D(3,10)后,可得y与x的相关性变强,并且是正相关,所以相关系数r变大,相关指数R2变大,残差平方和变小,所以四个命题都正确.故选D.
5.D 由回归方程y^=-5x+150可知y与x具有负的线性相关关系,故A错误;|r|≤1,故B错误;当销售价格为10元/件时,销售量约为-5×10+150=100件,故C错误,D正确.
6.D 由题意可得这两个变量具有负相关性,故这组样本数据的样本相关系数为负值,又所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-13x+2上,∴其相关系数r=-1.故选D.
7.A 观察散点图可知,变量x和y呈现正相关,所以0
可看出经验回归方程y^=b2x+a2拟合数据效果更好,所以r2更接近1.
所以0
由回归直线必过样本点的中心(x,y),得129+a4=9.4×3.5+9.1,解得a=39,故选C.
9.C 因为有99%的把握但没有99.9%的把握,所以K2的观测值区间范围为[6.635,10.828),因此K2的观测值可能为7.869,故选C.
10.A 回归直线必过样本点的中心,故选A.
11.C ∵k≈39.6011>10.828,∴有99.9%以上的把握认为“患桑毛虫皮炎病与采桑”有关.故选C.
12.D 由题表可知100天中有50天下雨,50天未下雨,因此下雨的概率约为50100=12,A中判断正确;未出现“日落云里走”夜晚下雨的概率为2525+45=514,B中判断正确;k≈19.05>10.828,因此有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,C中判断正确;有关只是说可能性,不代表一定下雨,D中判断错误.故选D.
二、填空题
13.答案 47;92;88;82;53
解析 ∵45+E=98,∴E=53.
∵E+35=C,∴C=88.
∵98+D=180,∴D=82.
∵A+35=D,∴A=47.
∵45+A=B,∴B=92.
14.答案 u^=1+ln3+2x
解析 由y=3e2x+1,得lny=ln(3e2x+1),即lny=ln3+2x+1.
令u=lny,则线性回归方程为u^=1+ln3+2x.
15.答案 5.9
解析 根据样本(4,3)处的残差为-0.15,即3-(0.7×4+a)=-0.15,可得a=0.35,即回归方程为y^=0.7x+0.35,又由样本数据的平均数x=3+4+6+74=5,y=2.5+3+4+m4,所以0.7×5+0.35=2.5+3+4+m4,
解得m=5.9.
16.答案 0.05
解析 由题得K2的观测值k=100(10×30-40×20)250×50×30×70=10021≈4.762>3.841,所以犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.
三、解答题
17.解析 (1)因为测试的优秀率为30%,所以测试成绩优秀的人数为50×30%=15,由题表数据知,优秀分数线应定为125分.(4分)
(2)由(1)知,测试成绩优秀的学生有15人,其中“赞成的”有10人;
测试成绩不优秀的学生有50-15=35人,其中“赞成的”有22人.(6分)
由此可列出2×2列联表如下:
(8分)
∴K2的观测值k=50×(10×13-5×22)215×35×32×18=25378≈0.066<2.706,
因此,没有90%的把握认为赞成与否的态度与成绩是否优秀有关系.(10分)
18.解析 (1)由题意可得x=16×(1+2+3+4+5+6)=3.5,y=16×936=156.(2分)
b^=∑i=16xiyi-6x-y-∑i=16xi2-6x2=4081-6×3.5×15691-6×3.52=46,a^=y-b^x=156-46×3.5=-5.
∴y关于x的线性回归方程为y^=46x-5.(4分)
x=1时,y^=41,x=2时,y^=87,
x=3时,y^=133,x=4时,y^=179,
x=5时,y^=225,x=6时,y^=271.
∴∑i=16(yi-y^i)2=556.∴R2=1-∑i=16(yi-y^i)2∑i=16(yi-y)2=1-55637586≈0.99,(6分)
相关指数R2近似为0.99,接近1,说明拟合效果较好.(8分)
(2)在(1)中求得的线性回归方程中,取x=9,可得y^=46×9-5=409.(11分)
故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位.(12分)
19.解析 (1)由题可得(0.005+0.010+0.020+0.030+a+0.010)×10=1,解得a=0.025.(3分)
(2)平均成绩为45×0.05+55×0.1+65×0.2+75×0.3+85×0.25+95×0.1=74.(7分)
(3)在抽取的100名学生中,比赛成绩优秀的有100×0.35=35人,由此可得完整的2×2列联表如下:
(9分)
∵K2的观测值k=100×(10×25-40×25)250×50×35×65=90091≈9.890<10.828,(11分)
∴没有99.9%的把握认为“比赛成绩是否优秀与性别有关”.(12分)
20.解析 (1)由题表数据,知182.4>79.2,即182.4∑i=17(yi-y)2>79.2∑i=17(yi-y)2,
所以模型①的R2小于模型②,说明回归模型②的拟合效果更好.(3分)
所以当x=17时,升级改造直接收益的预测值为
y^=21.3×17-14.4≈21.3×4.1-14.4=72.93.(5分)
(2)由已知可得x-20=1+2+3+4+55=3,
所以x=23.(6分)
y-60=8.5+8+7.5+6+65=7.2,
所以y=67.2.(7分)
所以a^=y+0.7x=67.2+0.7×23=83.3.(8分)
所以当x>17时,y与x满足的线性回归方程为y^=-0.7x+83.3.
所以当x=20时,升级改造直接收益的预测值y^=-0.7×20+83.3=69.3.(10分)
所以当x=20时,实际收益的预测值为69.3+10=79.3,
因为79.3>72.93,
所以升级改造投入20万元时,公司的实际收益更大.(12分)
21.解析 (1)根据题意可得2×2列联表如下:
(2分)
∵K2的观测值k=100×(40×25-15×20)255×45×60×40≈8.249>7.879,∴有99.5%的把握认为“开车时使用手机与司机的性别”有关.(4分)
(2)由(1)中表格可知,随机抽检1辆机动车,其司机为男性且开车时使用手机的概率为40100=25.(5分)
由题意可知,X的所有可能取值是0,1,2,3,且X~B3,25,
∴P(X=0)=C30250353=27125,
P(X=1)=C31251352=54125,
P(X=2)=C32252351=36125,
P(X=3)=C33253350=8125.(8分)
∴X的分布列为
(10分)
数学期望E(X)=3×25=1.2.(12分)
22.解析 (1)由列联表得K2的观测值k=200×(30×70-90×10)2120×80×40×160=4.6875<5.024.(2分)
故没有97.5%的把握认为骑行者自觉戴头盔行为与性别有关.(4分)
(2)由w=1x,得y=a+bx可转化为y=a+bw,(6分)
由y=3066=51,
得b^=∑i=16wiyi-6wy∑i=16wi2-6w2≈173.8-6×0.41×511.492-6×0.1681=,(9分)
则a^=y-b^w≈51-100×0.41=10.(11分)
故y关于x的回归方程为y^=10+100w=10+100x.(12分)
零件数量x(个)
2
3
4
5
加工时间y(分钟)
26
a
49
54
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
采桑
不采桑
总计
患者人数
18
12
30
健康人数
5
78
83
总计
23
90
113
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
夜晚天气,日落云里走
下雨
未下雨
出现
25
5
未出现
25
45
P(K2≥k0)
0.10
0.05
0.010
0.001
k0
2.706
3.841
6.635
10.828
晚上出生
白天出生
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
x
3
4
6
7
y
2.5
3
4
m
感染
未感染
总计
注射
10
40
50
未注射
20
30
50
总计
30
70
100
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
测试
分数
[85,95)
[95,105)
[105,115)
[115,125)
[125,135)
[135,
145]
频数
5
10
15
5
10
5
赞成
人数
4
6
9
3
6
4
P(K2≥k0)
0.100
0.050
0.025
0.010
k0
2.706
3.841
5.024
6.635
年份
2014
2015
2016
2017
2018
2019
编号x
1
2
3
4
5
6
数量y(辆)
41
96
116
190
218
275
优秀
非优秀
总计
男生
40
女生
50
总计
100
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
x
2
3
4
6
8
10
13
21
22
23
24
25
y
13
22
31
42
50
56
58
68.5
68
67.5
66
66
回归模型
模型①
模型②
回归方程
y^=4.1x+11.8
y^=21.3x-14.4
∑i=17(yi-y^i)2
182.4
79.2
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
戴头盔
不戴头盔
总计
男性
30
90
120
女性
10
70
80
总计
40
160
200
天数
1
2
3
4
5
6
人数
110
60
44
34
30
28
x
w
x2
w2
∑i=16xi2
∑i=16wi2
∑i=16xiyi
∑i=16wiyi
∑i=16yi
3.5
0.41
12.25
0.1681
91
1.492
816
173.8
306
P(K2≥k0)
0.050
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
1.D
2.B
3.C
4.D
5.D
6.D
7.A
8.C
9.C
10.A
11.C
12.D
赞成
不赞成
总计
优秀
10
5
15
不优秀
22
13
35
总计
32
18
50
优秀
非优秀
总计
男生
10
40
50
女生
25
25
50
总计
35
65
100
开车时
使用手机
开车时
不使用手机
总计
男性司机
40
15
55
女性司机
20
25
45
总计
60
40
100
X
0
1
2
3
P
27125
54125
36125
8125
高中数学人教版新课标A选修2-1第三章 空间向量与立体几何综合与测试一课一练: 这是一份高中数学人教版新课标A选修2-1第三章 空间向量与立体几何综合与测试一课一练,共24页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
人教版新课标A选修2-3第二章 随机变量及其分布综合与测试课时练习: 这是一份人教版新课标A选修2-3第二章 随机变量及其分布综合与测试课时练习,共14页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高中数学人教版新课标A选修2-31.3二项式定理课堂检测: 这是一份高中数学人教版新课标A选修2-31.3二项式定理课堂检测,共5页。试卷主要包含了4的展开式中x3的系数为等内容,欢迎下载使用。