全国版2021届高考数学二轮复习专题检测十二统计统计案例文含解析
展开一、选择题
1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )
A.73 B.78
C.77 D.76
解析:选B 样本的分段间隔为eq \f(80,16)=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.
2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
解析:选A 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.
3.(2019·广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量y(单位:kW·h)与气温x(单位:℃)之间的关系,随机选取了4天的用电量与当天气温,并制作了如下对照表:
由表中数据得线性回归方程:eq \(y,\s\up6(^))=-2x+60,则a的值为( )
A.48 B.62
C.64 D.68
解析:选C 由题意,得x=eq \f(17+14+10-1,4)=10,y=eq \f(24+34+38+a,4)=eq \f(96+a,4).样本点的中心(x,y)在回归直线eq \(y,\s\up6(^))=-2x+60上,代入线性回归方程可得eq \f(96+a,4)=-20+60,解得a=64,故选C.
4.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )
A.深圳的变化幅度最小,北京的平均价格最高
B.深圳和厦门的春运期间往返机票价格同去年相比有所下降
C.平均价格从高到低居于前三位的城市为北京、深圳、广州
D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门
解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.
5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( )
A.13,12 B.13,13
C.12,13 D.13,14
解析:选B 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=aeq \\al(2,3)=64,(8-2d)(8+4d)=64,即2d-d2=0,又d≠0,故d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为eq \f((4+22)×5,10)=13,中位数为eq \f(12+14,2)=13.
6.(2019·成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:
①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;
②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;
③从最近五场比赛的得分看,乙比甲更稳定;
④从最近五场比赛的得分看,甲比乙更稳定.
其中所有正确结论的编号为( )
A.①③ B.①④
C.②③ D.②④
解析:选C 对于①,甲得分的中位数为29,乙得分的中位数为30,错误;
对于②,甲得分的平均数为eq \f(1,5)×(25+28+29+31+32)=29,乙得分的平均数为eq \f(1,5)×(28+29+30+31+32)=30,正确;
对于③,甲得分的方差为eq \f(1,5)×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=eq \f(1,5)×(16+1+0+4+9)=6,
乙得分的方差为eq \f(1,5)×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=eq \f(1,5)×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.所以正确结论的编号为②③.
二、填空题
7.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
解析:x=eq \f(10×0.97+20×0.98+10×0.99,10+20+10)=0.98.
则经停该站高铁列车所有车次的平均正点率的估计值为0.98.
答案:0.98
8.(2019·安徽五校联盟第二次质检)数据a1,a2,a3,…,an的方差为σ2,则数据2a1,2a2,2a3,…,2an的方差为________.
解析:设a1,a2,a3,…,an的平均数为a,则2a1,2a2,2a3,…,2an的平均数为2a,
σ2=eq \f((a1-a)2+(a2-a)2+(a3-a)2+…+(an-a)2,n).
则2a1,2a2,2a3,…,2an的方差为
eq \f((2a1-2a)2+(2a2-2a)2+(2a3-2a)2+…+(2an-2a)2,n)=
4×eq \f((a1-a)2+(a2-a)2+(a3-a)2+…+(an-a)2,n)=4σ2.
答案:4σ2
9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.
参考附表:
eq \b\lc\(\rc\)(\a\vs4\al\c1(参考公式:K2=\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d))
解析:分析列联表中数据,可得K2的观测值k=eq \f(110×(40×30-20×20)2,60×50×60×50)≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.
答案:0.01 99%
三、解答题
10.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
11.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);
(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?
解:(1)由频率分布直方图可知,
(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.03.
所以参加高中数学竞赛的考生的成绩的平均数为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,
成绩的众数为75.
设参加高中数学竞赛的考生的成绩的中位数为x,
则0.1+0.15+0.15+(x-70)×0.03=0.5,解得x≈73.3,
所以中位数为73.3.
(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为eq \f(20,60)=eq \f(1,3),
所以各分数段抽取人数依次为2,3,3,6,5,1.
12.(2019·沈阳市质量监测(一))某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:
(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差.
(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?
解:(1)训练后得分的中位数为eq \f(14+15,2)=14.5;
平均得分为eq \f(8+9+12+14+14+15+16+18+21+23,10)=15;
方差为eq \f(1,10)[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.
(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.
B组——大题专攻强化练
1.(2019·武汉市调研测试)一个工厂在某年里连续10个月每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:
(1)通过画散点图,发现可用线性回归模型拟合y与x的关系,请用相关系数加以说明.
(2)①建立月总成本y与月产量x之间的回归方程;
②通过建立的y关于x的回归方程,估计某月产量为1.98万件时,产品的总成本为多少万元?(均精确到0.001)
附注:①参考数据:eq \i\su(i=1xi=14.45,∑10,i=1,10,y)i=27.31,
eq \r(\i\su(i=1,10,x)eq \\al(2,i)-10x2)≈0.850,eq \r(\i\su(i=1,10,y)eq \\al(2,i)-10y2)≈1.042,eq \(b,\s\up6(^))≈1.223.
②参考公式:相关系数
回归直线eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为:
解:(1)由已知条件得,
r=eq \(b,\s\up6(^))·eq \f(\r(\i\su(i=1,10,x)eq \\al(2,i)-10x2),\r(\i\su(i=1,10,y)eq \\al(2,i)-10y2)),
∴r=1.223×eq \f(0.850,1.042)≈0.998,
这说明y与x正相关,且相关性很强.
(2)①由已知求得x=1.445,y=2.731,
eq \(a,\s\up6(^))=y-eq \(b,\s\up6(^))x=2.731-1.223×1.445≈0.964,
∴所求回归直线方程为eq \(y,\s\up6(^))=1.223x+0.964.
②当x=1.98时,y=1.223×1.98+0.964≈3.386(万元),
此时产品的总成本约为3.386万元.
2.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)估计旧养殖法的箱产量低于50 kg的概率并估计新养殖法的箱产量的平均值;
(2)填写下面的2×2列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.
附:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.
解:(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,所以旧养殖法的箱产量低于50 kg的概率估计值为0.62;新养殖法的箱产量的平均值为37.5×0.004×5+42.5×0.020×5+47.5×0.044×5+52.5×0.068×5+57.5×0.046×5+62.5×0.010×5+67.5×0.008×5=52.35.
(2)根据箱产量的频率分布直方图得2×2列联表如下:
由表中数据得K2=eq \f(200×(62×66-34×38)2,100×100×96×104)≈15.705,
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
3.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计分别为:
解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)(ⅰ)剔除异常数据,即3月份的数据后,得
x=eq \f(1,5)×(7×6-6)=7.2,
y=eq \f(1,5)×(30×6-31.8)=29.64.
(ⅱ)把x=18代入(ⅰ)中所求回归方程得eq \(y,\s\up6(^))=3×18+8.04=62.04,故预报值为62.04万元.
4.每年10月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技兴趣小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了100颗小麦种子的发芽数,得到了如下数据:
(1)请根据统计的最后三组数据,求出y关于x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
(2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠;
(3)若100颗小麦种子的发芽数为n颗,则记n%的发芽率,当发芽率为n%时,平均每亩地的收益为10n元,某农场有土地10万亩,小麦种植期间昼夜温差大约为9 ℃,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.
附:在线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中,eq \(b,\s\up6(^))=
解:(1)∵x=eq \f(11+13+12,3)=12,y=eq \f(85+90+86,3)=87,
∴eq \(b,\s\up6(^))=eq \f(11×85+13×90+12×86-3×12×87,112+132+122-3×122)=eq \f(5,2),
由eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))=y,即eq \f(5,2)×12+eq \(a,\s\up6(^))=87,得eq \(a,\s\up6(^))=57,
∴线性回归方程为eq \(y,\s\up6(^))=eq \f(5,2)x+57.
(2)当x=8时,eq \(y,\s\up6(^))=eq \f(5,2)×8+57=77,与实际值79比较,误差没有超过两颗;
当x=10时,eq \(y,\s\up6(^))=eq \f(5,2)×10+57=82,与实际值81比较,误差也没有超过两颗.
所以(1)中得到的线性回归方程eq \(y,\s\up6(^))=eq \f(5,2)x+57是可靠的.
(3)由eq \(y,\s\up6(^))=eq \f(5,2)x+57得,当x=9时,eq \(y,\s\up6(^))=79.5,即每亩地的收益大约为795元,所以该农场种植小麦所获得的收益大约为7 950万元.
x(单位:℃)
17
14
10
-1
y(单位:kW·h)
24
34
38
a
女
男
总计
喜爱
40
20
60
不喜爱
20
30
50
总计
60
50
110
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
x
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
箱产量<50 kg
箱产量≥50 kg
总计
旧养殖法
新养殖法
总计
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
箱产量<50 kg
箱产量≥50 kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
x
y
7
30
1 464.24
364
温差x(℃)
8
10
11
13
12
发芽数y(颗)
79
81
85
90
86
高考数学二轮复习核心专题讲练:统计与概率第1讲 统计和统计案例(含解析): 这是一份高考数学二轮复习核心专题讲练:统计与概率第1讲 统计和统计案例(含解析),共67页。试卷主要包含了总体平均数与样本平均数,分层随机抽样的步骤,总体集中趋势的估计,总体离散程度的估计,相关关系的强弱等内容,欢迎下载使用。
高考数学二轮复习专题检测15 统计、统计案例 含解析: 这是一份高考数学二轮复习专题检测15 统计、统计案例 含解析,共11页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
新人教A版高考数学二轮复习专题十一概率与统计5变量间的相关关系统计案例专题检测含解析: 这是一份新人教A版高考数学二轮复习专题十一概率与统计5变量间的相关关系统计案例专题检测含解析,共1页。