高考数学二轮复习专题检测15 统计、统计案例 含解析
展开这是一份高考数学二轮复习专题检测15 统计、统计案例 含解析,共11页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
专题检测(十五) 统计、统计案例
A组——“6+3+3”考点落实练
一、选择题
1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )
A.73 B.78
C.77 D.76
解析:选B 样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.
2.(2019届高三·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.100,20 B.200,20
C.200,10 D.100,10
解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.
3.从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知( )
A.估计体重的众数为50或60
B.a=0.03
C.学生体重在[50,60)有35人
D.从这100名男生中随机抽取一人,体重在[60,80)的概率为
解析:选C 根据频率分布直方图知,最高的小矩形对应的底边中点为=55,所以估计众数为55,A错误;根据频率和为1,计算(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,B错误;体重在[50,60)内的频率是0.35,估计体重在[50,60)内的学生有100×0.35=35人,C正确;体重在[60,80)内的频率为0.3+0.2=0.5,用频率估计概率,知这100名男生中随机抽取一人,体重在[60,80)的概率为,D错误.
4.如图是民航部门统计的2018年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )
A.深圳的变化幅度最小,北京的平均价格最高
B.深圳和厦门的春运期间往返机票价格同去年相比有所下降
C.平均价格从高到低居于前三位的城市为北京、深圳、广州
D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门
解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.
5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( )
A.13,12 B.13,13
C.12,13 D.13,14
解析:选B 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=a=64,(8-2d)(8+4d)=64,即2d-d2=0,又d≠0,故d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为=13,中位数为=13.
6.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知i=225,i=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
解析:选C 由题意可知=4x+,
又=22.5,=160,
因此160=22.5×4+,解得=70,
所以=4x+70.
当x=24时,=4×24+70=166.
二、填空题
7.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________.
解析:把10场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为=15.
答案:15
8.已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为________.
解析:根据方差的性质可知,a2×2=8,故a=2.
答案:2
9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
| 女 | 男 | 总计 |
喜爱 | 40 | 20 | 60 |
不喜爱 | 20 | 30 | 50 |
总计 | 60 | 50 | 110 |
试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.
参考附表:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
解析:分析列联表中数据,可得K2的观测值k=≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.
答案:0.01 99%
三、解答题
10.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);
(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?
解:(1)由频率分布直方图可知,
(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.03.
所以参加高中数学竞赛的考生的成绩的平均数为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,
成绩的众数为75.
设参加高中数学竞赛的考生的成绩的中位数为x,
则0.1+0.15+0.15+(x-70)×0.03=0.5,解得x≈73.3,
所以中位数为73.3.
(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为=,
所以各分数段抽取人数依次为2,3,3,6,5,1.
11.(2018·长春质量检测)某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400](单位:克)中,经统计得频率分布直方图如图所示.
(1)经计算估计这组数据的中位数;
(2)某经销商来收购芒果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10 000个,经销商提出如下两种收购方案:
A方案是所有芒果以10元/千克收购;
B方案是对质量低于250克的芒果以2元/个收购,高于或等于250克的芒果以3元/个收购.
通过计算确定该种植园选择哪种方案获利更多.
解:(1)这组数据的中位数是250+=268.75.
(2)A方案可获利:
(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)× 50×10 000×10×0.001=25 750(元).
B方案可获利:
(0.002+0.002+0.003)×50×10 000×2+(0.008+0.004+0.001)×50×10 000×3= 26 500(元).
由于25 750<26 500,因此该种植园选择B方案获利更多.
12.(2018·广东七校联考)某淘宝店经过对“十一”七天假期的消费情况进行统计,发现在金额不超过1 000元的消费者中男女之比约为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表:
女性消费情况:
消费 金额/元 | (0,200) | [200,400) | [400,600) | [600,800) | [800,1 000] |
人数 | 5 | 10 | 15 | 47 | 3 |
男性消费情况:
消费 金额/元 | (0,200) | [200,400) | [400,600) | [600,800) | [800,1 000] |
人数 | 2 | 3 | 10 | 3 | 2 |
若消费金额不低于600元的消费者称为“网购达人”、低于600元的消费者称为“非网购达人”.
(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?
(2)根据以上统计数据填写如下2×2列联表,并回答能否在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.
| 女性 | 男性 | 总计 |
“网购达人” |
|
|
|
“非网购达人” |
|
|
|
总计 |
|
|
|
附:K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 |
解:(1)女性消费的平均数为×(100×5+300×10+500×15+700×47+900×3)=582.5(元).
男性消费的平均数为×(100×2+300×3+500×10+700×3+900×2)=500(元).
虽然女性消费者的平均消费水平较高,但“女网购达人”的平均消费水平(为712元)低于“男网购达人”的平均消费水平(为780元),所以平均消费水平高的一方“网购达人”出手不一定更阔绰.
(2)2×2列联表如下表:
| 女性 | 男性 | 总计 |
“网购达人” | 50 | 5 | 55 |
“非网购达人” | 30 | 15 | 45 |
总计 | 80 | 20 | 100 |
K2=≈9.091,
因为9.091>7.879,
所以在犯错误的概率不超过0.005的前提下可以认为“是否为‘网购达人’与性别有关”.
B组——大题专攻补短练
1.2017年8月22日金乡县首届“诚信文艺奖”评选暨2017“百姓大舞台”第一季大型才艺大赛决赛在红星美凯龙举行.在比赛现场,12名专业人士和12名观众代表分别组成评判小组A,B,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图.
(1)求A组数据的众数和极差,B组数据的中位数;
(2)对每一组计算用于衡量相似性的数值,回答:小组A与小组B哪一个更像是由专业人士组成的?并说明理由.
解:(1)由茎叶图可得:A组数据的众数为47,极差为55-42=13;
B组数据的中位数为=56.5.
(2)小组A更像是由专业人士组成的.理由如下:
小组A,B数据的平均数分别为
A=×(42+42+44+45+46+47+47+47+49+50+50+55)=47,
B=×(36+42+46+47+49+55+58+62+66+68+70+73)=56,
所以小组A,B数据的方差分别为
s=×[(42-47)2+(42-47)2+…+(55-47)2]=×(25+25+9+4+1+4+9+9+64)=12.5,
s=×[(36-56)2+(42-56)2+…+(73-56)2]=×(400+196+100+81+49+1+4+36+100+144+196+289)=133.
因为s<s,所以小组A的成员的相似程度高.由于专业裁判给分更符合专业规则,相似程度应该更高,因此小组A更像是由专业人士组成的.
2.(2019届高三·武汉部分学校调研)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)估计旧养殖法的箱产量低于50 kg的概率并估计新养殖法的箱产量的平均值;
(2)填写下面的2×2列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.
| 箱产量<50 kg | 箱产量≥50 kg | 总计 |
旧养殖法 |
|
|
|
新养殖法 |
|
|
|
总计 |
|
|
|
附:K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
|
|
|
|
解:(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,所以旧养殖法的箱产量低于50 kg的概率估计值为0.62;新养殖法的箱产量的平均值为37.5×0.004×5+42.5×0.020×5+47.5×0.044×5+52.5×0.068×5+57.5×0.046×5+62.5×0.010×5+67.5×0.008×5=52.35.
(2)根据箱产量的频率分布直方图得2×2列联表如下:
| 箱产量<50 kg | 箱产量≥50 kg | 总计 |
旧养殖法 | 62 | 38 | 100 |
新养殖法 | 34 | 66 | 100 |
总计 | 96 | 104 | 200 |
由表中数据得K2=≈15.705,
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
3.(2018·广州高中综合测试)某地1~10岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i=1,2,…,10)如下表:
x/岁 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
y/cm | 76.5 | 88.5 | 96.8 | 104.1 | 111.3 | 117.7 | 124.0 | 130.0 | 135.4 | 140.2 |
对上表的数据作初步处理,得到下面的散点图及一些统计量的值.
(xi-)2 | (yi-)2 | (xi-)(yi-) | ||
5.5 | 112.45 | 82.50 | 3 947.71 | 566.85 |
(1)求y关于x的线性回归方程(回归方程系数精确到0.01);
(2)某同学认为y=px2+qx+r更适宜作为y关于x的回归方程模型,他求得的回归方程是=-0.30x2+10.17x+68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?
附:回归方程=+x中的斜率和截距的最小二乘估计分别为
=,=-.
解:(1)由所给数据得==≈6.87,
=-=112.45-6.87×5.5≈74.67,
所以y关于x的线性回归方程为=6.87x+74.67.
(2)若回归方程为=6.87x+74.67,则当x=11时,=150.24.
若回归方程为=-0.30x2+10.17x+68.07,则当x=11时,=143.64.
|143.64-145.3|=1.66<|150.24-145.3|=4.94,
所以回归方程=-0.30x2+10.17x+68.07的拟合效果更好.
4.(2018·潍坊统一考试)某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
(xi-)2 | (xi-)(yi-) | (ui-)2 | (ui-)(yi-) | |||
15.25 | 3.63 | 0.269 | 2 085.5 | -230.3 | 0.787 | 7.049 |
表中ui=,=i.
(1)根据散点图判断:y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01).
(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线=+ω的斜率和截距的最小二乘估计分别为=,=-.
解:(1)由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程.
(2)令u=,先建立y关于u的线性回归方程,
由于==≈8.957≈8.96,
∴=-·=3.63-8.957×0.269≈1.22,
∴y关于u的线性回归方程为=1.22+8.96u,
∴y关于x的回归方程为=1.22+.
(3)假设印刷x千册,依题意得10x-x≥78.840,∴x≥10,
∴至少印刷10 000册才能使销售利润不低于78 840元.
相关试卷
这是一份新高考数学一轮复习题型归纳讲义专题16统计与统计案例 16.2统计案例(含解析),共24页。试卷主要包含了2 统计案例,7x+0,5,2,85,5t,,32,tiyi=40,33﹣0,83,76等内容,欢迎下载使用。
这是一份高考数学二轮复习核心专题讲练:统计与概率第1讲 统计和统计案例(含解析),共67页。试卷主要包含了总体平均数与样本平均数,分层随机抽样的步骤,总体集中趋势的估计,总体离散程度的估计,相关关系的强弱等内容,欢迎下载使用。
这是一份新人教A版高考数学二轮复习专题十一概率与统计5变量间的相关关系统计案例专题检测含解析,共1页。