新人教A版高考数学二轮复习专题十一概率与统计4抽样方法与总体分布的估计综合集训含解析
展开抽样方法与总体分布的估计
基础篇
【基础集训】
考点一 随机抽样
1.在简单随机抽样中,某一个个体被抽到的可能性 ( )
A.与第n次有关,第一次可能性最大
B.与第n次有关,第一次可能性最小
C.与第n次无关,与抽取的第几个样本有关
D.与第n次无关,每次可能性相等
答案 D
2.某单位员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是,则该单位员工总数为( )
A.110 B.100 C.900 D.800
答案 B
3.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据(相同号码数只算一次),则第四个被选中的红色球的号码为 ( )
81 | 47 | 23 | 68 | 63 | 93 | 17 | 90 | 12 | 69 | 86 | 81 | 62 | 93 | 50 | 60 | 91 | 33 | 75 | 85 | 61 | 39 | 85 |
06 | 32 | 35 | 92 | 46 | 22 | 54 | 10 | 02 | 78 | 49 | 82 | 18 | 86 | 70 | 48 | 05 | 46 | 88 | 15 | 19 | 20 | 49 |
A.12 B.33 C.06 D.16
答案 C
4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人.
答案 10
考点二 用样本估计总体
5.(多选题)“科技引领,布局未来”科技研发是企业发展的驱动力量.2007—2018年,某企业连续12年累计研发投入达4100亿元,我们将研发投入与经营投入的比值记为研发投入占营收比,这12年间的研发投入(单位:十亿元)用图中的条形图表示,研发投入占营收比用图中的折线图表示.根据折线图和条形图,下列结论正确的有 ( )
A.2012年至2013年研发投入占营收比增量相比2017年至2018年研发投入占营收比增量大
B.2013年至2014年研发投入增量相比2015年至2016年研发投入增量小
C.该企业连续12年来研发投入逐年增加
D.该企业连续12年来研发投入占营收比逐年增加
答案 ABC
6.甲、乙两组数据如茎叶图所示,则甲、乙两组数据的平均数、方差、极差及中位数相同的是 ( )
A.极差 B.方差 C.平均数 D.中位数
答案 C
7.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1℃,则甲地该月5天11时的气温数据的标准差为 ( )
甲 |
| 乙 |
9 8 | 2 | 6 8 9 |
2 m 0 | 3 | 1 1 |
A.2 B. C.10 D.
答案 B
8.某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两幅频率分布直方图:
已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t的关系式为y=若以上面数据的频率作为概率,分别从用A配方和B配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为 ( )
A.0.125 B.0.195 C.0.215 D.0.235
答案 B
9.某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为 ( )
A.20,2 B.24,4 C.25,2 D.25,4
答案 C
10.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为 ( )
A.5,2 B.16,2 C.16,18 D.16,9
答案 C
[教师专用题组]
【基础集训】
考点一 随机抽样
1.(2020云南名校10月高考适应性月考,3)某学校为了解1000名新生的近视情况,将这些学生编号为000,001,002,…,999,从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是 ( )
A.008号学生 B.200号学生 C.616号学生 D.815号学生
答案 C 由题意得抽样间隔为=10,因为036号学生被抽到,所以被抽中的初始编号为006号,之后被抽到的编号均是10的整数倍与6的和,故选C.
2.(2019河南新乡模拟,4)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:
| 不喜欢 | 喜欢 |
男性青年观众 | 30 | 10 |
女性青年观众 | 30 | 50 |
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n= ( )
A.12 B.16 C.24 D.32
答案 C 由分层抽样的性质得=,解得n=24.故选C.
3.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为 ( )
A.73 B.78 C.77 D.76
答案 B 样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.(类似于等差数列中的第16项的求法)
考点二 用样本估计总体
1.(2020四川双流中学10月月考,4)一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本[40,60)内的数据个数为 ( )
分组 | [10,20) | [20,30) | [30,40) |
|
频数 | 3 | 4 | 5 |
|
A.14 B.15 C.16 D.17
答案 B 本题考查频数的求法,涉及频率分布表等基础知识,考查推理论证能力、运算求解能力,考查化归与转化思想,函数与方程思想,属于基础题.
由于一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,所以样本中数据在[20,60)上的频数为30×0.8=24,故估计样本在[40,60)内的数据个数为24-4-5=15.故选B.
2.(2018河北承德期末,3)某城市收集并整理了该市2017年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.
已知该城市各月的最低气温与最高气温具有较好的线性关系,根据折线图,下列结论错误的是 ( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0℃的月份有4个
答案 D 在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0℃的月份有3个,故D错误.故选D.
3.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为 .
答案 50
解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为S,则中间一个小矩形面积为S,∴S+S=1,解得S=,∴中间一个小矩形的面积等于S=,故该组的频数为200×=50.
4.(2020河南洛阳尖子生第一次联合考试,13)已知样本x1,x2,…,x2019的平均数和方差分别是1和4,若yi=axi+b(i=1,2,…,2019)的平均数和方差也是1和4,则ab= .
答案 1
解析 因为x1,x2,…,x2019的平均数为1,所以yi=axi+b(i=1,2,…,2019)的平均数为a×1+b=1.因为x1,x2,…,x2019的方差为4,所以yi=axi+b(i=1,2,…,2019)的方差为4a2=4.所以解得或所以ab=1.
导师点睛 本题考查平均数与方差的线性变换,难度一般.已知x1,x2,…,xn的平均数与方差为A与B,那么yi=axi+b(i=1,2,…,n)的平均数与方差为aA+b与a2B.
综合篇
【综合集训】
考法一 频率分布直方图的应用
1.(2020福建毕业班质量检查测试)某市为了解居民用水情况,通过抽样得到部分家庭月均用水量的数据,制出频率分布直方图(如图).若以频率代替概率,从该市随机抽取5个家庭,则月均用水量在8~12吨的家庭个数X的数学期望为 ( )
A.3.6 B.3 C.1.6 D.1.5
答案 B
2.(2020广东广州阶段训练)某企业质量检验员为了检测生产线上零件的情况,从生产线上随机抽取了80个零件进行测量,根据所测量的零件尺寸(单位:mm),得到如下的频率分布直方图.
(1)根据频率分布直方图,求这80个零件尺寸的中位数(结果精确到0.01);
(2)已知尺寸在[63.0,64.5)内的零件为一等品,否则为二等品,将这80个零件尺寸的样本频率视为概率,从生产线上随机抽取1个零件,试估计所抽取的零件是二等品的概率.
3.(2019安徽六安第二中学联考,19)每年5月到7月是芒果的成熟季节.某大学校内种植了很多食用芒果树.据该校后勤处负责人介绍,他们校内的芒果种植过程中没有使用过农药,也没有路边那种绿化芒的污染,可以放心食用.2018年该校的芒果也迎来了大丰收.6月25日,该校南北校区集中采摘芒果,并将采摘到的芒果免费派送给学校师生.现随机从一些芒果树上摘下100个芒果,其质量分布在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400)(单位:克)内,经统计得频率分布直方图如图所示.
(1)现按分层抽样从质量在[250,300),[300,350)内的芒果中随机抽取9个,再从这9个中随机抽取3个,记随机变量X表示质量在[300,350)内的芒果个数,求X的分布列及数学期望;
(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,假如你是经销商去收购芒果,该校当时还未摘下的芒果大约还有10000个,现提供如下两种收购方案:
A:所有芒果以10元/千克收购;
B:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购.
通过计算确定你会选择哪种方案.
4.(2020山东潍坊临朐综合模拟,20)“过元宵节,吃元宵”是我国过元宵节的一大习俗.2019年元宵节前夕,北方一城市某质检部门随机抽取了100包某种品牌的元宵,检测其某项质量指标值,所得频率分布直方图如下:
(1)求所抽取的100包元宵该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);
(2)①由直方图可以认为,元宵的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布求Z落在(14.55,38.45]内的概率;
②将频率视为概率,若某人从某超市购买了4包这种品牌的元宵,记这4包元宵中这种质量指标值位于(10,30)内的包数为X,求X的分布列和均值.
附:计算得所抽查的这100包元宵的质量指标值的标准差σ≈11.95;若ξ~N(μ,σ2),则P(μ-σ<ξ≤μ+σ)=0.6826,P(μ-2σ<ξ≤μ+2σ)=0.9544.
考法二 样本的数字特征及其应用
5.(2019上海浦东期中教学质量检测(二模),10)已知6个正整数,它们的平均数是5,中位数是4,唯一众数是3,则这6个数方差的最大值为 .(精确到小数点后一位)
答案 12.3
6.(2020河北邯郸空中课堂备考检测)某小型水库的管理部门为研究库区水量的变化情况,决定安排两个小组在同一年中各自进行观察研究.其中一个小组研究水源涵养情况,他们通过观察入库的若干小溪和降雨量等因素,随机记录了100天的日入库水量数据(单位:千立方米),得到下面的条形图(如图甲),另一小组研究由于放水、蒸发或渗漏造成的水量消失情况,他们通过观察与水库相连的特殊小泥塘的水面下降情况来研究库区水的整体消失量,随机记录了100天的库区日消失水量数据(单位:千立方米),并将观测数据整理成频率分布直方图(如图乙).
图甲
图乙
(1)据此估计这一年中日消失水量的平均值;
(2)以频率作为概率,试解决如下问题:
①分别估计日流入水量不少于20千立方米和日消失水量不多于20千立方米的概率;
②试估计经过一年后,该水库的水量是增加了还是减少了,变化的量是多少?(一年按365天计算)
[教师专用题组]
【综合集训】
考法一 频率分布直方图的应用
1.(2018陕西榆林第二中学模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为 .
答案 100
解析 由频率分布直方图可得支出的钱数在[30,40)的同学有0.038×10n=0.38n个,支出的钱数在[10,20)的同学有0.012×10n=0.12n个,又支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,所以0.38n-0.12n=0.26n=26,∴n=100.
2.(2018江西新余二模,18)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45),得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户,五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(i)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ii)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解析 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=≈32,则中位数为32.
(3)(i)5个年龄组成绩的平均数为=×(93+96+97+94+90)=94,方差为=×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为=×(93+98+94+95+90)=94,方差为=×[(-1)2+42+02+12+(-4)2]=6.8.
(ii)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.(感想合理即可)
考法二 样本的数字特征及其应用
- (2017广东广雅中学、江西南昌二中联考,4)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段性考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是 ( )
甲组 |
| 乙组 |
8 | 7 | 9 |
6 4 8 | 8 | 3 n 8 |
5 m 2 | 9 | 2 2 5 |
A.10 B.11 C.12 D.13
答案 C ∵甲组学生成绩的平均数是88,
∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,
∵乙组学生成绩的中位数是89,∴n=9,
∴m+n=12.故选C.
2.(2018湖南衡阳二模,4)已知样本x1,x2,…,xn的平均数为x,样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0<a<,则n,m(n,m∈N*)的大小关系为 ( )
A.n=m B.n≥m C.n<m D.n>m
答案 C 由题意得z=(nx+my)=x+y,
∴a=,∵0<a<,∴0<<,
又n,m∈N*,∴2n<n+m,∴n<m.故选C.
3.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则 ( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
答案 A ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴==4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2==<2,故选A.
4.(2018河北石家庄教学质量检测(二),9)某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.
①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;
②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;
③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;
④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.
其中正确结论的编号为 ( )
A.①④ B.②③ C.②④ D.①③
答案 A A班兴趣小组的平均成绩为=78,
其方差为×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,
则其标准差为≈11.03;
B班兴趣小组的平均成绩为=66,
其方差为×[(45-66)2+(48-66)2+…+(91-66)2]=175.2,
则其标准差为≈13.23.故选A.
37_专题十一114抽样方法与总体分布的估计(习题+十年高考): 这是一份37_专题十一114抽样方法与总体分布的估计(习题+十年高考),文件包含1_114抽样方法与总体分布的估计习题docx、1_114抽样方法与总体分布的估计十年高考docx等2份试卷配套教学资源,其中试卷共45页, 欢迎下载使用。
新人教A版高考数学二轮复习专题十一概率与统计4抽样方法与总体分布的估计专题检测含解析: 这是一份新人教A版高考数学二轮复习专题十一概率与统计4抽样方法与总体分布的估计专题检测含解析,共2页。试卷主要包含了故选A等内容,欢迎下载使用。
新人教A版高考数学二轮复习专题十一概率与统计1随机事件古典概型与几何概型综合集训含解析: 这是一份新人教A版高考数学二轮复习专题十一概率与统计1随机事件古典概型与几何概型综合集训含解析,共21页。