所属成套资源:2024版.新高考版 数学专题训练
37_专题十一114抽样方法与总体分布的估计(习题+十年高考)
展开
这是一份37_专题十一114抽样方法与总体分布的估计(习题+十年高考),文件包含1_114抽样方法与总体分布的估计习题docx、1_114抽样方法与总体分布的估计十年高考docx等2份试卷配套教学资源,其中试卷共45页, 欢迎下载使用。
11.4 抽样方法与总体分布的估计
基础篇
考点一 随机抽样
1.(2022济南一模,3)某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1 200棵,比例如图所示,高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的棵数为( )
A.34 B.46 C.50 D.70
答案 C
2.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
图1
图2
A.200,20 B.100,20
C.200,10 D.100,10
答案 A
3.(2023届重庆南开中学质检,13)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层随机抽样的方法进行抽检.已知该校部门A、部门B、部门C分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则从部门A抽检的人数为 .
答案 20
考点二 用样本估计总体
考向一 总体百分位数的估计
1.(2023届长沙市一中月考二,2)一学习小组10名学生的某次数学测试成绩的名次由小到大分别是2,4,5,x,11,14,15,39,41,50,已知该小组数学测试成绩名次的40%分位数是9.5,则x的值是( )
A.6 B.7 C.8 D.9
答案 C
2.(2023届重庆八中入学考,2)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如表所示:
党史学习时间(小时)
7
8
9
10
11
党员人数
6
10
9
7
8
则该单位党员一周学习党史时间的众数及第50百分位数分别是( )
A.8,8.5 B.8,8 C.9,8 D.8,9
答案 D
3.(2022辽宁六校联考,5)一样本的频率分布直方图如图所示,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15 C.16 D.17
答案 A
4.(2023届山东高密三中月考,15)数据:1,2,2,3,4,5,6,6,7,8的中位数为m,60%分位数为a,则m= ,a= .
答案 4.5 5.5
考向二 总体趋势的估计
1.(2023届重庆南开中学月考,5)某中学的高一、高二、高三三个年级学生的平均身高分别为x,y,z,若按年级采用分层随机抽样的方法抽取了一个600人的样本,抽到高一、高二、高三年级的学生人数分别为100、200、300,则估计该高中学生的平均身高为( )
A.16x+13y+12z B.x+y+z2
C.12x+13y+16z D.x+y+z3
答案 A
2.(2020课标Ⅲ文,3,5分)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
答案 C
3.(多选)(2021新高考Ⅱ,9,5分)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有( )
A.x1,x2,…,xn的标准差
B.x1,x2,…,xn的中位数
C.x1,x2,…,xn的极差
D.x1,x2,…,xn的平均数
答案 AC
4.(多选)(2022江苏泰州二调,9)已知一组数据x1,x2,…,xn的平均数为x0,若在这组数据中添加一个数据x0,得到一组新数据x0,x1,x2,…,xn,则( )
A.这两组数据的平均数相同
B.这两组数据的中位数相同
C.这两组数据的标准差相同
D.这两组数据的极差相同
答案 AD
5.(多选)(2022湖南衡阳八中开学考,9)某学校为研究高三学生的思想政治考试成绩,根据高三第一次模拟考试在高三学生中随机抽取50名学生的思想政治考试成绩绘制成频率分布直方图,如图所示,已知思想政治成绩在[80,90)的学生人数为15,把频率看作概率,根据频率分布直方图,下列结论正确的是( )
A.a=0.03
B.b=0.034
C.本次思想政治考试成绩平均分的估计值为80
D.从高三学生中随机抽取4人,其中3人成绩在[90,100]内的概率为C430.163×(1-0.16)
答案 ABD
6.(2022湖北部分重点中学联考,20)某高校为了解全校学生的阅读情况,随机调查了200名学生的每周阅读时间x(单位:小时)并绘制成如图所示的频率分布直方图.
(1)求这200名学生每周阅读时间的样本平均数x和样本方差s2(同一组的数据用该组区间中点值作代表);
(2)由直方图可以看出,目前该校学生每周的阅读时间x大致服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.
①一般正态分布N(μ,σ)的概率都可以转化为标准正态分布N(0,1)的概率进行计算:若X~N(μ,σ2),令Y=X−μσ,则Y~N(0,1),且P(X≤a)=PY≤a−μσ,利用直方图得到的正态分布求P(X≤10);
②从该高校的学生中随机抽取20名,记Z表示这20名学生中每周阅读时间超过10小时的人数,求Z的均值.
参考数据:178≈403,若Y~N(0,1),则P(Y≤0.75)=0.773 4.
解析 (1)根据频率分布直方图知,阅读时间在区间[5.5,6.5),[6.5,7.5),[7.5,8.5),[8.5,9.5),[9.5,10.5),[10.5,11.5),[11.5,12.5]内的频率分别为0.03,0.1,0.2,0.35,0.19,0.09,0.04,
x=6×0.03+7×0.1+8×0.2+9×0.35+10×0.19+11×0.09+12×0.04=9,
s2=(6-9)2×0.03+(7-9)2×0.1+(8-9)2×0.2+(9-9)2×0.35+(10-9)2×0.19+(11-9)2×0.09+(12-9)2×0.04=1.78,
所以样本平均数x和样本方差s2分别为9,1.78.
(2)①由(1)知μ=9,σ2=1.78,则有X~N(9,1.78),
σ=1.78=17810≈43,P(X≤10)=PY≤ 10−943=P(Y≤0.75)=0.773 4.
②由①知P(X>10)=1-P(X≤10)=0.226 6,可得Z~B(20,0.226 6),
所以Z的均值E(Z)=20×0.226 6=4.532.
综合篇
考法一 用统计图估计样本的数字特征
1.(2023届贵州遵义新高考协作体入学质量监测,3)某同学利用暑假积极参加社会实践活动,帮助湄潭翠芽经销商进行促销,该同学在两周内的每日促销量如图所示,根据此折线图,下面结论中正确的是( )
A.这14天的促销量的中位数大于200
B.这14天促销量超过200的天数所占比例大于50%
C.这14天内,促销量的极差小于200
D.前7天促销量的方差小于后7天促销量的方差
答案 C
2.(2022全国甲,理2,文2,5分)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案 B
3.(2021全国甲理,2,5分)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是 ( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
答案 C
4.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
5. (多选)(2022山东济宁三模,9)在某市高三年级举行的一次模拟考试中,某学科共有
20 000人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图如图所示.其中,成绩落在区间[50,60)内的人数为16,则下列结论正确的是( )
A.样本容量n=1 000
B.图中x=0.030
C.估计该市全体学生成绩的平均分为70.6分
D.该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号
答案 BC
6.(2022新高考Ⅱ,19,12分)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).
解析 (1)平均年龄为(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×
0.002)×10=47.9(岁).
(2)设事件A=“该地区一位这种疾病患者的年龄位于区间[20,70)”,则P(A)=1-P(A)=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.
(3)设事件B=“任选一人年龄位于区间[40,50)”,事件C=“任选一人患这种疾病”,由条件概率公式可得
P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.001 437 5≈0.001 4.
7.(2019课标Ⅲ理,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解析 (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
考法二 样本的数字特征及其应用
1.(多选)(2021新高考Ⅰ,9,5分)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
答案 CD
2.(2022福州期末,3)已知甲、乙、丙、丁、戊五位同学高一入学时年龄的平均数、中位数均为16,方差为0.8,则三年后,下列判断错误的是( )
A.这五位同学年龄的平均数变为19
B.这五位同学年龄的中位数变为19
C.这五位同学年龄的方差仍为0.8
D.这五位同学年龄的方差变为3.8
答案 D
3.(多选)(2022山东青岛三模,9)某渔业养殖场新进1 000尾鱼苗,测量其体长(单位:毫米),将所得数据分成6组,其分组及频数情况如表:
分组(单位:毫米)
[70,
75)
[75,
80)
[80,
85)
[85,
90)
[90,
95)
[95,
100]
频数
100
100
m
350
150
n
已知在按以上6个分组作出的频率分布直方图中,[95,100]分组对应小矩形的高为0.01,则下列说法正确的是( )
A.m=250
B.鱼苗体长在[90,100]内的频率为0.16
C.鱼苗体长的中位数一定落在区间[85,90)内
D.从这批鱼苗中有放回地连续抽取50次,每次一条,则所抽取鱼苗体长落在区间[80,90)内的次数的期望为30
答案 ACD
4.(多选)(2022湖北八市联考,9)立德中学举行党史知识竞赛,对全校参赛的1 000名学生的得分情况进行了统计,把得分数据按照[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )
A.图中x的值为0.020
B.这组数据的极差为50
C.得分在80分及以上的人数为400
D.这组数据的平均数的估计值为77
答案 ACD
5.(多选)(2022辽宁大连模拟,10)甲、乙两人进行飞镖游戏,甲的10次成绩分别为8,6,7,7,8,10,10,9,7,8,乙的10次成绩的平均数为8,方差为0.4,则( )
A.甲的10次成绩的极差为4
B.甲的10次成绩的75%分位数为8
C.甲和乙的20次成绩的平均数为8
D.甲和乙的20次成绩的方差为1
答案 ACD
6.(多选)(2023届福建部分名校联考,9)某环保局对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若连续10天,每天空气质量指数(单位:μg/m3)不超过100,则认为该地区环境治理达标,否则认为该地区环境治理不达标.根据连续10天检查所得数据的数字特征推断,环境治理一定达标的地区是( )
A.甲地区:平均数为80,方差为40
B.乙地区:平均数为50,众数为40
C.丙地区:中位数为50,极差为60
D.丁地区:极差为10,80%分位数为90
答案 AD
7.(2022湖北襄阳五中阶段练,14)若已知30个数x1,x2,…,x30的平均数为6,方差为9;现从原30个数中剔除x1,x2,…,x10这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数x11,x12,…,x30的方差为 .
答案 8
8.(2022福建漳州一模,13)某校体育节10名旗手的身高(单位:厘米)分别为175.0,178.0,176.0,180.0,179.0,175.0,176.0,179.0,180.0,179.0,则中位数为 .
答案 178.5
9.(2022济南二模,13)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是 (写出一个满足条件的m的值即可).
答案 7或8或9或10(填任意一个均可)
10.(2023届湖北摸底联考,15)利用分层随机抽样的方法,调研某校高二年级学生某次数学测验的成绩(满分100分),获得样本数据的特征量如表:
人数
平均成绩
方差
男生
32
70
16
女生
8
80
36
则总样本的平均分为 ,方差为 .
参考公式:n个数x1,x2,x3,…,xn的平均数为x=1ni=1nxi,方差为s2=1ni=1n(xi-x)2=1n[(x12+x22+…+xn2)-nx2]
参考数据:8×(36+802)+32×(16+702)-40×722=1 440.
答案 72 36
11.(2022山东烟台、德州一模,17)2022年2月4日至20日,第24届冬季奥林匹克运动会在北京成功举办.这场冰雪盛会是运动健儿奋力拼搏的舞台,也是中外文明交流互鉴的舞台,折射出我国更加坚实的文化自信,诠释着新时代中国的从容姿态,传递出中华儿女与世界人民“一起向未来”的共同心声.某学校统计了全校学生观看北京冬奥会开幕式和闭幕式的时长情况(单位:分钟),并根据样本数据绘制得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值,并估计样本数据的85%分位数;
(2)采用样本量比例分配的分层随机抽样方式,从观看时长在[200,280]的学生中抽取6人.若从这6人中随机抽取3人在全校交流观看体会,设抽取的3人中观看时长在[200,240)的人数为X,求X的分布列和数学期望.
解析 (1)因为40×(0.000 5+0.002×2+2a+0.006+0.006 5)=1,解得a=0.004.结合已知得观看时长在200分钟以下的占比为40×(0.000 5+0.002+0.004+0.006+0.006 5)=0.76,观看时长在240分钟以下的占比为0.76+40×0.004=0.92,所以85%分位数位于[200,240)内, 85%分位数为200+40×0.85−0.760.92−0.76=222.5.
(2)因为观看时长[200,240)、[240,280]对应的频率分别为0.16,0.08,
所以采用分层随机抽样的方式在两个区间中应分别抽取4人和2人.所以抽取的3人中观看时长在[200,240)中的人数X的所有可能取值为1,2,3.P(X=1)=C41·C22C63=15,P(X=2)=C42·C21C63=35,P(X=3)=C43C63=15,
所以X的分布列为
X
1
2
3
P
15
35
15
所以E(X)=1×15+2×35+3×15=2.
相关试卷
这是一份新高考数学一轮复习提升练习考向50 抽样方法与总体分布的估计 (含解析),共1页。试卷主要包含了系统抽样,频率分布表的画法,茎叶图,中位数、众数、平均数的定义,样本的数字特征,情况的判断如下等内容,欢迎下载使用。
这是一份38_专题十一115变量间的相关关系、统计案例(习题+十年高考+检测),文件包含11_11-专题十一概率与统计检测docx、1_115变量间的相关关系统计案例docx、1_115变量间的相关关系统计案例十年高考docx等3份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。
这是一份36_专题十一113二项分布与正态分布(习题+十年高考),文件包含1_113二项分布与正态分布习题docx、1_113二项分布与正态分布十年高考docx等2份试卷配套教学资源,其中试卷共37页, 欢迎下载使用。