所属成套资源:2022年高考北师大版数学一轮复习全套试卷资料
北师大版高考数学一轮复习第十一章 §11.2 随机抽样、用样本估计总体
展开
这是一份北师大版高考数学一轮复习第十一章 §11.2 随机抽样、用样本估计总体,共19页。试卷主要包含了5×0,又甲、乙两组数据的平均数相等,等内容,欢迎下载使用。
1.随机抽样
(1)简单随机抽样
①简单随机抽样时,要保证每个个体被抽到的概率相同.
②通常采用的简单随机抽样的方法:抽签法和随机数法.
(2)系统抽样
系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.
(3)分层抽样
①定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
②分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
2.用样本的频率分布估计总体分布
(1)在频率分布直方图中,纵轴表示eq \f(fi,Δxi),数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.
(3)茎叶图
茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:eq \x\t(x)=eq \f(x1+x2+…+xn,n),反映了一组数据的平均水平.
(4)标准差:是样本数据到平均数的一种平均距离,s=eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]).
(5)方差:s2=eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2](xn是样本数据,n是样本容量,eq \x\t(x)是样本平均数).
微思考
1.三种抽样方法有什么共同点和联系?
提示 (1)抽样过程中每个个体被抽取的机会均等.
(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样.
2.平均数、标准差与方差反映了数据的哪些特征?
提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
题组一 思考辨析
1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.( × )
(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )
(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( √ )
题组二 教材改编
2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )
A.33,34,33 B.25,56,19
C.20,40,30 D.30,50,20
答案 B
解析 设在不到35岁的员工中抽取x人,则eq \f(100,500)=eq \f(x,125),所以x=25,同理可得这三个年龄段抽取人数分别为25,56,19.
3.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( )
A.7,7 B.8,7.5
C.7,7.5 D.8,6
答案 C
解析 从表中数据可知7环有7人,人数最多,所以众数是7;
中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是eq \f(7+8,2)=7.5.
4.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.
答案 25
解析 0.5×0.5×100=25.
题组三 易错自纠
5.已知一组数据的频率分布直方图如图,则众数是______,平均数是________.
答案 65 67
解析 因为最高小长方形中点的横坐标为65,
所以众数为65;
平均数eq \x\t(x)=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.
6.若数据x1,x2,x3,…,xn的平均数eq \x\t(x)=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.
答案 16,18
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴eq \f(x1+x2+x3+…+xn,n)=5,
∴eq \f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
题型一 抽样方法
1.(2020·吉安模拟)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( )
附:第6行至第9行的随机数表如下:
2635 7900 3370 9160 1620 3882 7757 4950
3211 4919 7306 4916 7677 8733 9974 6732
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
A.33 B.16 C.38 D.20
答案 D
解析 按随机数法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.
2.(2019·全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
答案 C
解析 根据题意,系统抽样是等距抽样,
所以抽样间隔为eq \f(1 000,100)=10.
因为46除以10余6,
所以抽到的号码都是除以10余6的数,
结合选项知,616号学生被抽到.
3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为24,16,8.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )
A.3 B.4 C.5 D.6
答案 B
解析 根据分层抽样的特点可知,抽样比为eq \f(12,48)=eq \f(1,4),则应抽取的中型城市数为16×eq \f(1,4)=4.
思维升华 (1)简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回的抽样.(2)系统抽样又称等距抽样,号码序列一旦确定,样本即确定了,但要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.(3)分层抽样适用于总体中个体差异较大的情况.(4)抽样方法经常交叉使用,比如系统抽样中的某一均衡部分,可采用简单随机抽样,分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.
题型二 统计图表及应用
命题点1 扇形图
例1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
故选A.
命题点2 折线图
例2 下面两个图是2020年6月25日由国家卫健委发布的全国疫情累计趋势图,每图下面横向标注日期,纵向标注累计数量.现存确诊为存量数据,计算方法为:累计确诊数-累计死亡数-累计治愈数.
则下列对新冠肺炎叙述错误的是( )
A.自1月20日以来一个月内,全国累计确诊病例属于快速增长时期
B.自4月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制
C.自6月16日至24日以来,全国每日现存确诊病例平缓增加
D.自6月16日至24日以来,全国每日现存确诊病例逐步减少
答案 D
解析 由图1可知A,B均正确;由图2数据计算得16日的现存确诊病例为84 867-79 926-4 645=296,同理可计算18,20,22,24日现存确诊分别为346,383,441,473.
命题点3 茎叶图
例3 如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为( )
A.3,5 B.5,5 C.3,7 D.5,7
答案 A
解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均数相等,
∴eq \f(1,5)×(56+65+62+74+70+x)=eq \f(1,5)×(59+61+67+65+78),∴x=3.故选A.
命题点4 频率分布直方图
例4 (2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49),并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )
A.10 B.18 C.20 D.36
答案 B
解析 因为直径落在区间[5.43,5.47]内的频率为
0.02×(6.25+5.00)=0.225,
所以个数为0.225×80=18.
思维升华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(4)准确理解频率分布直方图的数据特点:
①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
跟踪训练1 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查,得到的数据如图2.下列说法错误的是( )
A.样本容量为240
B.若m=50,则本次自主学习学生的满意度不低于四成
C.总体中对方式二满意的学生约为300人
D.样本中对方式一满意的学生为24人
答案 B
解析 选项A,样本容量为6 000×4%=240,该选项正确;选项B,根据题意得自主学习的满意率为eq \f(600+300+1 250,6 000)≈0.358
相关试卷
这是一份2024年数学高考大一轮复习第十一章 §11.3 用样本估计总体,共5页。
这是一份2024年数学高考大一轮复习第十一章 §11.3 用样本估计总体,共6页。试卷主要包含了会用统计图表对总体进行估计,8,则三年后,下列判断错误的是等内容,欢迎下载使用。
这是一份2024年数学高考大一轮复习第十一章 §11.2 随机抽样、统计图表,共7页。