所属成套资源:高考数学第一轮复习复习(精品讲义)
高考数学第一轮复习复习第1节 随机抽样、统计图表(讲义)
展开
这是一份高考数学第一轮复习复习第1节 随机抽样、统计图表(讲义),共28页。
第1节 随机抽样、统计图表
[课程标准要求]
1.理解随机抽样的必要性和重要性,了解获取数据的基本途径及相关概念,会用简单随机抽样和分层随机抽样从总体中抽取样本.
2.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、条形图和扇形图,理解它们各自的特点.
1.全面调查和抽样调查
样本与样本容量是两个不同的概念.样本是从总体中抽出的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.
2.简单随机抽样
(1)简单随机抽样的概念
(2)两种常见的简单随机抽样方法
①抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
②随机数法
(ⅰ)定义:先把总体中的个体编号,用随机数工具产生总体范围内的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
(ⅱ)产生随机数的方法:a.用随机试验生成随机数,b.用信息技术生成随机数.
3.分层随机抽样
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.
分层随机抽样中,每层抽取的个体的比例是相同的.
4.画频率分布直方图的步骤
(1)求极差:极差是一组数据中最大值与最小值的差.
(2)决定组距与组数:当样本量不超过100时,常分成5~12组,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列,即分组、频数累计、频数、频率.其中频数合计应是样本量,频率合计是1.
(5)画频率分布直方图:横轴表示样本数据,纵轴表示频率组距.
画频率分布直方图时,纵坐标表示频率与组距的比值,而不是频率.
5.其他统计图表
1.对于简单随机抽样和分层随机抽样,不论哪种抽样方法,总体中的每一个个体被抽到的概率是相等的.
2.频率分布直方图中,小长方形的高=频率组距;小长方形的面积=组距×频率组距=频率;各个小长方形的面积的总和等于1.
1.为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( D )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
解析:因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.
2.把过期的药品随意丢弃,会造成对土壤和水体的污染,危害人们的健康.如何处理过期药品,有关机构随机对若干家庭进行调查,调查结果如图,其中对过期药品处理不正确的家庭达到( D )
A.79%B.80%
C.18%D.82%
解析:79%+1%+2%=82%.
3.(2022·河北石家庄高三二模)某中学高一、高二、高三年级的学生人数分别为1 200,1 000,800,为迎接春季运动会的到来,根据要求,按照年级人数进行分层随机抽样,抽选出30名志愿者,则高一年级应抽选的人数为 .
解析:高一年级应抽选的人数为
1 2001 200+1 000+800×30=12.
答案:12
4.如图是100名居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有 人.
解析:由频率分布直方图可知,月均用水量在[2,2.5)范围内的居民所占频率为0.50×0.5=0.25,所以月均用水量在[2,2.5)范围内的居民人数为100×0.25=25.
答案:25
简单随机抽样
1.下列抽样方法是简单随机抽样的是( B )
A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动
B.从10个手机中逐个不放回地随机抽取2个进行质量检验
C.从空间直角坐标系中随机抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查
解析:对于A,从200名医生中,挑选出50名最优秀的医生,它不是“逐个随机”抽取,所以不是简单随机抽样,同理,D也不是;
对于B,从10个手机中逐个不放回地随机抽取 2个,是简单随机抽样;
对于C,从空间直角坐标系中随机抽取10个点作为样本,总体是无限的,不是简单随机抽样.
2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为 .
解析:由题意知9n-1=13,
得n=28,
所以整个抽样过程中每个个体被抽到的概率为
1028=514.
答案:514
应用简单随机抽样应注意的问题
(1)被抽取的样本总体的个体数有限.
(2)逐个抽取.
(3)是等可能抽取.
分层随机抽样
1.某公司生产A,B,C三种不同型号的轿车,产量之比依次为2∶3∶4,为检验该公司的产品质量,用分层随机抽样的方法抽取一个容量为n的样本,若样本中A型号的轿车比B型号的轿车少8辆,则n等于( B )
A.96B.72C.48D.36
解析:设样本中A型号车为x辆,
则B型号为(x+8)辆,
则xx+8=23,解得x=16,即A型号车为16辆,
则22+3+4=16n,解得n=72.
2.某工厂生产A,B,C三种不同型号的产品,某月生产这三种产品的数量之比依次为2∶a∶3,现用分层随机抽样的方法抽取一个容量为120的样本,已知B种型号产品抽取了60件,则a等于( C )
A.3B.4C.5D.6
解析:因为用分层随机抽样的方法抽取一个容量为120的样本,B种型号产品抽取了60件,即抽取了B种型号的产品恰好占一半,因为某工厂生产A,B,C三种不同型号的产品,某月生产产品数量之比依次为2∶a∶3,所以(2+3)∶a=1∶1,解得a=5.
3.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?下列说法错误的是( B )
A.甲应付5141109钱
B.乙应付3224109钱
C.丙应付1656109钱
D.三者中甲付的钱最多,丙付的钱最少
解析:由分层随机抽样可知,
100÷(560+350+180)=10109,
则甲应付10109×560=5141109钱;
乙应付10109×350=3212109钱;
丙应付10109×180=1656109钱.
在分层随机抽样中,抽样比=样本容量总体容量=各层样本容量各层个体总量.根据这个抽样比,可以直接求出各层抽取的样本数,也可以据此列方程求解有关未知量.
统计图表
扇形图
[例1] 某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为了更好地了解该地区的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到扇形图如图所示.
下列结论错误的是( )
A.新农村建设后,养殖收入增加
B.新农村建设后,种植收入减少
C.新农村建设后,养殖收入与种植收入的总和超过了经济收入的一半
D.新农村建设后,其他收入是建设前的4倍
解析:设建设前经济收入为1,建设后经济收入为2,可算出建设前后各部分收入.建设前养殖收入为1×0.3=0.3,建设后养殖收入为2×0.3=0.6,故A正确;建设前种植收入为1×0.6=0.6,建设后种植收入为2×0.38=0.76,故B错误;建设后养殖收入与种植收入比例总和为0.3+0.38=0.68>0.5,超过经济收入一半,故C正确;建设前其他收入为1×0.02=0.02,建设后其他收入为2×0.04=0.08,其他收入是建设前的4倍,故D正确.故选B.
折线图
[例2] (多选题)某企业2022年12个月的收入与支出数据的折线图如图所示.
已知:利润=收入-支出,根据该折线图,下列说法正确的是( )
A.该企业2022年1月至6月的总利润低于2022年7月至12月的总利润
B.该企业2022年第一季度的利润约是60万元
C.该企业2022年4月至7月的月利润持续增长
D.该企业2022年11月份的月利润最大
解析:由企业2022年12个月的收入与支出数据的折线图,得该企业2022年1月至6月的总利润约为(30+40+35+30+50+60)-(20+25+10+20+22+30)=118,该企业2022年7月至12月的总利润约为(80+75+75+80+90+80)-(28+22+30+40+45+50)=265,
所以该企业2022年1月至6月的总利润低于2022年7月至12月的总利润,故A正确;该企业2022年第一季度的利润约是(30+40+35)-(20+25+10)=50,故B错误;该企业2022年4月至7月的月利润(单位:万元)分别为10,28,30,52,所以该企业2022年4月至7月的月利润持续增长,故C正确;该企业2022年7月和8月的月利润比11月份的月利润大,故D错误.故选AC.
折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
频率分布直方图
[例3] 某社区为了解该社区退休老人每天的平均户外活动时间,从该社区退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:h),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.
(1)求图中a的值;
(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;
(3)在[1,1.5),[1.5,2)这两组中采用分层随机抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.
解:(1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.
同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,
由1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a,解得a=0.30.
(2)设中位数为m时.
因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.20=0.47
13 390,故A正确;因为4 257>4 237,所以2021年的稻谷产量比2020年的稻谷产量高,故B错误;2020年和2021年的薯类所占比例都为4.46%,故C正确;由统计图可得2021年的各类粮食产量中,增长量最大的是玉米,故D错误.
10.(多选题)(2022·广东深圳模拟)根据第七次全国人口普查结果,女性人口约为68 844万人,总人口性别比(以女性为100,男性对女性的比例)为105.07,与2010年第六次全国人口普查基本持平.根据下面历次人口普查人口性别构成统计图,下列说法正确的是( AC )
A.近20年来,我国总人口性别比呈递减趋势
B.历次人口普查,2000年我国总人口性别比最高
C.根据第七次全国人口普查总人口性别比,估计男性人口为72 334万人
D.根据第七次全国人口普查总人口性别比,估计男性人口为73 334万人
解析:近20年来,我国总人口性别比呈递减趋势,所以A正确;由统计图数据知,历次人口普查,1953年我国总人口性别比最高,所以B错误;根据第七次全国人口普查总人口性别比,设男性人口为x,x68 844=
105.07100,x≈72 334,则估计男性人口为72 334万人,故C正确,D错误.
11.统计局就某地居民的月收入情况调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)元).
(1)求月收入在[3 000,3 500)的频率;
(2)根据频率分布直方图估计样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层随机抽样的方法抽出100人作进一步分析,求月收入在[2 500,3 000)的应抽取多少人.
解:(1)月收入在[3 000,3 500)的频率为
0.000 3×(3 500-3 000)=0.15.
(2)由频率分布直方图知,中位数在[2 000,2 500)内,设中位数为x,
则0.000 2×500+0.000 4×500+0.000 5×(x-2 000)=0.5,
解得x=2 400,
所以根据频率分布直方图估计样本数据的中位数为2 400.
(3)居民月收入在[2 500,3 000)的频率为
0.000 5×(3 000-2 500)=0.25,
所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=
2 500,
再从10 000人中用分层随机抽样方法抽出100人,则月收入在
[2 500,3 000)的应抽取2 500×1001 0000=25(人).
12.一个经销鲜花产品的店铺,为保障售出的百合花品质,每天从某省鲜花基地空运固定数量的百合花,如有剩余则免费分赠给第二天的购花顾客,如果不足,则从本地鲜花供应商处进货.今年四月前10天,该店百合花的售价为每枝2元,某省空运来的百合花每枝进价1.6元,本地供应商处百合花每枝进价1.8元,该店这10天的订单中百合花的日需求量(单位:枝)依次为251,255,231,243,263,241,265,255,
244,252.
(1)求今年四月前10天订单中百合花日需求量的平均数和众数,并完成频率分布直方图;
(2)预计四月的后20天,订单中百合花日需求量的频率分布与四月前10天相同,百合花进货价格与售价均不变,请根据(1)中频率分布直方图判断(同一组中的需求量数据用该组区间的中点值代表,位于各区间的频率代替位于该区间的概率)该店每天从某省固定空运250枝,还是255枝百合花,四月后20天百合花销售总利润更大.
解:(1)四月前10天订单中百合花日需求量众数为255枝,
平均数 x=110×(231+241+243+244+251+252+255+255+263+265)=
250(枝).
频率分布直方图补充如图所示.
(2)设订单中百合花的日需求量为a枝,由(1)中频率分布直方图知,a可能取值为235,245,255,265,相应频率分别为0.1,0.3,0.4,0.2,
所以20天中,a=235,245,255,265相应的天数分别为2天,6天,8天,
4天.
①若空运250枝,
a=235,当日利润为235×2-250×1.6=70(元),
a=245,当日利润为245×2-250×1.6=90(元),
a=255,当日利润为255×2-250×1.6-5×1.8=101(元),
a=265,当日利润为265×2-250×1.6-15×1.8=103(元),
20天总利润为70×2+90×6+101×8+103×4=1 900(元).
②若空运255枝,
a=235,当日利润为235×2-255×1.6=62(元),
a=245,当日利润为245×2-255×1.6=82(元),
a=255,当日利润为255×2-255×1.6=102(元),
a=265,当日利润为265×2-255×1.6-10×1.8=104(元),
20天总利润为62×2+82×6+102×8+104×4=1 848(元).
因为1 900>1 848,
所以每天空运250枝百合花,四月后20天总利润更大.
13.电视传媒为了解某市100万观众对足球节目的收视情况,随机抽取了100名观众进行调查.如图是根据调查结果绘制的观众每周平均收看足球节目时间的频率分布直方图,将每周平均收看足球节目时间不低于1.5 h的观众称为“足球迷”,并将其中每周平均收看足球节目时间不低于2.5 h的观众称为“铁杆足球迷”.
(1)试估算该市“足球迷”的人数,并指出其中“铁杆足球迷”约为多少人;
(2)该市要举办一场足球比赛,已知该市的足球场可容纳10万名观众.根据调查,如果票价定为100元/张,则非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看.如果票价提高10x元/张(x∈N),则“足球迷”中非“铁杆足球迷”愿意前往观看的人数会减少10x%,“铁杆足球迷”愿意前往观看的人数会减少100xx+11%.问:票价至少定为多少元/张时,才能使前往现场观看足球比赛的人数不超过10万人?
解:(1)样本中“足球迷”出现的频率为(0.16+0.10+0.06)×0.5=0.16,
“足球迷”的人数约为100×0.16=16(万人),
“铁杆足球迷”约为100×(0.06×0.5)=3(万人),
所以16万“足球迷”中,“铁杆足球迷”约有3万人.
(2)设票价定为(100+10x)元/张,则非“铁杆足球迷”中约有13(1-10x%)万人,“铁杆足球迷”约有3(1-100xx+11%)万人去现场看球.
令13(1-10x%)+3(1-100xx+11%)=16-13x10-3xx+11≤10,
化简得13x2+113x-660≥0,
解得x≤-16513或x≥4.
由x∈N,所以x≥4,
即票价至少定为100+40=140(元/张),才能使前往现场观看足球比赛的“足球迷”不超过10万人.
调查
方式
普查
抽样调查
定义
对每一个调查对象都进行调查的方法,称为全面调查,又称普查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查
相关
概念
总体:在一个调查中,把调查对象的全体称为总体
个体:组成总体的每一个调查对象称为个体
样本:把从总体中抽取的那部分个体称为样本
样本量:样本中包含的个体数称为样本容量,简称样本量
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n
相关学案
这是一份高考数学第一轮复习复习第1节 函数的概念及其表示(讲义),共12页。
这是一份2024年高考数学第一轮复习讲义第十一章11.2 随机抽样、统计图表(学生版+解析),共23页。
这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第1讲随机抽样统计图表,共8页。