所属成套资源:2023版新高考人教A版数学一轮复习讲义
2023版步步高新高考人教A版一轮复习讲义第九章 §9.1 随机抽样、统计图表
展开§9.1 随机抽样、统计图表考试要求 1.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.2.理解统计图表的含义.知识梳理1.简单随机抽样抽签法和随机数法是比较常用的两种方法.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.3.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.常用结论1.简单随机抽样和分层随机抽样在抽样过程中每个个体被抽取的机会相等,分层随机抽样中各层抽样时采用简单随机抽样.2.利用分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.3.在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为eq \x\to(x),eq \x\to(y),样本平均数为eq \x\to(w),则eq \x\to(w)=eq \f(M,M+N)eq \x\to(x)+eq \f(N,M+N)eq \x\to(y)=eq \f(m,m+n)eq \x\to(x)+eq \f(n,m+n)eq \x\to(y).4.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样中,每个个体被抽到的机会,与先后有关.( × )(2)抽签法和随机数法都是简单随机抽样.( √ )(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( × )(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.( √ )教材改编题1.从某市参加升学考试的学生中随机抽查1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )A.总体指的是该市参加升学考试的全体学生B.样本是指1 000名学生的数学成绩C.样本量指的是1 000名学生D.个体指的是1 000名学生中的每一名学生答案 B解析 对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指1 000名学生的数学成绩,故B正确;对于C,样本量是1 000,故C错误; 对于D,个体指的是每名学生的数学成绩,故D错误.2.为迎接2022年杭州亚运会,亚委会采用按性别分层随机抽样的方法从某高校报名的200名学生志愿者中抽取30人组成亚运会志愿小组,若30人中共有男生12人,则这200名学生志愿者中女生可能有( )A.12人 B.18人 C.80人 D.120人答案 D解析 所抽取的30人中,男生12人,则女生有18人,女生占总人数的eq \f(18,30)=eq \f(3,5),所以这200名志愿者中女生人数为200×eq \f(3,5)=120.3.将一个容量为n的样本分成2组,已知第一组频数为8,第二组的频率为0.80,则n为( )A.20 B.40C.60 D.80答案 B解析 因为将一个容量为n的样本分成2组,第二组的频率为0.80,所以第一组的频率为1-0.8=0.2,因为第一组频数为8,所以n=eq \f(8,0.2)=40.题型一 抽样方法例1 (1)总体由编号为00,01,…,28,29的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列开始由左到右依次选取两个数字.则选出来的第5个个体的编号为( )A.19 B.02 C.11 D.16答案 C解析 从随机数表的第1行的第6列和第7列开始从左往右依次选取两个数字,得到的在00~29范围之内的两位数依次是09,09,02,01,19,02,11,其中09和02各重复了一次,去掉重复的数字后,前5个编号是09,02,01,19,11,则选出来的第5个个体的编号为11.(2)我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等六项专项附加扣除.某单位老年、中年、青年员工分别有80人、100人、120人,现采用分层随机抽样的方法,从该单位上述员工中抽取30人调查专项附加扣除的享受情况,则应该从青年员工中抽取的人数为( )A.8 B.10 C.12 D.18答案 C解析 由题意可得抽取的30人中青年员工有eq \f(120,80+100+120)×30=12(人).教师备选某校高一年级1 000名学生的血型情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为50的样本,则从高一年级A型血的学生中应抽取的人数是(图中数据:A型22%,B型28%,O型38%,AB型12%)( )A.11 B.22 C.110 D.220答案 A解析 由图中数据可知高一年级A型血的学生占高一年级学生总体的22%,所以抽取一个容量为50的样本,从A型血的学生中应抽取的人数是50×22%=11.思维升华 (1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③等可能抽取.(2)在分层随机抽样中,抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本容量,各层个体总量).(3)在分层随机抽样中,如果第一层的样本量为m,平均值为eq \x\to(x);第二层的样本量为n,平均值为eq \x\to(y),则样本的平均值为eq \f(m\x\to(x)+n\x\to(y),m+n).跟踪训练1 (1)(2022·南昌模拟)从编号依次为01,02,…,20的20人中选取5人,现从随机数表的第一行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为( )A.09 B.02 C.15 D.18答案 A解析 从随机数表的第一行第3列和第4列数字开始,依次读取08,33(舍),95(舍),55(舍),02,62(舍),15,27(舍),02(舍),43(舍),69(舍),32(舍),18,18(舍),26(舍),09,则第五个编号为09.(2)某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层随机抽样方法抽取一个容量为n的样本,样本中甲型号产品有12件,则此样本的容量为( )A.40 B.60 C.80 D.120答案 B解析 由题意得,总体中甲型号产品所占的比例是eq \f(2,2+3+5)=eq \f(1,5).因为样本中甲型号产品有12件,由于样本容量为n,则eq \f(1,5)×n=12,解得n=60.题型二 统计图表例2 (1)(2022·蚌埠质检)自中华人民共和国成立以来,我国共进行了七次全国人口普査,下图为我国历次全国人口普査人口性别构成及总人口性别比(以女性为100,男性对女性的比例)统计图,则下列说法错误的是( )A.近三次全国人口普查总人口性别比呈递减趋势B.我国历次全国人口普查总人口数呈逐次递增C.第五次全国人口普查时,我国总人口数已经突破12亿D.第七次人口普查时,我国总人口性别比最高答案 D解析 由统计图知,近三次全国人口普查总人口性别比呈递减趋势,A正确;总人口数逐次增加,B正确;第五次全国人口普查时,我国总人口数男女均超过6亿,总人口数已经突破12亿,C正确;全国总人口性别比最高是第一次人口普查,D错误.(2)(多选)(2022·宁德模拟)调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列选项中正确的是( )注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出生. A.互联网行业中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 ABC解析 对于A,互联网行业中仅90后从事技术和运营岗位的人数占总数的56%×(39.6%+17%)=31.696%>30%,故A正确;对于B,互联网行业中仅90后从事技术岗位的人数占总人数的56%×39.6%=22.176%>20%,故B正确;对于C,互联网行业中90后从事运营岗位的人数占总人数的56%×17%=9.52%,而80前从事互联网行业的人数占总人数的3%,故C正确;对于D,由于80后中从事技术岗位的人数所占比例不确定,所以无法比较,故D不正确.教师备选(2022·邯郸模拟)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)、(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好).下列说法正确的是( )A.高三(2)班五项评价得分的极差为1.5B.除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分C.高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高D.各项评价得分中,这两个班的体育得分相差最大答案 C解析 对于A,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,所以极差为9.5-8.5=1,A错误;对于B,两班的德育分相等,B错误;对于C,高三(1)班的平均数为eq \f(9.5+9.25+9.5+9+9.5,5)=9.35,高三(2)班的平均数为eq \f(9.5+8.5+9+9.5+9,5)=9.1,故C正确;对于D,两班的体育分相差9.5-9=0.5,而两班的劳育得分相差9.25-8.5=0.75,两个班的劳育得分相差最大,D错误.思维升华 统计图表的主要应用扇形图:直观描述各类数据占总数的比例;折线图:描述数据随时间的变化趋势;条形图和直方图:直观描述不同类别或分组数据的频数和频率.跟踪训练2 (1)(2022·铁岭模拟)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到扇形统计图如图所示,则下面结论中不正确的是( )A.新农村建设后,种植收入略有增加B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入不变D.新农村建设后,种植收入在经济收入中所占比重大幅下降答案 C解析 因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为m,则建设后的经济收入为2m,A选项,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加2m×37%-m×60%=m×14%,故A正确;B选项,新农村建设后,其他收入比建设前增加2m×5%-m×4%=m×6%>m×4%,即增加了一倍以上,故B正确;C选项,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确.(2)(多选)(2022·湖北九师联盟模拟)某企业2021年12个月的收入与支出数据的折线图如图,已知:利润=收入-支出,根据该折线图,下列说法正确的是( )A.该企业2021年1月至6月的总利润低于2021年7月至12月的总利润B.该企业2021年1月至6月的平均收入低于2021年7月至12月的平均收入C.该企业2021年8月至12月的支出持续增长D.该企业2021年11月份的月利润最大答案 ABC解析 因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线统计图可知2021年8月至12月的虚线是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.题型三 频率分布直方图例3 随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm及以上的学生人数;(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.解 (1)由频率分布直方图可知5×(0.07+x+0.04+0.02+0.01)=1,解得x=0.06,身高在170 cm及以上的学生人数为100×5×(0.06+0.04+0.02)=60.(2)A组人数为100×5×0.06=30,B组人数为100×5×0.04=20,C组人数为100×5×0.02=10,由题意可知A组抽取人数为30×eq \f(6,30+20+10)=3,B组抽取人数为20×eq \f(6,30+20+10)=2,C组抽取人数为10×eq \f(6,30+20+10)=1.教师备选对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图回答下列问题:(1)[25,30)年龄组对应小矩形的高度是多少?(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数是多少?解 (1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.思维升华 频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1.(2)频率分布直方图中纵轴表示eq \f(频率,组距),故每组样本的频率为组距×eq \f(频率,组距),即矩形的面积.(3)频率分布直方图中每组样本的频数为频率×总数.跟踪训练3 某城市实现了市区5G信号全覆盖,为了检查网络的质量,测试人员在市区随机选取了100个地点,测试这些地点处5G网络的平均速度(单位:Mbps),测试结果整理成频数分布表如下:(1)运营商要求市区75%以上的区域5G网络的平均速度不低于540 Mbps,问:该城市的5G网络是否达到该标准?(2)在网格坐标系中作出表格中这些数据的频率分布直方图.解 (1)5G网络平均速度在[540,600]的频率为eq \f(38+20+10,100)=0.68