数学必修 第二册第九章 统计本章综合与测试精品ppt课件
展开
这是一份数学必修 第二册第九章 统计本章综合与测试精品ppt课件,共31页。
例1下列抽样方式是简单随机抽样的是( )A.某工厂从老年、中年、青年职工中按2∶5∶3的比例选取职工代表B.从装有20个完全相同的小球的袋子中一次性抽取4个小球C.福利彩票用摇奖机摇奖D.规定凡买到明信片最后的几位号码是“6637”的人获三等奖答案:C解析:简单随机抽样要求总体个数有限,从总体中逐个进行抽样,每个个体有相同的可能性被抽到.根据简单随机抽样的上述特点可知,只有选项C符合.
例2某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层随机抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生. 答案:60解析:由分层随机抽样方法可得,从一年级本科生中抽取的学生
反思感悟 1.用随机数法抽样时,对个体所编的号码位数要相同;当问题所给的位数不同时,要以位数较多的为准,在位数较少的数的前面添0,凑齐位数.2.用分层随机抽样法抽样时,关键是确定抽样比,即抽样比3.一般地,当总体中的个体数较少时,常采用简单随机抽样;当已知总体由差异明显的几部分组成时,常采用分层随机抽样.
变式训练1某市电视台为调查节目收视率,想从全市3个区按人口数用分层随机抽样的方法抽取一个容量为n的样本,已知3个区人口数之比为2∶3∶5,如果人口最多的一个区抽出的个体数是60,那么这个样本的样本量为( )A.96B.120C.180D.240答案:B解析:由题意知,3个区人口数之比为2∶3∶5,第三个区所抽取的人口数最多,所占比例为50%.又因为第三个区抽取的人数为60,所以3个区所抽取的总人数为60÷50%=120,即这个样本的样本量为120.
变式训练2(2019全国Ⅲ,理3)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位.阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5D.0.8答案:C解析:由题意得,阅读过《西游记》的学生人数为90-80+60=70,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 =0.7.故选C.
例3现有10个样本数据,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是( )A.1B.2C.3D.4答案:B
例4某电子商务公司对10 000名网络购物者在2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a= ; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .
答案:(1)3 (2)6 000解析:由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.所以消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
例5在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日到31日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请回答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
反思感悟 因为总体容量很大或因为检测过程具有一定的破坏性,所以不直接去研究总体,而是通过从总体中抽取一个样本,用样本的频率分布估计总体的分布,用样本的数字特征去估计总体的数字特征.(1)频率分布直方图是从各个小组数据在样本中所占比例大小的角度,表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.(2)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(3)涉及用样本估计总体的计算问题,首先要明确研究对象,选取对应的计算公式和计算方法;如果题目中有图表信息,一定注意挖掘图表中的数字的含义,再将其转化为公式计算.
变式训练3(2019全国Ⅱ,理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差答案:A
变式训练4(2019全国Ⅱ,文19)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
例6一个高中研究性学习小组对本地区2017年至2019年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和每个公司盒饭年销售量平均数条形图(如图所示).根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭 万盒. 快餐公司个数情况图 每个公司年销售量平均数
答案:85解析:由题图可知,该地区三年共销售盒饭30×1+45×2+90×1.5=255(万盒),则每年平均销售 =85(万盒).反思感悟 1.用样本估计总体时用到的图表主要有:频率分布表,频率分布直方图,频率分布折线图,条形图,扇形图等.2.解决此类问题的关键是构建起这几种图标中统计数据间的关系,在分析每种图表时,要抓住其自身所具有的显性和隐性的信息,还要挖掘出其内在的数据特点,最后归结为对应的公式计算.
变式训练5(2018全国Ⅰ,理3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为2×0.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B,C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.
变式训练6(2019全国Ⅲ,理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
甲离子残留百分比直方图
乙离子残留百分比直方图
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由已知得0.70=a+0.20+0.15,故a=(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
例7[情境]为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:
根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?分析选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.
解:通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件.对上面的样本数据进行排序,可以得到下面的结果:
样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.
下面确定75%和95%这两个电量临界值,类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).依据确定了的电量临界值,阶梯电价可以规定如下:用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,(297-178)=119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费.社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.
反思感悟 1.百分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.至少有p%的数据项的值小于或等于第p百分位数;而至少有(100-p)%的数据项的值大于或等于第p百分位数.对第p百分位数,严格的定义如下:第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.2.百分位数是统计学术语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征,比如在医学上常应用百分位数进行数据分析和诊断.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.
相关课件
这是一份2020-2021学年第一章 集合与函数概念综合与测试备课课件ppt,共50页。PPT课件主要包含了第一章,集合与函数概念,章末整合提升,知识结构,要点归纳,专题突破,典例1,典例2,典例3,典例4等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)必修 第二册第九章 统计本章综合与测试教课ppt课件,共31页。
这是一份人教A版 (2019)必修 第二册第十章 概率本章综合与测试精品课件ppt,共31页。PPT课件主要包含了答案C等内容,欢迎下载使用。