所属成套资源:高中数学人教版本必修三全册导学案及答案
数学必修3本节综合导学案
展开
这是一份数学必修3本节综合导学案,共11页。
1 例析简单随机抽样
简单随机抽样是一种最简单、最基本的抽样方法.适用于总体中的个体数较少且抽取的样本容量较小时.抽样中选取个体的方法有两种:放回和不放回.简单随机抽样中用的是不放回抽取.下面让我们一同来看如下的例题:
例1 判断下面的抽样方法是不是简单随机抽样?
(1)从不确定个体数的总体中抽取20个个体作为样本.
(2)从30瓶果汁中一次性随机抽取3瓶进行质量检查.
(3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛.
(4)从装有编号为1~36的大小、形状都相同的号签的盒子中逐个不放回地抽出6个号签.
分析 简单随机抽样的定义,抓住以下特点来理解:
①它要求被抽取的样本所在总体的容量确定且有限;②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④每个个体被抽到的可能性是相同的,是等可能抽样.
解 (1)不是简单随机抽样.因为总体的个体数是不确定的,从而不能保证每个个体等可能入样.
(2)不是简单随机抽样.因为简单随机抽样的定义要求的是逐个抽取.
(3)不是简单随机抽样.因为该例是指定个子最高的5名同学参加比赛,每个个体被抽到的可能性是不同的,不是等可能抽样.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回地、等可能地进行抽样.
点评 要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的上述四个特点.
例2 若将例1(2)中的字眼“一次性”改为“逐个”,则该例便为简单随机抽样.即从30瓶果汁中逐个随机抽取3瓶进行质量检查.请选用合适的抽样方法,写出抽样过程.
分析 简单随机抽样分为两种:抽签法和随机数法.当总体容量和样本容量都较小时,可采用抽签法进行抽样.
解 (1)将30瓶果汁进行编号,号码为1,2,3,…,30;
(2)将1~30这30个编号写到大小、形状都相同的号签上;
(3)将写好的号签放入一个不透明的容器中,并搅拌均匀;
(4)从容器中每次抽取一个号签,连续不放回地抽取3次,并记录上面的编号;
(5)所得号码对应的3瓶果汁就是要抽取的样本.
点评 抽签法(也叫抓阄法)是简单随机抽样的一种方法,一个抽样试验是否能用抽签法,关键看两点:一是制作号签是否方便;二是号签是否容易被“搅拌均匀”.本题中,总体中个体数(30)较少,制作号签比较方便,并且容易被“搅拌均匀”,所以可以采用抽签法.
思考 将例2中的总体容量增大,我们该如何解决呢?比如例3.
例3 现在要考察某公司生产的2.5 L的果汁质量是否达标,欲从400瓶果汁中抽取6瓶进行质量检查.请选用合适的方法抽样,并写出抽样过程.
分析 当总体容量较大,而样本容量较小时,因制签麻烦,故不宜用抽签法,可采用随机数法.
解 选用随机数法.
步骤如下:第一步,先将400瓶果汁编号,可以编为001,002,…,400;
第二步,在随机数表中任选一个数作为开始,比如第6行第1个数,取出162作为抽取的6瓶果汁中的第一个代号(见课本后的附表随机数表P103);
第三步,继续向右读,每次读取三位,凡不在001~400中的数或重复的数跳过去不读,取到末尾时转到下一行从左到右继续读数,如此下去直到得出在001到400之间的6个三位数,分别为162,277,354,378,384,263;
第四步,找出与162,277,354,378,384,263对应的果汁作为样本.
点评 当总体中的个体较多,制作号签比较复杂,并且把号签搅拌均匀比较困难时,可以选择使用随机数法,本题将个体编号的位数统一为3位.
使用随机数法应注意以下两点:
(1)随机数法要求对个体编号且每个个体的号码位数必须相同.如对100个个体编号时应从00编到99(或者从001编到100),而不能用1,2,…,100.可见在总体中的个体进行编号时要视总体中个体的数目而定,但必须保证所编号码的位数一致,不允许出现不同位数的号码.
(2)选定开始读的数后,读数的方向可左、可右、可上、可下,即任意方向均可.读数的方向不同可能导致不同的结果,但这一点不影响样本的公平性和合理性.
2 系统抽样题型全析
在三种随机抽样中,系统抽样是较为重要的一种.当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样方法叫做系统抽样,又称等距抽样.在抽样调查中,由于系统抽样简便易行,所以应用普遍.下面举例说明系统抽样的常见题型.
一、系统抽样的选取问题
例1 某商场想通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…发票上的销售金额组成一个调查样本.这种抽取样本的方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样
分析 上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n(n∈N*)号,符合系统抽样的特点.
答案 C
点评 将总体分成均衡的几部分,按照预先定出的规则在各部分中抽取是系统抽样的常用步骤.
二、间隔问题
例2 为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为________.
分析 要抽取n个个体入样,需将N个编号均分成n组.(1)若为整数,则抽样间隔为;(2)若不是整数,则先剔除多余个体,再均分成n组,此时抽样间隔为.
解析 根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k为=40.
答案 40
点评 将总体号码平均分组时,应先考虑总体容量N是否能被样本容量n整除.
三、抽取的个数问题
例3 为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )
A.2 B.4 C.5 D.6
分析 因为1 252=50×25+2,所以应随机剔除2个个体.
答案 A
点评 (1)用系统抽样法抽取多少个个体就须将总体均分成多少组;(2)当总体中的个体数不能被样本容量整除时,需要剔除个体.需要注意的是,即使是被剔除的个体,被抽到的机会和其他个体也是一样的.
四、综合问题
例4 一个总体中的1 000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码(即在第k组中抽取的号码的后两位数为x+33k的后两位数).
(1)当x=24时,写出所抽取样本的10个号码;
(2)若所抽取的10个号码中某个数的后两位数是87,求x的取值范围.
分析 按系统抽样的规则计算求解.
解 (1)所有分组为0~99,100~199,…,900~999,共10组,从每组中抽一个,第0组取24,则第1组取100+(24+33×1)=157,依次错位地从每组中取出,所取的号码为24,157,290,323,456,589,622,755,888,921.
(2)①若抽取的样本为两位数,当k=0,取得号码为87时,x=87;②若抽取的样本为三位数,则87为x+33k(k=1,2,…,9)的后两位数.
如当k=5时,x+33×5=□87,可以求出x=22,这样令k取不同的值可以求得x的值分别为:21,22,23,54,55,56,88,89,90.
综上,x∈{21,22,23,54,55,56,87,88,89,90}.
点评 本题是系统抽样法的逆向综合问题,体现了知识间的联系和数学思想的运用.
3 例析分层抽样的解题方法
若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.这种抽样方法就是分层抽样. 分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的.
一、应用分层抽样应遵循以下要求:
(1)将相似的个体归入一类,即为一层,分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠.即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.即所有层应采用同一抽样比等可能抽样.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
二、分层抽样的操作步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数应当调节样本容量,剔除个体.
三、分层抽样的优点:
使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.下面举例解析分层抽样的方法.
例 某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.9 B.18
C.27 D.36
解析 设老年职工人数为x,则2x+x+160=430,
所以x=90,因此,该单位老年职工共有90人,
样本中的老年职工人数为90×=18,所以用分层抽样的比例应抽取该样本中的老年职工人数为18.
答案 B
点评 分层抽样要正确计算各层在总体中所占的比例,每层采用简单随机抽样法.
分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具代表性,在实际调查中被广泛应用.
4 辨析三种抽样方法的合理选取
一、简单随机宜少量
例1 据报道,2009年7月22日的“日全食”较为理想的观测地点有上海、重庆、苏州、杭州、合肥、武汉、宜昌、成都、乐山、嘉兴这10个城市.某天文小组从这10个城市中随机抽取4个城市进行观测,宜采用的抽样方法是______________,每个城市被选中的可能性是________.
解析 由于总体中个体数目较少,所以宜采用简单随机抽样的方法进行抽样.每个城市被选中的可能性均相等,均为=0.4.
答案 简单随机抽样 0.4
点评 本题中个体总数较少,使用简单随机抽样中的抽签法即可.可以直接把10个城市名分别写在10个大小相同的纸条上,将纸条放在一个盒子里摇匀,逐个随机抽出4个即可.在整个抽样过程中可以保证每个个体被抽到的可能性相等,也可以进一步计算出相应的值.
二、差别明显选分层
例2 网络上有一种“QQ农场”游戏,这种游戏通过虚拟软件模拟种植与收获的过程.为了解某小区不同年龄层次的居民对此游戏的态度(小区中居民的年龄具有一定的差别),现从中抽取100人进行调查,结果如下表:
对游戏的态度
喜欢
不喜欢
不了解
人数
35
35
30
请问随机抽取这100人较合理的抽样方法是________,调查结果得出后,若想从这100人中再选取20人进行座谈,较合理的抽样方法是____________.若这个小区共有2 000人,则每个人被抽到参加座谈的可能性为________.
解析 因为小区居民的年龄存在明显差异,故抽取这100人宜采用分层抽样.根据调查结果,有三种明显不同的态度,因此,选取20人参加座谈,也宜采用分层抽样.在整个抽样过程中,每个人被抽到的可能性是相同的,均为=0.01.
答案 分层抽样 分层抽样 0.01
点评 分层抽样的过程是先把有差别的个体进行分层,在每一层中可以采用简单随机抽样或系统抽样的方法,这样也能保证每个个体被抽到的可能性相同.
三、大量抽取选系统
例3 某超市进行促销活动,为购买商品顾客分发了编号为0000~9999的奖券,超市计划从中抽取100张作为中奖号码,较合理的抽样方法是__________,每张奖券中奖的可能性为________.
解析 由于奖券数量较大,有10 000张奖券,所以宜采用系统抽样方法进行抽取.在抽样过程中,每张奖券被抽到的可能性是相等的,均为=0.01.
答案 系统抽样 0.01
点评 当总体中个体数目较多时,首先把个体编号,进行平均分组(若不能整除,则随机剔除多余的个体),然后采用简单随机抽样的方法从第一组中抽取一个个体,即可知道应抽取的其他编号的个体.
5 解读用样本估计总体
一、用样本的频率分布估计总体分布
1.频率分布表:反映具体数据落在各个区间的频率,但不够直观、形象,不利于分析数据分布的总体态势.
2.频率分布直方图:能够非常直观的表明数据分布的形状,很好地反映数据的变化趋势,适用于样本数据较多的情况,但是从直方图本身得不到具体的数据内容.
3.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就可以得到相应的频率分布折线图.其优点是能够清晰地反映数据的变化趋势.如果样本容量不断增加,分组的组距不断减小,那么折线图便会趋近于总体密度曲线.总体密度曲线精确地反映了总体在各个范围内取值的百分比.
4.茎叶图:适用于样本中的数据较少的情况.其优点是(1)没有原始数据的丢失,所有信息均可以从茎叶图中得到,并能展示数据的分布情况;(2)便于记录和表示.缺点是当样本数据较多或数据位数较多时,就会显得不太方便.因为每一个数据都要在图中占据一定的空间,如果数据很多,枝叶就会很长.
二、用样本的数字特征估计总体的数字特征
1.众数:若一组数据中有一个或几个数据出现得最多,且出现的次数一样,那么这些数据都是这组数据的众数,因此一组数据的众数可能不止一个.若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.
2.中位数:将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或中间两个数据的平均数)是该组数据的中位数.
3.平均数:与样本中的每一个数据都有关系,反映了更多关于数据总体的信息,比较可靠.但受极端值的影响较大.
4.极差:就是一组数据中最大数与最小数的差.
5.方差:用来刻画样本数据的波动情况,充分利用了所有的数据,但与原始数据的单位不一致.方差具有非负性.
6.标准差:方差的算术平方根,与原数据的单位一致,且标准差也具有非负性.
三、数字特征在频率分布直方图中的体现
在频率分布直方图中,最高的小矩形的底边中点的横坐标即为样本数据的众数的估计值,中位数左边和右边的小矩形的面积和相等(注:这样求出的中位数是近似值);平均数的估计值等于频率分布直方图中每个小矩形的面积与其底边中点的横坐标的乘积之和.
四、特别提示
1.两类估计都具有随机性,得出的结论不一定是总体的真正的分布、均值或方差.样本质量的高低也是影响正确估计的重要因素.
2.应用茎叶图进行统计时,注意重复出现的数据要重复记录,不能遗漏.
3.样本水平的高低由其平均数决定,样本数据的稳定性与方差和标准差有关.在平均数相差不大的情况下,可以进一步借助方差或标准差来比较优劣.
4.方差越小,说明数据越稳定,但并不是方差越小越好.
6 频率分布图中的统计问题分类解析
频率分布直方图将数理统计的数据直观化、形象化.关于统计一般可分为三步,第一步抽样,第二步根据抽样所得结果,画成图形,第三步根据图形,分析结论.在第二步中可画成两种图形,一个是频率分布直方图,另一个是频率分布条形图,两者有很大的不同,前者是以面积表示频率,频率分布条形图是以高度表示频率.下面就频率分布图中的统计问题分类解析.
一、求样本中限制条件下的个体所占频率
例1 观察新生儿的体重,其频率分布直方图,如图所示,则新生儿体重在[2 700,3 000)的频率为( )
A.0.001 B.0.1
C.0.2 D.0.3
解析 由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3.
答案 D
点评 频率为相应直方图的面积,即频率=纵坐标×横坐标差的绝对值.
二、求样本中限制条件下的个体的频数
例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.
解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p,则0.45+0.25+0.15+0.10+p=1,即0.95+p=1,则p=0.05,设该样本总体共有n个学生的分数,且设90~100分数段的人数为x,则由频率概念得解得故90~100分数段的人数为810.
答案 810
点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由=,求出x;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.
例3 一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.
解析 由直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2 500人,按分层抽样应抽出2 500×=25人.
答案 25
点评 先求频数,频数=频率×样本容量,再按比例进行抽样.
三、求频率分布直方图中的参数问题
例4 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
解析 注意到纵轴表示,由图象可知,
前4组的公比为3,最大频率a=0.1×33×0.1=0.27,
设后六组公差为d,
则0.01+0.03+0.09+0.27×6+·d=1,
解得d=-0.05,即后四组频率的公差为-0.05,
所以,视力在4.6到5.0之间的学生数为
(0.27+0.22+0.17+0.12)×100=78,
故选A.
答案 A
点评 解答本题关键是要利用直方图中的残缺不全的数据,分析它们之间存在的内在关系.
7 “三数、三差”话应用
从样本数据中可以提取基本的数字特征,即“三数”(众数、中位数、平均数)与“三差”(极差、方差、标准差),并对它们进行分析,从而估计总体相应的数字特征,这在日常生活中有着广泛的应用.
一、借“三数”看集中趋势
例1 陈亮同学从高职毕业后到处找工作,他在一家小型工厂面试时,了解到该厂人员周工资(单位:元)情况如下表:
人员
经理
管理人员
高级技工
工人
学徒
周工资
4 000
600
500
250
150
人数
1
4
5
10
2
(1)分别计算该工厂人员周工资的众数、中位数、平均数;
(2)你认为哪个统计量更能反映该工厂人员的工资水平?
(3)去掉经理的周工资后,所得到的周平均工资能代表工厂人员的周工资水平吗?
解 (1)由表中数据,知出现次数最多的数据为250,所以周工资的众数为250元;22个数据从小到大排列后处在最中间的数据是第11和12个数据,均为250,所以中位数应为250元;总工资为4 000×1+600×4+500×5+250×10+150×2=11 700(元),
所以平均数为≈532(元).
(2)由(1)及表中数据,知只有经理与管理人员的周工资在532元以上,所以用平均数不能客观地反映该工厂人员的工资水平.也正因为工厂少数人的周工资与大多数人的周工资差别较大,所以用众数或中位数更能反映该工厂人员的工资水平.
(3)去掉经理的周工资后的周平均工资为≈367(元),能代表工厂人员的周工资水平.
点评 众数、中位数、平均数都是反映数据的集中趋势的量.其中,平均数受数据中的极端值的影响较大,这时平均数对总体估计的可靠性反而不如众数和中位数.
二、用“三差”判分散程度
例2 为了教学的需要,王老师经常在甲网站和乙网站两大网站上下载资料.某天中午,王老师分别在两个网站上下载了五份资料,其下载的速率(单位:KB/s)如下:
甲网站:486 284 71 70 369
乙网站:70 328 244 85 478
(1)试分别计算从这两个网站上下载资料的速率的极差、方差和标准差;
(2)你觉得从哪个网站上下载资料更快?哪个下载速率更稳定?请说明理由.
解 (1)对于甲网站来说,下载速率最高为486,
最低为70,极差为486-70=416;
平均下载速率为
1=×(486+284+71+70+369)=256;
方差为s=×[(486-256)2+(284-256)2+(71-256)2+(70-256)2+(369-256)2]=27 054.8;
标准差为s1==≈164.5.
同理可求得从乙网站上下载资料的速率的极差为408,
平均下载速率为2=241,
方差为s=23 464.8,
标准差为s2≈153.2.
(2)从(1)可以看出,从甲网站上下载资料的平均速率要比乙网站快.从极差来看,甲网站下载速率变化范围更大;另外,从甲网站上下载资料的速率的方差(或标准差)也大于乙网站,这说明甲网站的下载速率的波动性更大,更不稳定.因此从乙网站下载的速率更稳定.
点评 极差、方差、标准差都是刻画数据分散程度的量.极差反映一组数据的变化范围,极差大,则数据较分散,但它只考虑了两个极端值,所以很多时候,极差只能作为数据的分散程度的估计量,可靠性较差.判断数据的波动情况通常采用标准差(或方差),标准差(或方差)越小,波动越小,则越稳定.
相关学案
这是一份数学必修5第三章 不等式综合与测试学案,共9页。
这是一份高中数学人教版新课标A必修5第三章 不等式综合与测试导学案及答案,共25页。
这是一份人教版新课标A必修5第二章 数列综合与测试导学案及答案,共25页。