还剩23页未读,
继续阅读
2012年高考理科数学复习向导课件 第十六章 统计 第1讲 随机抽样和样本估计总体 [配套课件]
展开
这是一份2012年高考理科数学复习向导课件 第十六章 统计 第1讲 随机抽样和样本估计总体 [配套课件],共31页。
第十六章统计 1.随机抽样 (1)理解随机抽样的必要性和重要性. (2)会利用简单随机抽样从总体中抽取样本,了解分层抽样和系统抽样的方法.2.样本估计总体 (1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. (2)理解样本数据标准差的意义和作用,会计算标准差. (3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.统计案例(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(3)了解下列常见的统计方法,并能应用这些方法解决一些实际问题.①了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用;②了解假设检验的基本思想、方法及其简单应用;③了解回归的基本思想、方法及其简单应用.以实际问题为背景,综合考查应用数学知识解决实际问题的能力.体会图形在统计中的直观性与简洁性.第 1 讲 随机抽样和样本估计总体一、三种抽样方法1.简单随机抽样 设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都_____,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种——______和_____________.相等抽签法随机数法2.系统抽样从容量为 N 的总体中抽取容量为 n 的样本,系统抽样的步骤:(1)将总体中的 N 个个体随机______. (3)在第 1 段中用______________确定起始的个体编号 l(l≤k). (4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l+k,再加 k 得到第 3 个个体编号______,依次进行下去,直到获取整个样本.编号分段简单随机抽样l+2k3.分层抽样 在抽样时,将总体分成互不交叉的层,然后按照一定的______,从各层抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样叫分层抽样.当总体是由______________的几个部分组成时,往往采用____________的方法.二、总体估计1.作频率直方分布图的步骤(1)求极差(即一组数据的最大值与________的差).(2)决定组距与_______.(3)将数据分组.比例差异明显分层抽样最小值组数(4)列频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_____,就得频率分布折线图. (2)总体密度曲线:随着__________的增加,作图时所分的组数增加,_______减小,相应的频率折线图会接近于一条光滑的曲线,即总体密度曲线.3.样本数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中点样本容量组距 (2)中位数:将一组数据按大小依次排列,把处在_________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的___________. (3)平均数:样本数据的算术平均数,即x =________________. (4)方差:s2=____________________________________. 4.茎叶图 茎叶图的优点是可以保留原始数据,而且随时可以记录.中位数最中间 1.某单位有职工 750 人,其中青年职工 350 人,中年职工250 人,老年职工 150 人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为 7 人,则样本容量为()BA.7B.15C.25D.352.在某项体育比赛中,七位裁判为一选手打出的分数如下:908990 9593 9493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()BA.92,2B.92,2.8C.93,2D.93,2.83.200 辆汽车经过某一雷达地区,时速频率分布直方图如)B图 16-1-1,则时速超过 60 km/h 的汽车数量为( 图 16-1-1A.65 辆B.76 辆C.88 辆D.95 辆 4.已知某商场新进 3 000 袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取 150 袋检查,若第一组抽出的号码是 11,则第六十一组抽出的号码为______.1211 5.某体育赛事志愿者组织有 1 000 名志愿者,其中参加过2008 年北京奥运会志愿服务的有 250 名,新招募的 2010 年广州亚运会志愿者 750 名.现用分层抽样的方法从中选出 100 名志愿者调查他们的服务能力,则选出新招募的广州亚运会志愿者的人数是_____.75考点 1随机抽样及其应用 例 1:现要完成下列 3 项抽样调查:①从 10 盒酸奶中抽取3 盒进行食品卫生检查.②科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈.③东方中学共有 160 名教职工,其中一般教师 120 名,行政人员 16 名,后勤人员 24 名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为 20 的样本.较为合理的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样.C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样 解题思路:此题主要考察的是三种抽样方法的适用情况. 解析:对①总体个数较少,采用简单随机抽样,对②个体数相对较多,采用系统抽样,对③个体相互差异明显,采用分层抽样,故选 A.三种抽样方法的联系与区别:【互动探究】 1.(2010 年四川)一个单位有职工 800 人,其中具有高级职称的 160 人,具有中级职称的 320 人,具有初级职称的 200 人,其余人员 120 人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为 40 的样本.则从上述各层中依次抽取的人数分别是()DA.12,24,15,9C.8,15,12,5B.9,12,12,7D.8,16,10,6考点 2茎叶图的应用 例2:根据《山东统计年鉴 2007》中的资料作成的 1997 年至 2006 年我省城镇居民百户家庭人口数的茎叶图如图 16-1- 5.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到 1997 年至 2006 年我省城镇居民百户)图 16-1-5家庭人口数的平均数为( A.304.6 B.303.6 C.302.6 D.301.6解题思路:这题对考生的要求对茎叶图会读图,作图.解析:本题考查茎叶图、用样本数字特征估计总体特征.1+1+5+8+2+6+0+2+4+7+290×4+300×2+310×410=303.6.故选 B.茎叶图的主要优点是保留了原始数据,在根据茎叶图来计算样本的数字特征时,在计算方面要多加仔细.【互动探究】 2.若一组样本数据 x1、x2、x3、…、xn 的平均数为 3,方差为 2,则数据 3x1+1,3x2+1,3x3+1,…,3xn+1 的平均数为 ,方差为______.18 解析:若数据 x1、x2、x3、…、xn 的平均数为 x ,方差为 s2,则数据 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数为 a x +b,方差为 a2s2,故平均数为 10,方差为 18. 10图 16-1-6 例 3:(2010 年汕头调研)为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为 17 岁~18 岁的男生体重(kg),得到频率分布直方图如图 16-1-6.根据下图可得这 100名学生中体重在[56.5,64.5]的学生人数是________.【互动探究】 3.(2010 年佛山调研)某校从参加高一年级期中考试的学生中随机抽取 60 名学生,将其数学成绩( 均为整数) 分成六段[40,50),[50,60),…,[90,100]后得到如下部分频率分布直方图如图 16-1-7.观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;图 16-1-7 (2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分; (3)用分层抽样的方法在分数段为[60,80)的学生中抽取一个容量为 6 的样本,将该样本看成一个总体,从中任取 2 人,求至多有 1 人在分数段[70,80)的概率. (3)由题意,[60,70)分数段的人数为:0.15×60=9(人);[70,80)分数段的人数为:0.3×60=18(人). ∵在[60,70)的学生中抽取一个容量为 2 的样本, ∴[60,70)分数段抽取 2 人,[70,80)分数段抽取 4 人,设从样本中任取 2 人,至多有 1 人在分数段[70,80)为事件 A,则基本 例 4:随机抽取某中学甲、乙两个班各 10 名同学,测量他们的身高(单位:cm)获得身高数据的茎叶图如图 16-1-9(1),在样本的 20 人中,记身高在[150,160),[160,170),[170,180),[180,190)的人数依次为 A1、A2、A3、A4.图 16-1-9(2)是统计样本中身高在一定范围内的人数的算法流程图,由图(1)可知甲、乙两班中平均身高较高的是______班;图(乙)输出的______(用数字作答).图 16-1-9 解题思路:此题首先从图甲读出两个班身高的相关信息,分别求出两个班的平均身高,再结合图乙的程序框图,得出所要求的值.解析:由图(1)知甲班的平均身高为 170.4,乙班的平均身高为 170.7,则平均身高较高的是乙班.图(2)输出的 S=A2+A3+A4=18.此题一方面考察了统计中的相关知识,又融合了算法,从形式上比较新颖.【互动探究】 4.(2010 年广东)某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上 40 件产品作为样本算出他们的重量(单位:克)重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图16-1-10所示.图 16-1-10(1)根据频率分布直方图,求重量超过 505 克的产品数量; (2)在上述抽取的 40 件产品中任取 2 件,设 Y 为重量超过505 克的产品数量,求 Y 的分布列; (3)从流水线上任取 5 件产品,求恰有 2 件产品合格的重量超过 505 克的概率. 解:(1)重量超过 505 克的产品数量是 40×(0.05×5+0.01×5)=40×0.3=12(件). (2)Y 的分布列为 1.抽样方法主要有简单随机抽样、系统抽样、分层抽样,三者之间既有区别又有联系,但不论是哪种抽样方法,在整个抽样过程中,每个个体被抽到的概率是相等的.2.频率分布直方图中每个小矩形的面积等于数据落在相应区间上的频率,所有小矩形的面积之和等于 1.
第十六章统计 1.随机抽样 (1)理解随机抽样的必要性和重要性. (2)会利用简单随机抽样从总体中抽取样本,了解分层抽样和系统抽样的方法.2.样本估计总体 (1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. (2)理解样本数据标准差的意义和作用,会计算标准差. (3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.统计案例(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(3)了解下列常见的统计方法,并能应用这些方法解决一些实际问题.①了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用;②了解假设检验的基本思想、方法及其简单应用;③了解回归的基本思想、方法及其简单应用.以实际问题为背景,综合考查应用数学知识解决实际问题的能力.体会图形在统计中的直观性与简洁性.第 1 讲 随机抽样和样本估计总体一、三种抽样方法1.简单随机抽样 设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都_____,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种——______和_____________.相等抽签法随机数法2.系统抽样从容量为 N 的总体中抽取容量为 n 的样本,系统抽样的步骤:(1)将总体中的 N 个个体随机______. (3)在第 1 段中用______________确定起始的个体编号 l(l≤k). (4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l+k,再加 k 得到第 3 个个体编号______,依次进行下去,直到获取整个样本.编号分段简单随机抽样l+2k3.分层抽样 在抽样时,将总体分成互不交叉的层,然后按照一定的______,从各层抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样叫分层抽样.当总体是由______________的几个部分组成时,往往采用____________的方法.二、总体估计1.作频率直方分布图的步骤(1)求极差(即一组数据的最大值与________的差).(2)决定组距与_______.(3)将数据分组.比例差异明显分层抽样最小值组数(4)列频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_____,就得频率分布折线图. (2)总体密度曲线:随着__________的增加,作图时所分的组数增加,_______减小,相应的频率折线图会接近于一条光滑的曲线,即总体密度曲线.3.样本数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中点样本容量组距 (2)中位数:将一组数据按大小依次排列,把处在_________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的___________. (3)平均数:样本数据的算术平均数,即x =________________. (4)方差:s2=____________________________________. 4.茎叶图 茎叶图的优点是可以保留原始数据,而且随时可以记录.中位数最中间 1.某单位有职工 750 人,其中青年职工 350 人,中年职工250 人,老年职工 150 人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为 7 人,则样本容量为()BA.7B.15C.25D.352.在某项体育比赛中,七位裁判为一选手打出的分数如下:908990 9593 9493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()BA.92,2B.92,2.8C.93,2D.93,2.83.200 辆汽车经过某一雷达地区,时速频率分布直方图如)B图 16-1-1,则时速超过 60 km/h 的汽车数量为( 图 16-1-1A.65 辆B.76 辆C.88 辆D.95 辆 4.已知某商场新进 3 000 袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取 150 袋检查,若第一组抽出的号码是 11,则第六十一组抽出的号码为______.1211 5.某体育赛事志愿者组织有 1 000 名志愿者,其中参加过2008 年北京奥运会志愿服务的有 250 名,新招募的 2010 年广州亚运会志愿者 750 名.现用分层抽样的方法从中选出 100 名志愿者调查他们的服务能力,则选出新招募的广州亚运会志愿者的人数是_____.75考点 1随机抽样及其应用 例 1:现要完成下列 3 项抽样调查:①从 10 盒酸奶中抽取3 盒进行食品卫生检查.②科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈.③东方中学共有 160 名教职工,其中一般教师 120 名,行政人员 16 名,后勤人员 24 名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为 20 的样本.较为合理的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样.C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样 解题思路:此题主要考察的是三种抽样方法的适用情况. 解析:对①总体个数较少,采用简单随机抽样,对②个体数相对较多,采用系统抽样,对③个体相互差异明显,采用分层抽样,故选 A.三种抽样方法的联系与区别:【互动探究】 1.(2010 年四川)一个单位有职工 800 人,其中具有高级职称的 160 人,具有中级职称的 320 人,具有初级职称的 200 人,其余人员 120 人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为 40 的样本.则从上述各层中依次抽取的人数分别是()DA.12,24,15,9C.8,15,12,5B.9,12,12,7D.8,16,10,6考点 2茎叶图的应用 例2:根据《山东统计年鉴 2007》中的资料作成的 1997 年至 2006 年我省城镇居民百户家庭人口数的茎叶图如图 16-1- 5.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到 1997 年至 2006 年我省城镇居民百户)图 16-1-5家庭人口数的平均数为( A.304.6 B.303.6 C.302.6 D.301.6解题思路:这题对考生的要求对茎叶图会读图,作图.解析:本题考查茎叶图、用样本数字特征估计总体特征.1+1+5+8+2+6+0+2+4+7+290×4+300×2+310×410=303.6.故选 B.茎叶图的主要优点是保留了原始数据,在根据茎叶图来计算样本的数字特征时,在计算方面要多加仔细.【互动探究】 2.若一组样本数据 x1、x2、x3、…、xn 的平均数为 3,方差为 2,则数据 3x1+1,3x2+1,3x3+1,…,3xn+1 的平均数为 ,方差为______.18 解析:若数据 x1、x2、x3、…、xn 的平均数为 x ,方差为 s2,则数据 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数为 a x +b,方差为 a2s2,故平均数为 10,方差为 18. 10图 16-1-6 例 3:(2010 年汕头调研)为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为 17 岁~18 岁的男生体重(kg),得到频率分布直方图如图 16-1-6.根据下图可得这 100名学生中体重在[56.5,64.5]的学生人数是________.【互动探究】 3.(2010 年佛山调研)某校从参加高一年级期中考试的学生中随机抽取 60 名学生,将其数学成绩( 均为整数) 分成六段[40,50),[50,60),…,[90,100]后得到如下部分频率分布直方图如图 16-1-7.观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;图 16-1-7 (2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分; (3)用分层抽样的方法在分数段为[60,80)的学生中抽取一个容量为 6 的样本,将该样本看成一个总体,从中任取 2 人,求至多有 1 人在分数段[70,80)的概率. (3)由题意,[60,70)分数段的人数为:0.15×60=9(人);[70,80)分数段的人数为:0.3×60=18(人). ∵在[60,70)的学生中抽取一个容量为 2 的样本, ∴[60,70)分数段抽取 2 人,[70,80)分数段抽取 4 人,设从样本中任取 2 人,至多有 1 人在分数段[70,80)为事件 A,则基本 例 4:随机抽取某中学甲、乙两个班各 10 名同学,测量他们的身高(单位:cm)获得身高数据的茎叶图如图 16-1-9(1),在样本的 20 人中,记身高在[150,160),[160,170),[170,180),[180,190)的人数依次为 A1、A2、A3、A4.图 16-1-9(2)是统计样本中身高在一定范围内的人数的算法流程图,由图(1)可知甲、乙两班中平均身高较高的是______班;图(乙)输出的______(用数字作答).图 16-1-9 解题思路:此题首先从图甲读出两个班身高的相关信息,分别求出两个班的平均身高,再结合图乙的程序框图,得出所要求的值.解析:由图(1)知甲班的平均身高为 170.4,乙班的平均身高为 170.7,则平均身高较高的是乙班.图(2)输出的 S=A2+A3+A4=18.此题一方面考察了统计中的相关知识,又融合了算法,从形式上比较新颖.【互动探究】 4.(2010 年广东)某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上 40 件产品作为样本算出他们的重量(单位:克)重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图16-1-10所示.图 16-1-10(1)根据频率分布直方图,求重量超过 505 克的产品数量; (2)在上述抽取的 40 件产品中任取 2 件,设 Y 为重量超过505 克的产品数量,求 Y 的分布列; (3)从流水线上任取 5 件产品,求恰有 2 件产品合格的重量超过 505 克的概率. 解:(1)重量超过 505 克的产品数量是 40×(0.05×5+0.01×5)=40×0.3=12(件). (2)Y 的分布列为 1.抽样方法主要有简单随机抽样、系统抽样、分层抽样,三者之间既有区别又有联系,但不论是哪种抽样方法,在整个抽样过程中,每个个体被抽到的概率是相等的.2.频率分布直方图中每个小矩形的面积等于数据落在相应区间上的频率,所有小矩形的面积之和等于 1.
相关资料
更多