高考数学考前回归课本知识技法精细过(十五):随机抽样与统计 (1)教案
展开高考数学考前30天回归课本知识技法精细过(十五)
第一节 随机抽样
一、必记3个知识点
1.简单随机抽样
(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个①________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会②________,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种——③________法和④______________法.
(3)一般地,抽签法就是总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,⑤______________后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
(4)随机数表法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
(5)简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.
2.系统抽样
(1)一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(ⅰ)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(ⅱ)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=⑥________;
(ⅲ)在第1段用⑦________确定第一个个体编号l(l≤k);
(ⅳ)按照一定的规则抽取样本.通常是将l⑧________得到第2个个体编号(l+k),再加k得到第3个个体编号⑨________,依次进行下去,直到获取整个样本.
(2)当总体中元素个数较少时,常采用简单随机抽样,当总体中元素个数较多时,常采用⑩________.
3.分层抽样
(1)分层抽样的概念:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)当总体是由⑪________的几个部分组成时,往往选用分层抽样的方法.
(3)分层抽样时,每个个体被抽到的机会是⑫________的.
二、必明2个易误点
1.认清简单随机抽样、系统抽样、分层抽样三者间的区别与联系,是正确选择抽样方法的前提.
2.在系统抽样中,应先确定分段间隔,然后再确定入样个体编号间的关系.
三、技法
1. 解决简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
2. 系统抽样应注意的问题
⑴系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.
⑵系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.
参考答案
①不放回 ②都相等 ③抽签 ④随机数表 ⑤搅拌均匀 ⑥ ⑦简单随机抽样
⑧加上间隔k ⑨(l+2k) ⑩系统抽样 ⑪差异明显 ⑫均等
第二节 用样本估计总体
一、必记3个知识点
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种.一种是用样本的①________估计总体的分布.另一种是用样本的②________估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示③________,数据落在各小组内的频率用各小长方形的④________表示.各小长方形的面积总和⑤________.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着⑥________的增加,作图时所分的⑦________增加,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为⑧________________,它能够更加精细地反映出总体在各个范围内取值的⑨________.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.众数,中位数,平均数
(1)众数:在一组数据中,出现次数⑩________的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,把处在⑪________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的⑫________.
(3)平均数:样本数据的算术平均数.即=⑬__________.在频率分布直方图中,中位数左边和右边的直方图的面积应该⑭________.
3.样本方差,标准差
标准差
s= ,
其中xn是样本数据的第n项,n是样本容量,是⑮________.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量⑯________总体容量时,样本方差越接近总体方差.
二、必明1个易误点
不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没有频率的.
三、技法
1. 众数、中位数、平均数及方差的意义及计算公式
(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述数据集中趋势,方差和标准差描述波动的大小.
(2)平均数、方差的公式推广.
①若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
②数据x1,x2,…,xn的方差为s2.
(ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;
(ⅱ)数据ax1,ax2,…,axn的方差为a2s2.
(3)方差的简化计算公式.
s2=[(x+x+…+x)-n2]或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
2. 茎叶图的应用
(1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(若没有则表示该数据不存在);
(2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解.
3. 绘制频率分布直方图时的2个注意点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.
(2)频率分布直方图的纵坐标是,而不是频率.
4.由频率分布直方图进行相关计算时,需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
参考答案
①频率分布 ②数字特征 ③ ④面积
⑤等于1 ⑥样本容量 ⑦组数 ⑧总体密度曲线 ⑨百分比 ⑩最多 ⑪最中间
⑫中位数 ⑬(x1+x2+…+xn) ⑭相等
⑮平均数 ⑯接近
第三节 变量间的相关关系与统计案例
一、必记4个知识点
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在①__________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程
(1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程
方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中②____________称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量③________________;
当r<0时,表明两个变量④________________.
r的绝对值越接近于1,表明两个变量的线性相关性⑤________.
r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于⑥________时,认为两个变量有很强的线性相关性.
4.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
| y1 | y2 | 总计 |
x1 | a | b | a+b |
x2 | c | d | c+d |
总计 | a+c | b+d | a+b+c+d |
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
(3)独立性检验
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
二、必明4个易误点
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
2.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
3.r的大小只说明是否相关,并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据,必须将二者区分开来.
4.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.706应判断为没有充分依据显示X与Y有关系,而不能作为小于90%的量化值来作出判断.
三、技法
1. 判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
(3)线性回归方程中:>0时,正相关;<0时,负相关.
2. 求线性回归方程的基本步骤
(1)先把数据制成表,从表中计算出、,x+x+…+x、x1y1+x2y2+…+xnyn的值.
(2)计算回归系数,.
(3)写出线性回归方程=x+.
注:回归方程一定过点(,).
3. 解独立性检验的应用问题的关注点
(1)两个明确:
①明确两类主体;
②明确研究的两个问题.
(2)两个关键:
①准确画出2×2列联表;
②准确理解K2.
提醒:准确计算K2的值是正确判断的前提.
参考答案
①一条直线 ②(,) ③正相关 ④负相关 ⑤越强 ⑥0.75
高考数学考前回归课本知识技法精细过(十三):概率与统计教案: 这是一份高考数学考前回归课本知识技法精细过(十三):概率与统计教案,共11页。教案主要包含了必记4个知识点,必明3个易误点,技法等内容,欢迎下载使用。
高考数学考前回归课本知识技法精细过(三):导数与积分 (1)教案: 这是一份高考数学考前回归课本知识技法精细过(三):导数与积分 (1)教案,共8页。教案主要包含了必记5个知识点,必明3个易误点,技法等内容,欢迎下载使用。
高考数学考前回归课本知识技法精细过(六):数列教案: 这是一份高考数学考前回归课本知识技法精细过(六):数列教案,共10页。教案主要包含了必记5个知识点,必明2个易误点,技法等内容,欢迎下载使用。