所属成套资源:新高考数学一轮复习 讲与练 (2份打包,原卷版+解析版)
新高考数学一轮复习 讲与练第31讲 统计与统计模型(2份打包,原卷版+解析版)
展开
这是一份新高考数学一轮复习 讲与练第31讲 统计与统计模型(2份打包,原卷版+解析版),文件包含新高考数学一轮复习讲与练第31讲统计与统计模型原卷版doc、新高考数学一轮复习讲与练第31讲统计与统计模型解析版doc等2份试卷配套教学资源,其中试卷共26页, 欢迎下载使用。
知识梳理
数据的收集与直观表示
1.总体、个体、样本与样本容量
考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
2.普查与抽样调查
(1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).
(2)抽样调查:只抽取样本进行考察的方法称为抽样调查.
3.简单随机抽样
(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.
(2)两种常用方法:抽签法,随机数表法.
4.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
5.数据的直观表示
(1)常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频率分布直方图等.
(2)频率分布直方图
①作频率分布直方图的步骤
(ⅰ)找出最值,计算极差:即一组数据中最大值与最小值的差;
(ⅱ)合理分组,确定区间:根据数据的多少,一般分5~9组;
(ⅲ)整理数据:
逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组是闭区间;
(ⅳ)作出有关图示:
根据上述整理后的数据,可以作出频率分布直方图,如图所示.频率分布直图的纵坐标是eq \f(频率,组距),每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为1.
②频率分布折线图
作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
不难看出,虽然作频率分布直方图过程中,原有数据被“压缩”了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚地看出数据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计出平均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利用原始数据求出的数字特征一般会有差异.
数据的数字特征、用样本估计总体
1.数据的数字特征
(1)最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.
(2)平均数
①定义:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为eq \(x,\s\up6(-))=eq \f(1,n)(x1+x2+…+xn).
这一公式在数学中常简记为eq \(x,\s\up6(-))=eq \f(1,n)eq \(∑,\s\up6(n),\s\d4(i=1))xi,
②性质:一般地,利用平均数的计算公式可知,如果x1,x2,…,xn的平均数为x,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为aeq \(x,\s\up6(-))+b.
(3)中位数
有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称eq \f(xn+xn+1,2)为这组数的中位数.
(4)百分位数
①定义:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
②确定方法:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取xi0为p%分位数;如果i是整数,取eq \f(xi+xi+1,2)为p%分位数.
(5)众数
一组数据中,出现次数最多的数据称为这组数据的众数.
(6)极差、方差与标准差
①极差:一组数的极差指的是这组数的最大值减去最小值所得的差,描述了这组数的离散程度.
②方差
定义:如果x1,x2,…,xn的平均数为x,则方差可用求和符号表示为s2=eq \f(1,n)eq \(∑,\s\up6(n),\s\d4(i=1))(xi-eq \(x,\s\up6(-)))2=eq \f(1,n)eq \(∑,\s\up6(n),\s\d4(i=1))xeq \\al(2,i)-eq \(x,\s\up6(-))2.
性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
③标准差
定义:方差的算术平方根称为标准差.一般用s表示,即样本数据x1,x2,…,xn的标准差为s=eq \r(\f(1,n)\(∑,\s\up6(n),\s\d4(i=1)) (xi-x)2).
性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的标准差为|a|s.
2.用样本的数字特征估计总体的数字特征
一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
统计模型
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:如果变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
2.相关系数
(1)r=eq \f(\(∑,\s\up12(n),\s\d8(i=1))(xi-eq \(x,\s\up12(-)))(yi-eq \(y,\s\up12(-))),\r(\(∑,\s\up12(n),\s\d8(i=1))(xi-eq \(x,\s\up12(-)))2\(∑,\s\up12(n),\s\d8(i=1))(yi-eq \(y,\s\up12(-)))2))
=eq \f(\(∑,\s\up12(n),\s\d8(i=1))xiyi-n\a\vs4\al(eq \(x,\s\up12(-)))\a\vs4\al(eq \(y,\s\up12(-))),\r((\(∑,\s\up12(n),\s\d8(i=1))xeq \\al(2,i)-neq \(x,\s\up12(-))2)(\(∑,\s\up12(n),\s\d8(i=1))yeq \\al(2,i)-ny2))).
(2)当r>0时,成对样本数据正相关;当r
相关试卷
这是一份新高考数学一轮复习 讲与练第8讲 函数模型及其应用(2份打包,原卷版+解析版),文件包含新高考数学一轮复习讲与练第8讲函数模型及其应用原卷版doc、新高考数学一轮复习讲与练第8讲函数模型及其应用解析版doc等2份试卷配套教学资源,其中试卷共18页, 欢迎下载使用。
这是一份新高考数学一轮复习精讲精练6.3 统计案例(基础版)(2份打包,原卷版+解析版),文件包含新高考数学一轮复习精讲精练63统计案例基础版原卷版Doc、新高考数学一轮复习精讲精练63统计案例基础版解析版Doc等2份试卷配套教学资源,其中试卷共0页, 欢迎下载使用。
这是一份新高考数学一轮复习讲练测第9章第01讲 统计(八大题型)(讲义)(2份打包,原卷版+解析版),文件包含新高考数学一轮复习讲练测第9章第01讲统计八大题型讲义原卷版doc、新高考数学一轮复习讲练测第9章第01讲统计八大题型讲义解析版doc等2份试卷配套教学资源,其中试卷共0页, 欢迎下载使用。