还剩19页未读,
继续阅读
成套系列资料,整套一键下载
人教A版数学高二选择性必修第三册 第八章 成对数据的统计分析 单元解读 课件
展开
这是一份人教A版数学高二选择性必修第三册 第八章 成对数据的统计分析 单元解读 课件,共27页。
第八章 成对数据的统计分析 单元解读本章在必修课程统计内容的基础上,通过成对数据研究两 个随机变量(以下简称变量)之间的关系,内容包括成对数据 的统计相关性、一元线性回归模型、2义2列联表.通过本章学 习,学生将掌握成对样本数据的直观表示方法及线性相关统计 特征的刻画方法,能够根据成对数据的统计相关性推断两个变 量的相关性,解决统计相关性的简单实际问题;理解一元线性 回归分析的方法,会用一元线性回归模型刻画两个变量之间的 相关关系,并进行预测;理解2X2列联表的统计意义,会用 2X2列联表的方法解决两个变量独立性检验的简单实际问题. 在本章的学习过程中,学生将进一步感悟根据实际情况进行科 学决策的必要性和可能性;体会统计思维与确定性思维的差异、 归纳推断与演绎证明的差异;积累数据分析的经验,培养数据 分析、数学建模、逻辑推理等素养.一、总体设计二、本章内容本章教学时间约需9课时,具体分配如下(仅供参考):8.1 成对数据的统计相关性 约2课时8.2 —元线性回归模型及其应用 约3课时8.3 列联表与独立性检验 约2课时小结 约2课时三、本章教学时间约需14课时四、本章知识结构框图成对数据的统计相关性;一元线性回归模型;独立性检验;五、本章重点 难点是理解独立性检验的思想.六、本章的难点能够解决成对样本数据统计相关性的简单实际问题.能够结合具体实例,掌握运用一元线性回归分析的方法.掌握运用2×2列联表的方法,解决独立性检验的简单实际问题.重点提升学生数据分析、数学建模、逻辑推理和数学运算素养.七、本章学业要求八、核心知识评价要求九、思想方法评价要求十、关键能力评价要求1.相关关系两个变量间的关系有函数关系,相关关系和不相关关系两个变量有关系,但又没有确切到可由其中的一个去________决定另一个的程度,这种关系称为相关关系.精确地十一、本章知识梳理2.正相关、负相关 从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现______的趋势,则称这个两个变量负相关.3.线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.增加减少一条线1.相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量2.相关系数r的性质 (1)当r>0时,称成对样本数据____相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系. (2)样本相关系数r的取值范围为______________. 当|r|越接近1时,成对样本数据的线性相关程度越____; 当|r|越接近0时,成对样本数据的线性相关程度越____.正[-1,1]强弱3.样本相关系数与标准化数据向量夹角的关系1.一元线性回归模型 我们称为Y关于x的______________模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为______参数,b称为______参数;e是Y与bx+a之间的随机______.一元线性回归截距斜率误差2.线性回归方程与最小二乘法1.残差的概念2.刻画回归效果的方式 (1)残差图法 作图时________为残差,________可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好. (2)残差平方和法纵坐标横坐标(3)利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.1.分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用______表示.分类变量实数2.2×2列联表 在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉__________. 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为分类频数3.等高堆积条形图 等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.频率频率稳定于概率1.临界值χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关2.独立性检验 基于小概率值α的检验规则是: 当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α; 当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立. 这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值3.应用独立性检验解决实际问题的大致步骤 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释; (2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较; (3)根据检验规则得出推断结论; (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.课 程 结 束
第八章 成对数据的统计分析 单元解读本章在必修课程统计内容的基础上,通过成对数据研究两 个随机变量(以下简称变量)之间的关系,内容包括成对数据 的统计相关性、一元线性回归模型、2义2列联表.通过本章学 习,学生将掌握成对样本数据的直观表示方法及线性相关统计 特征的刻画方法,能够根据成对数据的统计相关性推断两个变 量的相关性,解决统计相关性的简单实际问题;理解一元线性 回归分析的方法,会用一元线性回归模型刻画两个变量之间的 相关关系,并进行预测;理解2X2列联表的统计意义,会用 2X2列联表的方法解决两个变量独立性检验的简单实际问题. 在本章的学习过程中,学生将进一步感悟根据实际情况进行科 学决策的必要性和可能性;体会统计思维与确定性思维的差异、 归纳推断与演绎证明的差异;积累数据分析的经验,培养数据 分析、数学建模、逻辑推理等素养.一、总体设计二、本章内容本章教学时间约需9课时,具体分配如下(仅供参考):8.1 成对数据的统计相关性 约2课时8.2 —元线性回归模型及其应用 约3课时8.3 列联表与独立性检验 约2课时小结 约2课时三、本章教学时间约需14课时四、本章知识结构框图成对数据的统计相关性;一元线性回归模型;独立性检验;五、本章重点 难点是理解独立性检验的思想.六、本章的难点能够解决成对样本数据统计相关性的简单实际问题.能够结合具体实例,掌握运用一元线性回归分析的方法.掌握运用2×2列联表的方法,解决独立性检验的简单实际问题.重点提升学生数据分析、数学建模、逻辑推理和数学运算素养.七、本章学业要求八、核心知识评价要求九、思想方法评价要求十、关键能力评价要求1.相关关系两个变量间的关系有函数关系,相关关系和不相关关系两个变量有关系,但又没有确切到可由其中的一个去________决定另一个的程度,这种关系称为相关关系.精确地十一、本章知识梳理2.正相关、负相关 从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现______的趋势,则称这个两个变量负相关.3.线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.增加减少一条线1.相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量2.相关系数r的性质 (1)当r>0时,称成对样本数据____相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系. (2)样本相关系数r的取值范围为______________. 当|r|越接近1时,成对样本数据的线性相关程度越____; 当|r|越接近0时,成对样本数据的线性相关程度越____.正[-1,1]强弱3.样本相关系数与标准化数据向量夹角的关系1.一元线性回归模型 我们称为Y关于x的______________模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为______参数,b称为______参数;e是Y与bx+a之间的随机______.一元线性回归截距斜率误差2.线性回归方程与最小二乘法1.残差的概念2.刻画回归效果的方式 (1)残差图法 作图时________为残差,________可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好. (2)残差平方和法纵坐标横坐标(3)利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.1.分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用______表示.分类变量实数2.2×2列联表 在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉__________. 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为分类频数3.等高堆积条形图 等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.频率频率稳定于概率1.临界值χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关2.独立性检验 基于小概率值α的检验规则是: 当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α; 当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立. 这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值3.应用独立性检验解决实际问题的大致步骤 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释; (2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较; (3)根据检验规则得出推断结论; (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.课 程 结 束
相关资料
更多