第9章 第3节 成对数据的统计分析教案
展开
这是一份第9章 第3节 成对数据的统计分析教案,共15页。教案主要包含了教材概念·结论·性质重视,基本技能·思想·活动体验等内容,欢迎下载使用。
第三节 成对数据的统计分析
一、教材概念·结论·性质重视
1.相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.散点图
将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.
3.正相关和负相关
(1)当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.
(2)负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
相关关系与函数关系的区别与联系
(1)相同点:两者均是指两个变量的关系.
(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
4.线性相关和非线性相关
(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
5.样本相关系数
(1)r=
=,称r为变量x和变量y的样本相关系数.
(2)样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:
①当r>0时,称成对样本数据正相关;
②当r<0时,称成对样本数据负相关.
(3)样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对数据之间线性相关的程度:
①当|r|越接近1时,成对数据的线性相关程度越强;
②当|r|越接近0时,成对数据的线性相关程度越弱.
6.经验回归方程
我们将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中
(1)经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.
(2)根据经验回归方程进行预报,得到的仅是一个估计值,而不一定是真实发生的值.
(3)经验回归直线一定过样本点的中心.
7.利用R2刻画回归效果
R2的计算公式为R2=1-,其意义是R2越大,残差平方和(yi-i)2越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.
8.独立性检验
(1)χ2的计算公式:记n=a+b+c+d,则χ2=.
(2)利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)应用独立性检验解决实际问题包括以下几个环节:
①提出零假设H0:X和Y相互独立,并给出在问题中的解释;
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界xα值比较;
③根据检验规则得出推断结论;
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
根据χ2的值可以判断两个分类变量有关的可信程度.若χ2的值越大,则两个分类变量有关系的把握越大.
二、基本技能·思想·活动体验
1.判断下列说法的正误,对的打“√”,错的打“×”.
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. (√)
(2)通过经验回归方程=x+可以估计预报变量的取值和变化趋势. (√)
(3)经验回归方程=x+中,若Q2,故模型(2)=+0.8的拟合效果更好.
(3)若生猪存栏数量达到1万头,由(2)中模型乙可知,每头猪的成本为+0.8=1.28(元),这样一天获得的总利润为 (7.5-1.28)×10 000=62 200(元);
若生猪存栏数量达到1.2万头,由(2)中模型乙可知,每头猪的成本为+0.8=1.2(元),这样一天获得的总利润为(7.2-1.2)×12 000=72 000(元).
因为72 000>62 200,所以选择生猪存栏数量1.2万头能获得更多利润.
在进行线性回归分析时,要按线性回归分析步骤进行.在求R2时,通常采用分步计算的方法,R2越大,模型的拟合效果越好.
关于x与y有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
有如下的两个线性模型:
(1)=6.5x+17.5;(2)=7x+17.试比较哪一个拟合效果更好.
解:由(1)可得yi-i与yi-的关系如下表:
yi-i
-0.5
-3.5
10
-6.5
0.5
yi-
-20
-10
10
0
20
所以(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155, (yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以R=1-=1-=0.845.
由(2)可得yi-i与yi-的关系如下表:
yi-i
-1
-5
8
-9
-3
yi-
-20
-10
10
0
20
所以(yi-i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,
所以R=1-=1-=0.82.
所以R>R.
所以(1)的拟合效果更好.
考点4 列联表与独立性检验——综合性
某省进行高中新课程改革已经四年了,为了了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查.共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)依据小概率α=0.001值,能否推断青年教师和老教师在新课程教学模式的使用上有差异?
解: (1)2×2列联表如下所示.
赞同
不赞同
总计
老教师
10
10
20
青年教师
24
6
30
总计
34
16
50
(2)假设H0:青年教师和老教师在新课程教学模式的使用上没有差异.
由公式得χ2=≈4.963<10.828=x0.001,我们推断H0不成立,即认为青年教师和老教师在新课程教学模式的使用上有差异,此推断犯错误的概率不大于0.001.
(1)利用χ2=求出χ2的值.再利用小概率α的值以及对应的临界值来判断有多大的把握判断两个事件有关.
(2)解题时应注意准确计算,不可错用公式,准确进行比较与判断.
(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
解:(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率p==0.64.
(2)根据抽查数据,可得2×2列联表如下:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
64
16
(75,115]
10
10
(3)根据(2)的列联表得
χ2=≈7.484.
因为7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
相关教案
这是一份人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表教案,共11页。教案主要包含了教学内容与内容解析,教学目标与目标解析,教学问题诊断解析,教学支持条件分析,教学过程设计,板书设计,目标检测设计等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表教案设计,共16页。教案主要包含了本节内容分析,学情整体分析,教学活动准备,教学活动设计等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系教案,共11页。教案主要包含了本节内容分析,学情整体分析,教学活动准备,教学活动设计等内容,欢迎下载使用。