所属成套资源:人教a版必修第二册数学教案
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体教案
展开
这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体教案,共11页。教案主要包含了原始数据的集中趋势,分组数据的集中趋势,平均数等内容,欢迎下载使用。
教学基本信息
课题
9.2.3 总体集中趋势的估计
学科
数学
学段: 高中
年级
高一
教材
书名: 普通高中教科书 数学必修第二册A版 出版社:人民教育出版社 出版日期:2019 年 8 月
教学目标及教学重点、难点
本节课研究了集中趋势参数——平均数、中位数、众数
• 用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用最为广泛,特别是在进行统计推断时有重要的作用;但平均数计算时比较烦琐,并且容易受到极端数据的影响。
• 中位数作为一组数据的代表,不受极端数据的影响,并且求法简便,是一个反映数据“集中趋势”的位置的代表值。
• 众数利用了出现次数最多的那个值得信息,但并未告诉我们它比别的值多的程度,能传递的数据的信息较少,对极端值也不敏感。
对数值型数据集中趋势的描述,可以用平均数、中位数;而对分类型数据集中趋势的描述,可以用众数。
结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.会求样本数据的平均数、中位数、众数并理解它们的意义和作用.理解集中趋势参数的统计含义.通过对平均数、中位数、众数的学习,强化“数学抽象”、“数学运算”的核心素养.
教学过程(表格描述)
教学环节
主要教学活动
设置意图
引入
引言:为了研究总体的分布情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律,但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能更关注该县今年小麦的总产量或者平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能更关注身高的平均数或中位数,而不是身高的分布;等等.
数学研究的目的是解决实际问题,从实际需要的量出发,探究所要研究的数学问题,抽象出数学概念.
新课
情景引入:
引例: 假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
分析:平均 数据的集中趋势平均数、中位数和众数
一、原始数据的集中趋势
【探究1】假设通过抽样调查,获得100户居民某年的月均用水量如下表(单位:t):
9.0
13.6
14.9
5.9
4.0
7.1
6.4
5.4
19.4
2.0
2.2
8.6
13.8
5.4
10.2
4.9
6.8
14.0
2.0
10.5
2.1
5.7
5.1
16.8
6.0
11.1
1.3
11.2
7.7
4.9
2.3
10.0
16.7
12.0
12.4
7.8
5.2
13.6
2.6
22.4
3.6
7.1
8.8
25.6
3.2
18.3
5.1
2.0
3.0
12.0
22.2
10.8
5.5
2.0
24.3
9.9
3.6
5.6
4.4
7.9
5.1
24.5
6.4
7.5
4.7
20.5
5.5
15.7
2.6
5.7
5.5
6.0
16.0
2.4
9.5
3.7
17.0
3.8
4.1
2.3
5.3
7.8
8.1
4.3
13.3
6.8
1.3
7.0
4.9
1.8
7.1
28.0
10.2
13.8
17.9
10.1
5.5
4.6
3.2
21.6
计算样本数据的平均数、中位数和众数,并据此估计全市居民用户月均用水量的平均数、中位数和众数.
(1) 平均数:一组数据是,则这组数据的平均值为.
问题1:在这个问题中,平均数是多少?
答:.
(2)中位数:一组数据按大小依次排列,处于中间位置的那个数(或中间两数的平均数),叫做这组数据的平均数.
问题2:居民用水的中位数是多少?
答:首先将数据按从小到大的顺序排列,因为100为偶数,所以存在最中间的两位数,第50位数是6.4,第51位数是6.8,所以中位数为.
(3) 众数:一组数据中出现次数最多的那个数据叫做众数.
问题3:居民用水的众数是多少?
答:根据刚才排序后的数据,很容易得到我们有两个中位数,他们都出现了4次,所以众数有两个分别为2.0和5.5.
问题4:由此估计总体居民的月均用水量是多少?
答:由样本的数据我们估计出全市居民用户月均用水量的平均数是8.79、中位数是6.6、众数是2.0和5.5.
二、分组数据的集中趋势
【探究2】将100户居民的月均用水量分成组距相同的9组.请问,如何从频率分布表和频率分布直方图中估计这组数据的平均数、中位数和众数?
(1)平均数:
EQ \\ac(○,1)频率分布表
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1.00
问题5:加权平均数的公式是什么?它是处理什么类型的数据的平均数?
答:,其中
问题6:对比刚才的平均数公式,我们已经没有了原始数据,以区间[1.2, 4.2)为例,我们用什么数值表示这组数据的大小最合理?
说明:通过分析,选择1.2估计整组数据,会使得数值偏小,选择4.2估计整组数据,会使得数值偏大,因此使用小组数据的中点(即区间端点的平均值)会更接近于大部分数据.
追问:我们还需要求小组数据的频数吗?
说明:通过公式发现对任一个小组,频数除以数据总个数即为频率.在求平均数时,只需频率乘以小组数据的中点即可.
分组数据的平均值等于每个小组的频率与小组数据的中点的乘积,再求和.
同理可得频率分布直方图中求平均数的方法为
EQ \\ac(○,2)频率分布直方图
因此
分组数据的平均值等于每个小组的频率与小组数据的中点的乘积,再求和.
对于频率直方图中数据的平均值等于每个小长方形的面积与小组数据的中点的乘积,再求和.
答:
注意:
频率分布表中数据的平均数为8.94
频率分布直方图中数据的平均数8.96
原始数据中数据的平均数为8.79,相差不大.
(2)中位数
问题7:中位数是最中间数据(中间两个数的平均值),我们没有原始数据了,怎么定义中位数呢?联想一下百分位数,我们是否可以根据百分位数定义中位数?
说明:
第50百分位数.
( 一组数据中至少有50%的数据小于或等于某个值,且至少有50%的数据大于或等于这个值,则这个值为该组数据的中位数)
EQ \\ac(○,1)频率分布表
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1.00
月均用水量在 4.2t 以下的居民用户所占比例为 23%,
月均用水量在 7.2t 以下的居民用户所占比例为23%+32%=55%,因此,中位数位于[4.2,7.2)内.
所以估计月均用水量样本数据的中位数约为 6.73.
EQ \\ac(○,2)频率分布直方图
注意:
频率分布表中数据的中位数为6.73
频率分布直方图中数据的中位数6.71
原始数据中数据的中位数为6.6
众数:
EQ \\ac(○,1)频率分布表
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1.00
问题8:众数为出现次数最多的数据,在分组数据中我们能也定义频数最大的那组数据中包含众数?
说明:
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2, 28.2]
45
0.45
合计
100
1.00
不能,因为原则上组距越宽包含的数据有可能越多,用宽组距的频数跟窄组距的频数比较,不能凸显众数的概念——即有可能出现的次数越大.所以为了规避组距对众数的影响,我们求单位组距内频数越多,也就是单位组距内频率越大,这组就包含数据的众数.
追问:从字面意思看,众即为多,也是密,与疏密程度有关的量是什么?
分析:反映了各组样本观测数据的疏密程度.
规定:最大组的区间的中点是众数.
是频率分布直方图中各矩形的高,众数为频率分布直方图中最高矩形底边中点的横坐标.
答:众数为t
注:
频率分布表中数据的众数为5.7
频率分布直方图中数据的众数5.7
原始数据中数据的众数为2.0和5.5
由样本的分组数据我们估计出全市居民用户月均用水量的平均数是8.96、中位数是6.71、众数是5.7.
小结:
引导学生思考平均代表三个统计量
从学生已知的知识出发,利用实际生活的实例回忆初中针对这部分知识的定义.
通过计算实际问题的集中趋势,回忆平均数、中位数和众数的计算方法.利用样本的值估计总体数据.
在实际问题中,回忆如何应用平均数、中位数、众数的计算方法
掌握了原始数据的集中趋势的方法后,探究分组数据的计算方法.
先以频率分布表中平均数的计算为例,引出分组数据平均数的计算方法.
对比分组数据没有原始数据的特点,假定数据是均匀分布,得到用小组数据的中点去估计小组内的所有数据的结论.
同时根据分组数据已知的是频率的特点,探究频率、频数和数据总个数的关系,利用小组数据的中点和频率求平均数的方法.
分组数据的估计值与原始数据的精确值差别不大.体会估计的有效性.
为没有了原始数据,就不存在最中间的数据,假定所有的数据都是均匀分布的,结合百分位数的定义,得出中位数就是第50百分位数.
通过理解频率直方图中小长方形的面积即为频率的特点,体会通过从数据小到大对应小长方形的面积和判断中位数所在的长方形,再根据成比例求出具体的中位数.
分组数据的估计值与原始数据的精确值差别不大.体会估计的有效性.
有原始数据的次数最多,与频数相结合,因为组距相等,得到频率组多,也就是 频率直方图中,小长方形最高的那组数据的中间值为众数.
引导 学生利用已学到的概念探究新问题
总结概念,深化集中方式的计算方法.
例题
例1:某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(单位:分,均为整数)分成七段后画出如图所示的频率分布直方图.估计这次成绩的平均数、中位数和众数.
答:平均数为
=68.5
中位数:
所以中位数在区间[70,80)上.设中位数为y,则
解得y≈71.7,所以估计中位数是71.7分.
众数为最高小长方形的横坐标的小组数据的中点,
所以众数为.
通过对例题的分析,巩固分组数据中平均数、中位数和众数的计算方法,进一步体会每个量的特征及意义,培养学生分析问题和解决问题的能力.
新课
三、平均数、中位数和众数分析
平均数
中位数
众数
7.7
8.79
6.6
2.0和5.5
77
9.483
6.6
2.0和5.5
(1)整体特征
问题9:数据的集中趋势有三个量可以度量,它们分别有什么优缺点?
名称
优点
缺点
平均数
能反映出更多关于样本数据全体的信息
任何一个数据的改变都会引起平均数的改变,数据越“极端”,对平均数的影响越大
中位数
①不受少数几个极端数据的影响;②容易得到,便于利用中间数据的信息
对极端值不敏感
众数
①体现了样本数据的最大集中点;②容易得到; = 3 \* GB3 ③不受极端值影响.
①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体特征
(2)平均数、中位数
单峰
右边“拖尾”,左边“拖尾”
左图:右边“拖尾”,平均数为68.5,中位数为71.7,平均数小于中位数.
右图:左边“拖尾”,平均数为8.96,中位数为6.71,平均数大于中位数.
问题10:左右拖尾对平均数和中位数有什么影响?
分析:单峰,
平均数和中位数大体上差不多.
右边“拖尾”,平均数大于中位数.
左边“拖尾”,平均数小于中位数.
(3)集中趋势的选择
问题11:100户居民的月均用水量的问题中,用分组数据估计出的值:平均数为8.96、中位数约为6.71、众数为5.7,我们选择哪一个数据度量集中趋势呢?
提示:根据平均数、中位数和众数的特点以及需求选择符合条件的统计量表示集中趋势.比如,水利部门考虑供水量则需要用平均数,极大值要考虑到,如果只选择众数或者中位数就会出现供水量不足的情况.如果考虑大部分居民的用水情况,则只需选择众数或者中位即可.
通过一个极端大的数据,体会极端数据对平均数、中位数和众数的影响。
通过对比探究题中的图形和例1中的图像得到左右拖尾对平均数和中位数的影响.培养学生分析问题、发现问题和解决问题的能力.
例题
例2:某学校要制定高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要的校服规格如下表所示.
校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
如果用一个量代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?
分析:校服规格是分类型数据,不能求平均数.
选择众数165作为该校高一年级女生校服的规格比较合适.
注:
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
用上表的数据估计全国高一年级女生校服规格,合理吗?
答:由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
例3:某公司的33名职工的月工资(单位:元)如下:
职务
董事长
副董事长
董事
总经理
经理
管理
职员
人数
1
1
2
1
5
3
20
工资
30000
20000
3500
3000
2500
2000
1500
计算平均数、中位数、众数.试问哪个统计量更能反映这个公司员工的工资水平?(精确到1元)
答:平均数为
中位数为1500.
众数为1500.
哪个统计量更能反映这个公司员工的工资水平?
分析:在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映公司员工的工资水平.
回到引例
引例: 假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
分析:单纯从一个平均收入20万元,不能判断这家公司的工资是高还是低,还需要借助工资的分布情况等其他信息进一步判断.
通过实际问题,体会在度量数据的集中趋势时,平均数、中位数和众数的不同作用.
总结
对本节课内容做一个回顾,形成整体的认识.并回顾探究新问题的学习方法---类比法.
作业
1.已知某市2015年全年空气质量等级如下表所示.
空气质量等级(空气质量指数AQI)
频数
频率
优(AQI≤50)
83
22.8%
良(50
相关教案
这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体教案设计,共8页。
这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体教案,共8页。
这是一份高中数学9.2 用样本估计总体教案及反思,共6页。教案主要包含了总体集中趋势的估计,总体离散程度的估计,典例分析,巩固练习等内容,欢迎下载使用。