北师大版 (2019)必修 第一册4.1 样本的数字特征学案
展开藏宝图只能够标出宝藏所在的具体位置及路线图,但真正探索宝藏的秘密还有很多工作要做,同样杂乱无章的数据仅用统计图表来分析显然是不全面的,不同的数字特征往往具有不同的意义和作用.
[问题] 你知道平均数、中位数、众数所代表的含义吗?
知识点一 平均数、中位数、众数
1.平均数:平均数是指一组数据的平均值.
2.中位数:将一组数据按从小到大的顺序排列后,“中间”的那个数据.
3.众数:一组数据中出现次数最多的数据.
4.平均数、中位数、众数都刻画了一组数据(样本)的“中心”位置,通常称它们为数据的集中趋势参数.
5.在统计中,平均数是最常用的量.如数据中个别数据特别大或特别小时,用中位数会更合理.
eq \a\vs4\al()
众数、中位数、平均数的比较
1.中位数一定是样本数据中的一个数吗?
提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数据就是中位数;如果有偶数个数据,则取中间两个数据的平均数才是中位数.
2.一组数据的众数可以有几个?中位数是否也具有相同的结论?
提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.
1.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( )
A.7,7 B.8,7.5
C.7,7.5 D.8,6
解析:选C 从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是eq \f(7+8,2)=7.5.
2.已知一组数据的平均数是x,众数是m,中位数是n,将每个数据加上3后得到一组新数据,则这组新数据的平均数、众数、中位数分别为________.
解析:根据平均数的计算公式可得平均数变为x+3.因为原众数为m,原中位数为n,每个数据加上3后,m会变为m+3,n会变为n+3,所以众数变为m+3,中位数变为n+3.
答案:x+3,m+3,n+3
知识点二 极差、方差和标准差
1.极差:数据中最大值和最小值的差.
2.方差:方差刻画的是数据偏离平均数的离散程度.
3.标准差:方差的算术平方根s=eq \r(s2)=eq \r(\f((x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2,n)),称之为标准差.
eq \a\vs4\al()
1.标准差、方差描述了一组数据围绕着平均数波动的大小,标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
2.标准差、方差为0时,表明样本数据全相等,数据没有波动幅度和离散性.
3.标准差的大小不会超过极差.
1.方差和标准差的取值范围是什么?
提示:标准差、方差的取值范围是[0,+∞).
2.方差和标准差是如何反映一组数据的离散程度的?
提示:标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
某校一名篮球运动员在五场比赛中所得分数分别为8,9,10,13,15,则该运动员在这五场比赛中得分的平均值为________,方差为________,标准差为________.
解析:依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为eq \f(8+9+10+13+15,5)=11.
由方差公式得s2=eq \f(1,5)[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=eq \f(1,5)(9+4+1+4+16)=6.8.
s=eq \r(6.8)=eq \f(\r(170),5).
答案:11 6.8 eq \f(\r(170),5)
[例1] 某工厂人员及周工资构成如表:
(1)求工厂人员周工资的众数、中位数、平均数;
(2)平均数能客观地反映该工厂的工资水平吗?为什么?
[解] (1)由题中表格可知周工资的众数为1 200元,中位数为1 220元,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230(元).
(2)虽然平均数为1 230元,但从题干表格中所列出的数据可见,只有经理和6名管理人员的周工资在平均数以上,其余的人的周工资都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.
eq \a\vs4\al()
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
[提醒] 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.
[跟踪训练]
1.某射击运动员进行打靶练习,已知打十枪的靶数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.c>a>b
C.b>c>a D.c>b>a
解析:选D 平均数a=eq \f(1,10)×(9+10+7+8+10+10+6+8+9+7)=8.4,中位数b=8.5,众数c=10,因此c>b>a,故选D.
2.已知样本数据x1,x2,…,xn的平均值eq \(x,\s\up6(-))=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均值为________.
解析:由条件知eq \(x,\s\up6(-))=eq \f(x1+x2+…+xn,n)=5,则所求平均值eq \(x,\s\up6(-))0=eq \f(2x1+1+2x2+1+…+2xn+1,n)=
eq \f(2(x1+x2+…+xn)+n,n)=2eq \(x,\s\up6(-))+1=2×5+1=11.
答案:11
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
[解] (1)由题图知众数为eq \f(70+80,2)=75(分).
(2)由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.故这次测试数学成绩的中位数为73.3分.
[母题探究]
1.(变设问)若本例的条件不变,求数学成绩的平均分.
解:由题图知这次数学成绩的平均分为eq \f(40+50,2)×0.005×10+eq \f(50+60,2)×0.015×10+eq \f(60+70,2)×0.02×10+eq \f(70+80,2)×0.03×10+eq \f(80+90,2)×0.025×10+eq \f(90+100,2)×0.005×10=72(分).
2.(变设问)若本例条件不变,求80分以下的学生人数.
解:[40,80)分的频率为(0.005+0.015+0.020+0.030)×10=0.7,
所以80分以下的学生人数为80×0.7=56.
eq \a\vs4\al()
众数、中位数、平均数与频率分布直方图的联系
(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标;
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值;
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.
[跟踪训练]
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65分,又∵第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,∴中位数为60+5=65(分).
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),∴平均成绩约为67分.
[例3] (链接教科书第168页例3)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:
甲:7,8,6,9,6,5,9,9,7,4.
乙:9,5,7,8,7,6,8,6,7,7.
(1)分别计算甲、乙两人射击命中环数的极差、众数和中位数;
(2)分别计算甲、乙两人射击命中环数的平均数、方差、标准差;
(3)比较两人的成绩,然后决定选择哪一个人参赛.
[解] (1)对于甲:极差是9-4=5,众数是9,中位数是7;
对于乙:极差是9-5=4,众数是7,中位数是7.
(2)eq \(x,\s\up6(-))甲=eq \f(7+8+6+9+6+5+9+9+7+4,10)=7,
seq \\al(2,甲)=eq \f(1,10)×[(7-7)2+(8-7)2+(6-7)2+(9-7)2+(6-7)2+(5-7)2+(9-7)2+(9-7)2+(7-7)2+(4-7)2]=2.8,
s甲=eq \r(seq \\al(2,甲))=eq \r(2.8)≈1.673.
eq \(x,\s\up6(-))乙=eq \f(9+5+7+8+7+6+8+6+7+7,10)=7,
seq \\al(2,乙)=eq \f(1,10)×[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=1.2,
s乙=eq \r(seq \\al(2,乙))=eq \r(1.2)≈1.095.
(3)∵eq \(x,\s\up6(-))甲=eq \(x,\s\up6(-))乙,s甲>s乙,
∴甲、乙两人的平均成绩相等,乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.
eq \a\vs4\al()
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定.
[跟踪训练]
甲、乙两位同学进行投篮比赛,每人玩5局.每局在指定线外投篮,若第1次不进,则再投第2次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮的次数;若第6次投不进,该局也结束,记为“×”.在每局中, 第1次投进得6分,第2次投进得5分,第3次投进得4分,…,第6次投进得1分,若第6次投不进,得0分.两人的投篮情况如下:
请判断哪位同学投篮的水平较高.
解:甲同学投篮的水平较高.理由如下:
依题意,甲、乙两位同学的得分情况如下表:
通过计算,可得eq \(x,\s\up6(-))甲=eq \f(2+0+3+2+6,5)=2.6(分),
eq \(x,\s\up6(-))乙=eq \f(0+5+3+5+0,5)=2.6(分),
seq \\al(2,甲)=eq \f(1,5)[(2-2.6)2+(0-2.6)2+(3-2.6)2+(2-2.6)2+(6-2.6)2]=3.84,
seq \\al(2,乙)=eq \f(1,5)[(0-2.6)2+(5-2.6)2+(3-2.6)2+(5-2.6)2+(0-2.6)2]=5.04,
所以eq \(x,\s\up6(-))甲=eq \(x,\s\up6(-))乙,seq \\al(2,甲)
1.(多选)下列对一组数据的分析,说法正确的是( )
A.数据极差越小,样本数据分布越集中、稳定
B.数据平均数越小,样本数据分布越集中、稳定
C.数据标准差越小,样本数据分布越集中、稳定
D.数据方差越小,样本数据分布越集中、稳定
解析:选ACD 极差反映了最大值与最小值差的情况,极差越小,数据越集中.方差、标准差是用来衡量一组数据波动大小的量,方差、标准差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定.方差、标准差较小的数据波动较小,稳定程度较高.平均数越小,说明数据整体上偏小,不能反映数据稳定与否.故选A、C、D.
2.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是eq \f(1,3),那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别为( )
A.2,eq \f(1,3) B.2,1
C.4,eq \f(1,3) D.4,3
解析:选D 由题意得数据x1,x2,x3,x4,x5的平均数x=2,方差s2=eq \f(1,3),所以数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为x′=3x-2=3×2-2=4,方差为s′2=9s2=9×eq \f(1,3)=3.
3.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( )
A.12.5,12.5
B.12.5,13
C.13,12.5
D.13,13
解析:选B 众数是频率分布直方图中最高矩形的底边中点的横坐标.∵中间的一个矩形最高,10与15的平均数是12.5,∴众数是12.5.
中位数是把频率分布直方图分成两个面积相等部分的平行于纵轴的直线与横轴交点的横坐标.∵第一个矩形的面积是0.2,第三个矩形的面积是1-(0.04+0.10)×5=0.3,∴中位数线将第二个矩形分成3∶2两部分,∴中位数是13.故选B.
4.一组数据1,10,5,2,x,2,且2
答案:4
5.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.
这组数据的平均数是x=eq \f(1,17)(1.50×2+1.60×3+…+1.90×1)=eq \f(28.75,17)≈1.69(m).
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
新课程标准解读
核心素养
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义
数据分析
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义
数学运算、数据分析
名称
优点
缺点
众
数
①体现了样本数据的最大集中点;
②容易计算
①它只能表达样本数据中很少的一部分信息;
②无法客观地反映总体的特征
中
位
数
①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;
②容易计算,便于利用中间数据的信息
对极端值不敏感
平
均
数
代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据的信息
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
环数
5
6
7
8
9
10
人数
1
2
7
6
3
1
平均数、众数、中位数的计算
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资/元
2 200
1 250
1 220
1 200
490
人数
1
6
5
10
1
23
由频率分布直方图求平均数、中位数和众数
极差、方差、标准差的计算及应用
第1局
第2局
第3局
第4局
第5局
甲
5次
×
4次
5次
1次
乙
×
2次
4次
2次
×
第1局
第2局
第3局
第4局
第5局
甲
2
0
3
2
6
乙
0
5
3
5
0
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
北师大版 (2019)必修 第一册4.1 样本的数字特征学案: 这是一份北师大版 (2019)必修 第一册4.1 样本的数字特征学案,共8页。
高中数学北师大版 (2019)必修 第一册4.1 样本的数字特征导学案: 这是一份高中数学北师大版 (2019)必修 第一册4.1 样本的数字特征导学案,共13页。
高中数学北师大版 (2019)必修 第一册4.1 样本的数字特征学案设计: 这是一份高中数学北师大版 (2019)必修 第一册4.1 样本的数字特征学案设计,共17页。学案主要包含了教学目标,知识清单,经典例题,课堂达标,能力提升,参考答案等内容,欢迎下载使用。