湘教版(2019)必修 第一册6.4 用样本估计总体导学案
展开
6.4 用样本估计总体
6.4.1 用样本估计总体的集中趋势
新课程标准解读 | 核心素养 |
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数) | 数据分析、数学运算 |
2.理解集中趋势参数的统计含义 | 数学运算、数学建模 |
中国体育彩票的种类有:超级大乐透、排列3、排列5、七星彩、地方体彩、足球彩票、竞彩、顶呱刮等等.体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的统计量,用样本估计总体的集中趋势,然后得出较科学的“推测”结果.
[问题] 你想知道他们研究哪些统计量才有助于科学“推测”的吗?
知识点一 统计学中的两个统计概念
1.总体参数:是用来描述总体特征的指标,常见的总体参数有总体平均数、众数和中位数及总体方差等.
2.统计量:是用来描述样本特征的指标,常见的统计量有样本平均数、样本方差等.
统计学的基本思想是什么?
提示:用样本统计量中的数据特征估计总体参数的数据特征.
知识点二 平均数(均值)
1.若样本容量为n,第i个个体是xi,则样本平均数=.
2.若取值为x1,x2,…,xn的频率分别为f1,f2,…,fn,则其平均数为=x1f1+x2f2+…+xnfn.
3.分层抽样中总体均值μ的简单估计
在分层抽样中,用N表示总体A的个体总数,若将总体A分为L层,用Ni表示第i层(i=1,2,…,L)的个体总数,则有N=N1+N2+…+NL.
我们称Wi=(i=1,2,…,L)为第i层的层权,对i=1,2,…,L,用i表示从第i层抽出样本的平均值,我们称=W11+W22+…+WLL是总体均值μ的简单估计.
1.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
解析:=6.
答案:6
2.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:
等待时间 (分钟) | [0,5) | [5,10) | [10,15) | [15,20) | [20,25] |
频数 | 4 | 8 | 5 | 2 | 1 |
用上述分组资料计算出病人平均等待时间的估计值x=________.
解析:=(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.
答案:9.5
知识点三 众数、中位数
1.众数:观测数据中出现次数最多的数是众数.
2.中位数:将一组观测数据按从小到大的顺序排列后,处于中间位置的数是中位数.
具体而言,当数据的个数是奇数时,处于中间位置的数就是中位数;当数据的个数是偶数时,则中间两个数的平均数即为中位数.
众数、中位数、平均数的比较
名称 | 优点 | 缺点 |
众 数 | ①体现了样本数据的最大集中点; ②容易计算 | ①它只能表达样本数据中很少的一部分信息; ②无法客观地反映总体的特征 |
中 位 数 | ①不受少数几个极端数据(即排序靠前或靠后的数据)的影响; ②容易计算,便于利用中间数据的信息 | 对极端值不敏感 |
平 均 数 | 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据的信息 | 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大 |
1.中位数一定是样本数据中的一个数吗?
提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数据就是中位数;如果有偶数个数据,则取中间两个数据的平均数才是中位数.
2.一组数据的众数可以有几个?中位数是否也具有相同的结论?
提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.
某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( )
环数 | 5 | 6 | 7 | 8 | 9 | 10 |
人数 | 1 | 2 | 7 | 6 | 3 | 1 |
A.7,7 B.8,7.5
C.7,7.5 D.8,6
解析:选C 从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是=7.5.
众数、中位数、平均数的计算 |
[例1] (链接教科书第230页例1)(多选)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:
甲:20,22,27,8,12,13,37,25,24,26;
乙:14,9,13,18,19,20,23,21,21,11.
则下面结论中正确的是( )
A.甲的极差是29 B.乙的众数是21
C.甲的平均数为21.4 D.甲的中位数是24
[解析] 把两组数据按从小到大的顺序排列,得
甲:8,12,13,20,22,24,25,26,27,37;
乙:9,11,13,14,18,19,20,21,21,23.
故甲的最大值为37,最小值为8,则极差为29,所以A正确;乙中出现最多的数据是21,所以B正确;甲的平均数为x甲=(8+12+13+20+22+24+25+26+27+37)=21.4,所以C正确;甲的中位数为(22+24)=23,故D不正确.
[答案] ABC
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
[跟踪训练]
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
解析:选C 从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.
2.已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )
A.1 B.2
C.3 D.4
解析:选A 因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故选A.
分层抽样中总体均值u的简单估计 |
[例2] (链接教科书第231页例3)某地统计部门为了解企业员工的收入状况,决定进行抽样调查.估计该地共有产业工人大约50 000人,企业管理人员约1 000人,工人与管理人员的月工资收入差异比较大.该地统计部门用分层抽样的方法抽取产业工人500人,企业管理人员10人.被抽取的500名产业工人的人均月工资为5 328元,10名企业管理人员的人均月工资为8 426元,试估计这个地区企业员工的人均月工资.
[解] 被抽取的500名产业工人的人均月工资为5 328元,故这500名产业工人的月工资总额为(5 328×500)元.同理,被抽取的10名企业管理人员的月工资总额为(8 426×10)元,所以被抽取的这510名企业员工的月工资总额为(5 328×500+8 426×10)元.
因此,被抽取的这510名企业员工的人均月工资(即样本的平均数为)≈5 389(元).
故估计该地区企业员工的人均月工资约为5 389元.
总体均值u的简单估计
已知将总体分为L层,每层的样本平均数为i(i=1,2,…,L),且第i层的层数为Wi=(N为总体容量,Ni为第i层的样本容量).
则总体均值u的简单估计=W11+W22+…+WLL即为加权平均数(层权Wi为第i层的频率fi).
[跟踪训练]
甲、乙两位同学相约晚上在某餐馆吃饭.他们分别在A,B两个网站查看同一家餐馆的好评率.甲在网站A查到的好评率是98%,而乙在网站B查到的好评率是85%.综合考虑这两个网站的信息,应该如何得到这家餐馆的总好评率?
解:好评率是由好评人数除以总评价人数得到的.98%的好评率意味着如果有100人评价,那么其中98%人给了好评.
设在网站A评价该餐馆的人数为n1,其中给出好评的人数为m1;在网站B评价该餐馆的人数为n2,其中给出好评的人数为m2.由题目条件,=98%,=85%.综合A,B两个网站的信息,这家餐馆的总好评率应为,化简得=0.98·+0.85·.
其中,和分别是各自的层权,总好评率等于相应的好评率与其层权乘积的和.
所以除非再知道A,B两个网站评价人数的比例关系,否则并不能求出总好评率.
由以上分析可知,当且仅当n1=n2时,总好评率等于=91.5%.
平均数、中位数、众数的应用 |
[例3] (链接教科书第234页例4)据了解,某公司的33名职工月工资(单位:元)如下:
职务 | 董事长 | 副董事长 | 董事 | 总经理 | 经理 | 管理员 | 职员 |
人数 | 1 | 1 | 2 | 1 | 5 | 3 | 20 |
工资 | 11 000 | 10 000 | 9 000 | 8 000 | 6 500 | 5 500 | 4 000 |
(1)求该公司职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从10 000元提升到20 000元,董事长的工资从11 000元提升到30 000元,那么新的平均数、中位数、众数又是多少(精确到元)?
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
[解] (1)平均数是:=4 000+(7 000+6 000+5 000×2+4 000+2 500×5+1 500×3+0×20)≈4 000+1 333=5 333(元).
中位数是4 000元,众数是4 000元.
(2)平均数是=4 000+(26 000+16 000+5 000×2+4 000+2 500×5+1 500×3+0×20)≈4 000+2 212=6 212(元).
中位数是4 000元,众数是4 000元.
(3)在这个问题中,中位数和众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大;
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
[跟踪训练]
下表是五年级一、二两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班 | 19 | 33 | 26 | 29 | 28 | 33 | 34 | 35 | 33 | 33 | 30 |
二班 | 25 | 27 | 29 | 28 | 29 | 30 | 29 | 35 | 29 | 30 | 29 |
(1)这两组数据的平均数,中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
解:(1)一班平均数:(19+33+26+29+28+33+34+35+33+33+30)÷11=333÷11≈30.27(次),
一班数据从小到大排列为:19,26,28,29,30,33,33,33,33,34,35,所以一班中位数为33次,33出现的次数最多,众数是33次;
二班平均数:(25+27+29+28+29+30+29+35+29+30+29)÷11=320÷11≈29.09(次),
二班数据从小到大排列为:25,27,28,29,29,29,29,29,30,30,35,所以二班的中位数是29次,
29出现的次数最多,所以二班的众数是29次.
(2)运用平均数表示两个班的成绩更合适.
1.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数 B.平均数<中位数<众数
C.中位数<众数<平均数 D.众数=中位数=平均数
答案:D
2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数和中位数分别为( )
A.84,68 B.84,78
C.84,81 D.78,81
解析:选C 将所给数据按从小到大排列得68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两个数是79,83,它们的平均数为81,即中位数为81.
3.(多选)下列说法中,正确的是( )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
解析:选BCD 数据2,4,6,8的中位数为=5,显然A是错误的,B、C、D都是正确的.故选B、C、D.
4.小玲家的鱼塘里养了2 500条鲢鱼,按经验,鲢鱼的成活率约为80%.现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次进行统计,得到的数据如下表:
| 鱼的条数 | 平均每条鱼的质量/kg |
第一次捕捞 | 20 | 1.6 |
第二次捕捞 | 10 | 2.2 |
第三次捕捞 | 10 | 1.8 |
那么,鱼塘中鲢鱼的总质量约是________ kg.
解析:平均每条鱼的质量为=1.8(kg),
因为成活的鱼的总数约2 500×80%=2 000(条),
所以总质量约是2 000×1.8=3 600(kg).
答案:3 600
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体导学案及答案: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体导学案及答案,共4页。
人教A版 (2019)必修 第二册9.2 用样本估计总体学案: 这是一份人教A版 (2019)必修 第二册9.2 用样本估计总体学案,共6页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,课堂小结,参考答案等内容,欢迎下载使用。
2020-2021学年6.4 用样本估计总体学案设计: 这是一份2020-2021学年6.4 用样本估计总体学案设计,共13页。