- 第58讲 随机事件的概率与古典概型(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版) 试卷 试卷 0 次下载
- 第61讲 离散型随机变量的均值与方差、正态分布(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版) 试卷 试卷 0 次下载
- 第60讲 n次独立重复试验及二项分布(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版) 试卷 试卷 0 次下载
- 第64讲 求概率统计的综合问题(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版) 试卷 0 次下载
- 第63讲 变量间的相关关系、统计案例(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版) 试卷 试卷 1 次下载
第62讲 随机抽样与用样本估计总体(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版)
展开第62讲 随机抽样与用样本估计总体
思维导图
知识梳理
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各个小方形的面积总和等于1.
4.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
5.条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
6.中位数、众数、平均数的定义
(1)中位数
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(2)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(3)平均数
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
7.样本的数字特征
如果有n个数据x1,x2,…,xn,那么这n个数的
(1)标准差s= .
(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].
题型归纳
题型1 抽样方法
【例1-1】假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行)( )
A.455 068 047 447 176
B.169 105 071 286 443
C.050 358 074 439 332
D.447 176 335 025 212
【解析】选B 由随机数表法的随机抽样的过程可知最先抽出的5名同学的号码为169,105,071,286,443.
【例1-2】(2019·河南名校联考)《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果四舍五入,保留整数).
【解析】按照钱的多少按比例出钱,所以丙应该出钱为×100=≈17.
【答案】17
【跟踪训练1-1】某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).
| 篮球组 | 书画组 | 乐器组 |
高一 | 45 | 30 | a |
高二 | 15 | 10 | 20 |
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
【解析】由分层抽样得=,解得a=30.
【答案】30
【名师指导】
1.应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
2.分层抽样问题的类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”.
题型2 频率分布直方图的应用
【例2-1】(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解】 (1)由已知得0.70=a+0.20+0.15,故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
【跟踪训练2-1】(2019·南昌市第一次模拟测试)市面上有某品牌A型和B型两种节能灯,假定A型节能灯使用寿命都超过5 000小时.经销商对B型节能灯使用寿命进行了调查统计,得到如下频率分布直方图:
某商家因原店面需重新装修,需租赁一家新店面进行周转,合约期一年.新店面只需安装该品牌节能灯5支(同种型号)即可正常营业.经了解,A型20瓦和B型55瓦的两种节能灯照明效果相当,都适合安装.已知A型和B型节能灯每支的价格分别为120元、25元,当地商业电价为0.75元/千瓦时.假定该店面一年周转期的照明时间为3 600小时,若正常营业期间灯坏了立即购买同型灯管更换.(用频率估计概率)
(1)根据频率分布直方图估算B型节能灯的平均使用寿命;
(2)根据统计知识知,若一支灯管一年内需要更换的概率为p,那么n支灯管估计需要更换np支,若该商家新店面全部安装了B型节能灯,试估计一年内需更换的数量;
(3)若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由.
【解】(1)由题图可知,各组中值依次为3 100,3 300,3 500,3 700,对应的频率依次为0.1,0.3,0.4,0.2,故B型节能灯的平均使用寿命为3 100×0.1+3 300×0.3+3 500×0.4+3 700×0.2=3 440(小时).
(2)由题图可知,使用寿命不超过3 600小时的频率为0.8,将频率视为概率,每支灯管需要更换的概率为0.8,故估计一年内5支B型节能灯需更换5×0.8=4(支).
(3)若选择A型节能灯,一年共需花费5×120+3 600×5×20×0.75×10-3=870(元);
若选择B型节能灯,一年共需花费(5+4)×25+3 600×5×55×0.75×10-3=967.5(元).
因为967.5>870,所以该商家应选择A型节能灯.
【跟踪训练2-2】某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元) | 人数 | 频率 |
(0,1] | 16 | 0.08 |
(1,2] | 24 | 0.12 |
(2,3] | x | p |
(3,4] | y | q |
(4,5] | 16 | 0.08 |
(5,6] | 14 | 0.07 |
总计 | 200 | 1.00 |
已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?
【解】(1)根据题意有
解得∴p=0.40,q=0.25.
补全频率分布直方图如图所示.
(2)根据题意,抽取网购金额在(1,2]内的人数为
×5=3(人).
抽取网购金额在(4,5]内的人数为×5=2(人).
故此2人来自不同群体的概率P==.
【名师指导】
熟记结论 | (1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1; (2)×组距=频率; (3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数 |
易错防范 | 频率分布直方图的纵坐标是,而不是频率 |
题型3 用样本的数字特征估计总体的数字特征
【例3-1】 (2019·昆明市诊断测试)《中国大能手》是央视推出的一档大型职业技能挑战赛类节目,旨在通过该节目,在全社会传播和弘扬“劳动光荣、技能宝贵、创造伟大”的时代风尚.某公司准备派出选手代表公司参加《中国大能手》职业技能挑战赛.经过层层选拔,最后集中在甲、乙两位选手在一项关键技能的区分上,选手完成该项挑战的时间越少越好.已知这两位选手在15次挑战训练中,完成该项关键技能挑战所用的时间t(单位:秒)及挑战失败(用“×”表示)的情况如下表:
序号x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
t甲 | × | 96 | 93 | × | 92 | × | 90 | 86 | × | × | 83 | 80 | 78 | 77 | 75 |
t乙 | × | 95 | × | 93 | × | 92 | × | 88 | 83 | × | 82 | 80 | 80 | 74 | 73 |
据上表中的数据,应用统计软件得下表:
| 均值/秒 | 方差 | 线性回归方程 |
甲 | 85 | 50.2 | 甲=-1.59x+99.28 |
乙 | 84 | 54 | 乙=-1.73x+100.25 |
(1)根据上述回归方程,预测甲、乙分别在下一次完成该项关键技能挑战所用的时间;
(2)若该公司只有一个参赛名额,根据以上信息,判断哪位选手代表公司参加职业技能挑战赛更合适?请说明你的理由.
【解】 (1)当x=16时,甲=-1.59×16+99.28=73.84(秒),
乙=-1.73×16+100.25=72.57(秒).
(2)甲、乙两位选手完成该项关键技能挑战成功的次数都为10,失败次数都为5,
所以只需要比较他们完成该项关键技能挑战成功的情况即可,根据所给信息,结合(1)中预测结果,综合分析,选手乙代表公司参加技能挑战赛更合适,理由如下:
因为在相同次数的挑战练习中,两位选手在该项关键技能挑战的完成次数和失败次数都分别相同,甲>乙,所以乙选手用时更短.
由于s<s,虽然甲选手的发挥更稳定,但稳定在较大的平均数上,随着训练次数增加,甲、乙用时都在逐渐减少,乙的方差大,说明乙进步更大.
从(1)的计算结果乙<甲进一步说明,选手乙代表公司参加技能挑战赛更合适.
【跟踪训练3-1】甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
【解析】选C 甲的平均数是=6,中位数是6,极差是4,方差是=2;乙的平均数是=6,中位数是5,极差是4,方差是=,比较可得选项C正确.
【跟踪训练3-2】甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:分)如图所示:
(1)分别求出甲、乙两人成绩的平均数与方差;
(2)根据(1)的结果,对两人的成绩作出评价.
【解】(1)由题图可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13, 乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s,可知乙的成绩较稳定.
从题图看,甲的成绩基本呈上升趋势,而乙的成绩上下波动,因此甲的成绩在不断提高,而乙的成绩则无明显提高.
【跟踪训练3-3】(2019·福建五校第二次联考)甲、乙、丙三人去某地务工,其工作受天气影响,雨天不能出工,晴天才能出工.其计酬方式有两种,方式一:雨天没收入,晴天出工每天250元;方式二:雨天每天120元,晴天出工每天200元.三人要选择其中一种计酬方式,并打算在下个月(30天)内的晴天都出工,为此三人作了一些调查,甲以去年此月的下雨天数(10天)为依据作出选择;乙和丙在分析了当地近9年此月的下雨天数(n)的频数分布表(见下表)后,乙以频率最大的n值为依据作出选择,丙以n的平均值为依据作出选择.
n | 8 | 9 | 10 | 11 | 12 | 13 |
频数 | 3 | 1 | 2 | 0 | 2 | 1 |
(1)试判断甲、乙、丙选择的计酬方式,并说明理由;
(2)根据统计范围的大小,你觉得三人中谁的依据更有指导意义?
(3)以频率作为概率,求未来三年中恰有两年此月下雨不超过11天的概率.
【解】(1)按计酬方式一、二的收入分别记为f(n),g(n),
f(10)=250×(30-10)=5 000,
g(10)=120×10+200×(30-10)=5 200,
所以甲选择计酬方式二;
由频数分布表知频率最大的n=8,
f(8)=250×(30-8)=5 500,
g(8)=120×8+200×(30-8)=5 360,
所以乙选择计酬方式一;
n的平均值为×(8×3+9×1+10×2+12×2+13×1)=10,
所以丙选择计酬方式二.
(2)甲统计了1个月的情况,乙和丙统计了9个月的情况,
但乙只利用了部分数据,丙利用了所有数据,
所以丙的统计范围最大,
三人中丙的依据更有指导意义.
(3)任选一年,此月下雨不超过11天的频率为=,以此作为概率,则未来三年中恰有两年此月下雨不超过11天的概率为C2×=.
【名师指导】
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
高中数学高考第62讲 随机抽样与用样本估计总体(达标检测)(学生版): 这是一份高中数学高考第62讲 随机抽样与用样本估计总体(达标检测)(学生版),共12页。
(新高考)高考数学一轮复习第62讲《随机抽样与用样本估计总体》达标检测(解析版): 这是一份(新高考)高考数学一轮复习第62讲《随机抽样与用样本估计总体》达标检测(解析版),共18页。
第50讲 双曲线(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版): 这是一份第50讲 双曲线(讲) 2021-2022年新高考数学一轮复习考点归纳 (学生版+教师版),文件包含第50讲双曲线讲教师版docx、第50讲双曲线讲学生版docx等2份试卷配套教学资源,其中试卷共15页, 欢迎下载使用。