统计与概率重难点突破
展开统计与概率重难点突破
重点 | 1. 用样本估计总体: 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。 2. 古典概型: 理解古典概型及其概率计算公式;会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。 |
难点 | 1. 统计中相关概念及图表的理解与具体实际应用,合理构建统计模型; 2. 古典概型基本事件的寻找与限定问题概率求解及实际应用。 |
考试要求 | 考试 题型 选择题、填空题、解答题 难度 中等 |
核心知识点一:频率分布直方图
1. 频率、频数、样本容量的计算方法
(1)×组距=频率
(2)=频率,=样本容量,
样本容量×频率=频数
(3)各个小方形的面积总和等于1 。
2. 频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;
(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布。
核心知识点二:古典概型
应用古典概型求某事件概率的步骤
第一步,判断试验的结果是否有限、是否为等可能事件,设出所求事件A;
第二步,分别求出基本事件的总数n与所求事件A中所包含的基本事件个数m;
第三步,利用公式,求出事件A的概率。
提醒:古典概型中的基本事件都是互斥的。
核心知识点三:古典概型与统计相结合
求解古典概型的交汇问题,关键是把相关的知识转化为事件,然后利用古典概型的有关知识解决,其解题流程为:
典例一:频率分布直方图 |
例题1 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为:
,所以样本中分数小于70的频率为。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4。
(2)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为。
所以总体中分数在区间内的人数估计为:。
(3)由题意可知,样本中分数不小于70的学生人数为:(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为:。
所以样本中男生人数为:30×2=60,女生人数为:100-60=40(人),男生和女生人数的比例为60:40=3:2,所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2。
总结提升:
1. 两个主要考查角度:
(1)利用频率分布直方图求频率、频数;
(2)利用频率分布直方图估计总体。
2. 熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2)×组距=频率;
(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数。
3. 易错防范:频率分布直方图的纵坐标是频率/组距,而不是频率。
典例二:样本的数字特征 |
例题2 某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表。
分组 | |||||
企业数 | 2 | 24 | 53 | 14 | 7 |
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)。(精确到0.01)
附:。
解:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为。
产值负增长的企业频率为。
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%。
(2),
,
,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%。
总结提升:
1. 众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。
(2)方差的简化计算公式:s2=[(x+x+…+x)-n2]或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方。
2. 主要命题角度:
(1)样本的数字特征与频率分布直方图交汇
(2)样本的数字特征与茎叶图交汇
①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义。
②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等。
(3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据:
①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小。标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定。
②用样本估计总体就是利用样本的数字特征来描述总体的数字特征。
典例三:古典概型 |
例题3 生物实验室有5只兔子,其中只有3只测量过某项指标,若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为( )
A. B.
C. D.
答案:B
解析:设其中做过测试的3只兔子为,剩余的2只为,
则从这5只中任取3只的所有取法有:,,共10种。
其中恰有2只做过测试的取法有,共6种,所以恰有2只做过测试的概率为,故选B。
易错提醒:
确定基本事件空间可以采用“树图法”、“列表法”,要注意确定的基本事件不重不漏。
典例四:古典概型与统计相结合 |
例题4 为了了解某省各景区在大众中的熟知度,随机从本省岁的人群中抽取了人,得到各年龄段人数的频率分布直方图如图所示,现让他们回答问题“该省有哪几个国家级旅游景区?”,统计结果如下表所示:
组号 | 分组 | 回答正确的人数 | 回答正确的人数占本组的频率 |
第组 | |||
第组 | |||
第组 | |||
第组 | |||
第组 |
(1)分别求出的值;
(2)从第组回答正确的人中用分层抽样的方法抽取人,求第组每组抽取的人数;
(3)在(2)中抽取的人中随机抽取人,求所抽取的人中恰好没有年龄段在的概率。
解:(1)第组的人数为:人,第组的频率为:,
。
第一组的频率为, 第一组的人数为:,
。
第二组的频率为, 第二组的人数为:,
。
第三组的频率为, 第三组的人数为:,
。
第五组的频率为, 第五组的人数为:,
。
(2)第组回答正确的总人数为:人,
- 第组抽取的人数为:人,记为A,B;
- 第组抽取的人数为:人,记为a,b,c;
- 第组抽取的人数为:人,记为m,
(3)在(2)中抽取的人中随机抽取人,基本事件为:
AB,Aa,Ab,Ac,Am,Ba,Bb,Bc,Bm,ab,ac,am,bc,bm,cm,共15种;所抽取的人中恰好没有年龄段在包含的基本事件为:
AB,Am,Bm共3种,
所抽取的人中恰好没有年龄段在的概率:。
总结提升:
概率统计题常以实际问题为背景,以频率分布表、频率分布直方图、茎叶图、条形图等为载体,考查概率、统计的基本思想,考查概率、统计的相关计算。解决这类问题,要重视识图、读图的能力训练,同时,要注意和其他知识的联系,培养综合运用能力。
1. 核心知识
(1)频率分布直方图
(2)古典概型
2. 易错防范
(1)频率直方图各数据的意义
(2)各统计量的意义
(3)列举基本事件要不重不漏
(答题时间:30分钟)
1. 某中学高一年级560人,高二年级540人,高三年级520人,用分层抽样的方法抽取部分样本,若从高一年级抽取28人,则从高二、高三年级分别抽取的人数是( )
A. 27 26 B. 26 27 C. 26 28 D. 27 28
2. 在一次数学测试中,高一某班50名学生成绩的平均分为82,方差为8.2,则下列四个数中不可能是该班数学成绩的是( )
A.60 B.70 C.80 D.100
3. 下图所示茎叶图中数据的平均数为89,则的值为( )
A. 6 B. 7 C. 8 D. 9
4. 某班全体学生测试成绩的频率分布直方图如图,数据的分组依次为:,,,。若高于分的人数是,则该班的学生人数是( )
A. B. C. D.
5. 某公司将20名员工工作五年以来的迟到次数统计后得到如下的茎叶图,则从中任取1名员工,迟到次数在的概率为( )
A. B. C. D.
6. 在样本的频率分布直方图中,共有个小长方形,若中间一个长方形的面积等于其他个小长方形面积的和的,且样本容量为,则中间一组的频数为________。
7. 有5条线段,其长度分别为3,4,5,7,9,现从中任取3条,则能构成三角形的概率是_____。
1. 答案:A
解析:设从高二、高三年级抽取的人数分别为,
则满足,得,故选A。
2. 答案:A
解析:当为该班某学生的成绩时,则,则与方差为矛盾 不可能是该班成绩故选:A。
3. 答案:B
解析:茎叶图中的数据为:,
由数据平均数为89得,解得。故选B。
4. 答案:C
解析:由题意,根据给定的频率分布直方图,可得在之间的频率为,又由高于分的人数是,则该班的学生人数是人,故选C。
5. 答案:C
解析:依题意,该公司共有20名员工,其中迟到次数在的有6人,故所求概率。故选:C。
6. 答案:
解析:设中间一组的频率为,则其他组的频率为,由题意知,得,所以中间一组频数为。
7. 答案:
解析:从5条线段中任取3条,基本事件为:3,4,5;3,4,7;3,4,9;3,5,7;3,5,9;3,7,9;4,5,7;4,5,9;4,7,9;5,7,9,共有10种情况,其中,能构成三角形的有:3,4,5; 3,5,7; 3,7,9; 4,5,7; 4,7,9; 5,7,9, 共6种情况;即能构成三角形的概率是,故答案为:。
2024年高考数学重难点突破讲义:学案 第3讲 数列的求和: 这是一份2024年高考数学重难点突破讲义:学案 第3讲 数列的求和,共7页。
2024年高考数学重难点突破讲义:学案 第2讲 直线与椭圆: 这是一份2024年高考数学重难点突破讲义:学案 第2讲 直线与椭圆,共9页。
2024年高考数学重难点突破讲义:学案 第2讲 数列的递推关系: 这是一份2024年高考数学重难点突破讲义:学案 第2讲 数列的递推关系,共7页。