2022届高三数学二轮复习课件:专题五 第1讲 统计与统计案例
展开1.抽样方法(1)从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为
等可能性, 公平性
(2)分层抽样实际上就是将总体分成互不交叉的层,按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本数量.名师点析简单随机抽样、分层抽样都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小排列,如果数据的个数是奇数,位于最中间的数据作为中位数.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
探究在频率分布直方图中如何确定众数、中位数和平均数?在频率分布直方图中,众数是最高小长方形底边中点的横坐标;中位数左边和右边的小长方形的面积是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.变量间的相关关系(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,那么我们称这两个变量线性相关.
称成对样本数据负相关.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.名师点析根据回归方程进行预测,得到的仅是一个预测值,而不是真实发生的值.
4.独立性检验一般地,假设有两个分类变量X和Y,它们的取值分别是{x1,x2}和{y1,y2},其样本频数列联表是:
[例1](2021·全国乙,理17)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
规律方法用样本估计总体的解题步骤(1)用样本的频率估计总体的步骤①确定样本容量N.②确定事件发生的次数(频数).③求频率 .④估计总体.(2)用样本的数字特征估计总体的步骤①确定样本.②求样本的平均数、众数、中位数、方差(标准差).③由数字分析样本、估计总体.
某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解 (1)如图所示.
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
[例2](2021·河北石家庄模拟)下表是我国大陆地区从2013年至2019年国内生产总值(GDP)近似值(单位:万亿元人民币)的数据表格:
(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程(系数精确到0.01);
(3)党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若至2035年底我国人口增长为14.4亿人,假设至2035年世界主要中等发达国家的人均国民生产总值的频率直方图如图所示.
以(2)的结论为依据,预测我国在2035年底人均国民生产总值是否可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值.
由直方图,假设2035年世界主要中等发达国家的人均国民生产总值平均数的估计值为7.5×0.3+12.5×0.35+17.5×0.2+22.5×0.1+27.5×0.05=13.75,又13.75<14.04,所以以(2)的结论为依据,可预测我国在2035年底人均国民生产总值可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值.
规律方法线性回归分析问题的类型及解题方法(1)求回归方程:
(2)预测变量值:①若已知回归方程(方程中无参数),进行预测时,可以直接将数值代入求得特定要求下的预测值.②若回归方程中有参数,根据回归直线一定经过点( ),求出参数值,得到回归方程,进而完成预测.
(2021·福建厦门质量检测)中国是世界上沙漠化最严重的国家之一,沙漠化造成生态系统失衡,可耕地面积不断缩小,对中国工农业生产和人民生活带来严重影响.随着综合国力的逐步增强,西北某地区大力兴建防风林带,引水拉沙,引洪淤地,开展了改造沙漠的巨大工程,该地区于2017年投入沙漠治理经费2亿元,从2018年到2020年连续3年每年增加沙漠治理经费1亿元,近4年沙漠治理经费投入x(亿元)和沙漠治理面积y(万亩)的相关数据如下表所示:
(1)通过绘制散点图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(结果保留3位小数)(2)建立y关于x的经验回归方程;(3)若保持以往的沙漠治理经费增加幅度,请预测到哪一年沙漠治理面积突破100万亩.
因为y与x的相关系数近似为0.998,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
[例3](2021·广东佛山一模)为了解空气质量指数(AQI值)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI值,并制作了如下散点图:
连续60天参加健身运动人数与AQI值散点图
(1)环保小组准备做y与x的线性回归分析,算得y与x的相关系数为r≈-0.58,试分析y与x的线性相关关系.(2)环保小组还发现散点有分区聚集的特点,尝试做聚类分析.用直线x=100与y=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5,10,10,35,能否在犯错误的概率不超过0.010的前提下认为“参加户外健身运动的人数不少于100与AQI值不大于100之间有关联”?
解 (1)r≈-0.58,y与x的相关关系为负相关,且|r|<0.75,故线性相关性不强,所以不建议继续做线性回归分析,即使得到经验回归方程,拟合效果也会不理想.(2)建立2×2列联表如下
在犯错误的概率不超过0.010的前提下认为参加户外健身运动的人数不少于100与AQI值不大于100之间有关联.
规律方法独立性检验的一般步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,查表确定临界值k0.(2)利用公式,计算随机变量K2的观测值k.
(3)如果k≥k0,就推断“X和Y有关系”,该推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X和Y”有关系;或者在样本数据中没有发现足够证据.
(2021·湖北部分重点高中联考)近年来,我国肥胖人群的规模急速增长,肥胖人群有着很大的健康隐患.目前,国际上常用身体质量指数(英文为Bdy Mass Index,简称BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是
18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖.某地区随机调查了6 000名35岁以上成人的身体健康状况,其中有1 000名高血压患者,得到被调查者的频率分布直方图如图:
(1)求被调查者中肥胖人群的BMI平均值μ;(2)根据频率分布直方图,完成下面的2×2列联表,能否在犯错误的概率不超过0.001的前提下认为35岁以上成人患高血压与肥胖有关?
解 (1)由题图可知,1 000名高血压患者中:
5 000名非高血压患者中:
(2)由(1)及频率分布直方图知,1 000名高血压患者中有200+100+50=350人肥胖,5 000名非高血压患者中有800+300+50=1 150人肥胖,所以可得下列列表:
由列联表中数据,得k= =64>10.828,在犯错误的概率不超过0.001的前提下认为35岁以上成人患高血压与肥胖有关.
新高考数学二轮复习 第1部分 专题5 第1讲 统计与统计案例(含解析)课件PPT: 这是一份新高考数学二轮复习 第1部分 专题5 第1讲 统计与统计案例(含解析)课件PPT,共60页。PPT课件主要包含了考情分析,内容索引,考点一统计图表,核心提炼,考点二回归分析,样本数据的相关系数,考点三独立性检验,专题强化练,①②③,根据公式可求得等内容,欢迎下载使用。
2023届高考数学二轮复习专题4第1讲统计与统计案例课件: 这是一份2023届高考数学二轮复习专题4第1讲统计与统计案例课件,共60页。PPT课件主要包含了专题四统计与概率,考情分析,真题热身,2列联表,感悟高考,考点一统计图表,典例1,考点二回归分析,典例2,考点三独立性检验等内容,欢迎下载使用。
《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例: 这是一份《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例,共60页。PPT课件主要包含了内容索引,考点一统计图表,考点二回归分析,考点三独立性检验,专题强化练等内容,欢迎下载使用。