人教版新高考数学二轮复习课件--统计与统计案例
展开1.抽样方法(1)从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为
名师点析简单随机抽样、分层抽样都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
(2)分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.
2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小排列,如果数据的个数是奇数,位于最中间的数据作为中位数.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
探究在频率分布直方图中如何确定众数、中位数和平均数?在频率分布直方图中,众数是最高小长方形底边中点的横坐标;中位数左边和右边的小长方形的面积是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.变量间的相关关系(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,那么我们称这两个变量线性相关.
当r<0时,称成对样本数据负相关.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.名师点析根据经验回归方程进行预测,得到的仅是一个预测值,而不是真实发生的值.
4.独立性检验对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
[例1](2021·全国Ⅰ,理17)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
规律方法用样本估计总体的解题步骤(1)用样本的频率估计总体的步骤①确定样本容量N.②确定事件发生的次数(频数).③求频率 .④估计总体.(2)用样本的数字特征估计总体的步骤①确定样本.②求样本的平均数、众数、中位数、方差(标准差).③由数字分析样本、估计总体.
某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解 (1)如图所示.
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
[例2](2021·河北石家庄模拟改编)下表是我国大陆地区从2013年至2019年国内生产总值(GDP)近似值[单位:万亿元(人民币)]的数据表格:
(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的经验回归方程(系数精确到0.01);
(3)党的十九大报告中指出,从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若至2035年底我国人口增长为14.4亿人,假设至2035年世界主要中等发达国家的人均国民生产总值的频率直方图如图所示.
以(2)的结论为依据,预测我国在2035年底人均国民生产总值是否可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值.
由直方图,假设2035年世界主要中等发达国家的人均国民生产总值平均数的估计值为7.5×0.3+12.5×0.35+17.5×0.2+22.5×0.1+27.5×0.05=13.75,又13.75<14.04,所以以(2)的结论为依据,可预测我国在2035年底人均国民生产总值可以超过假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值.
规律方法线性回归分析问题的类型及解题方法(1)求经验回归方程:
(2)预测变量值:①若已知经验回归方程(方程中无参数),进行预测时,可以直接将数值代入求得特定要求下的预测值.②若经验回归方程中有参数,根据经验回归直线一定经过点( ),求出参数值,得到经验回归方程,进而完成预测.
(2021·福建厦门质量检测改编)沙漠化会造成生态系统失衡,可耕地面积不断缩小,对工农业生产和人民生活带来严重影响.随着综合国力的逐步增强,我国西北某地区大力兴建防风林带,引水拉沙,引洪淤地,开展了改造沙漠的巨大工程,该地区于2017年投入沙漠治理经费2亿元,从2018年到2020年连续3年每年增加沙漠治理经费1亿元,近4年沙漠治理经费投入x(单位:亿元)和沙漠治理面积y(单位:万亩)的相关数据如下表所示:
(1)通过绘制散点图看出,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;(结果保留3位小数)(2)建立y关于x的经验回归方程;(3)若保持以往的沙漠治理经费增加幅度,请预测到哪一年沙漠治理面积突破100万亩.
因为y与x的样本相关系数近似为0.998,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
[例3](2021·广东佛山一模改编)为了解空气质量指数(AQI值)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI值,并制作了如下散点图:
连续60天参加健身运动人数与AQI值散点图
(1)环保小组准备做y与x的线性回归分析,算得y与x的样本相关系数为r≈-0.58,试分析y与x的线性相关关系.(2)环保小组还发现散点有分区聚集的特点,尝试做聚类分析.用直线x=100与y=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5,10,10,35,试依据小概率值α=0.005的独立性检验,分析“参加户外健身运动的人数不少于100是否与AQI值不大于100之间有关联”.
解 (1)r≈-0.58,y与x的相关关系为负相关,且|r|<0.75,故线性相关性不强,所以不建议继续做线性回归分析,即使得到经验回归方程,拟合效果也会不理想.(2)建立2×2列联表如下
零假设为H0:参加户外健身运动的人数不少于100与AQI值不大于100之间无关联.
依据小概率值α=0.005的独立性检验,推断H0不成立,即认为参加户外健身运动的人数不少于100与AQI值不大于100之间有关联.
规律方法独立性检验的一般步骤(1)提出零假设H0:X和Y相互独立.(2)根据抽样数据列出2×2列联表.(3)计算随机变量χ2的值,查下表确定临界值xα:
(4)当χ2≥xα时,就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;否则,就没有充分证据推断H0不成立,可以认为X和Y独立.
(2021·湖北部分重点高中联考改编) 肥胖人群有很大的健康隐患.目前,国际上常用身体质量指数(英文为Bdy Mass Index,简称BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是 ,中国成人的
BMI数值标准为:BMI<18.5为偏瘦,18.5≤BMI<23.9为正常,24≤BMI<27.9为偏胖,BMI≥28为肥胖.某地区随机调查了6 000名35岁以上成人的身体健康状况,其中有1 000名高血压患者,得到被调查者的频率分布直方图如图.
(1)求被调查者中肥胖人群的BMI平均值μ;(2)根据频率分布直方图,完成下面的2×2列联表,依据小概率值α=0.001的独立性检验,分析35岁以上成人患高血压是否与肥胖有关.
解 (1)由题图可知,1 000名高血压患者的肥胖情况如下表所示.
5 000名非高血压患者的肥胖情况如下表所示.
被调查者中肥胖人群的BMI平均值
(2)由(1)及频率分布直方图知,1 000名高血压患者中有200+100+50=350人肥胖,5 000名非高血压患者中有800+300+50=1 150人肥胖,所以可得下列列表.
零假设为H0:35岁以上成人患高血压与肥胖无关.
2024届高考数学二轮复习专题2统计案例课件: 这是一份2024届高考数学二轮复习专题2统计案例课件,共35页。PPT课件主要包含了微专题2统计案例等内容,欢迎下载使用。
2023届高考数学二轮复习专题4第1讲统计与统计案例课件: 这是一份2023届高考数学二轮复习专题4第1讲统计与统计案例课件,共60页。PPT课件主要包含了专题四统计与概率,考情分析,真题热身,2列联表,感悟高考,考点一统计图表,典例1,考点二回归分析,典例2,考点三独立性检验等内容,欢迎下载使用。
《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例: 这是一份《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例,共60页。PPT课件主要包含了内容索引,考点一统计图表,考点二回归分析,考点三独立性检验,专题强化练等内容,欢迎下载使用。