







新高考数学一轮复习专题九计数原理、概率与统计9-5统计与成对数据的统计分析课件
展开题型一 频率分布直方图的应用用频率分布直方图估计样本的数字特征(1)平均数: = xiSi(xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积).(2)方差:s2= (xi- )2·Si.(3)众数:最高小矩形底边中点的横坐标.(4)中位数:把频率分布直方图划分为左右两个面积相等的部分时,分界线与横轴交点 的横坐标.(5)百分位数:类比中位数,百分位数所在直线把频率分布直方图划分为左右两个部分, 左边所有矩形的面积和为p%.中位数是第50百分位数.
求解公式:已知频率分布直方图的组距为d.①找出百分位数所在的矩形区间[a,b);②第p百分位数=a+d· .
例1 (2024辽宁沈阳五校联考,18)为了解某药物在小鼠体内的残留程度,进行如下试 验:随机抽取100只小鼠,给服该种药物,每只小鼠给服的药物浓度相同、体积相同.经 过一段时间后用某种科学方法测算出残留在小鼠体内药物的百分比.根据试验数据得 到如下直方图:
(1)求残留百分比直方图中a的值;(2)估计该药物在小鼠体内残留百分比的平均值(同一组中的数据用该组区间的中点 值为代表);(3)在体内药物残留百分比位于区间[5.5,7.5]的小鼠中任取3只,设其中体内药物残留百 分比位于区间[6.5,7.5]的小鼠为X只,求X的分布列和期望.
解析 (1)由(0.15+0.20+a+0.20+0.10+0.05)×1=1,解得a=0.3.(2) =(2×0.15+3×0.2+4×0.3+5×0.2+6×0.1+7×0.05)×1=4.05.(3)体内药物残留百分比位于区间[5.5,6.5)内的频率为0.1,则抽取小鼠100×0.1=10只,位 于[6.5,7.5]内的频率为0.05,则抽取小鼠100×0.05=5只.则X的所有可能取值为0,1,2,3,P(X=0)= = ,P(X=1)= = ,P(X=2)= = ,P(X=3)= = ,所以X的分布列为
则E(X)=0× +1× +2× +3× =1.
题型二 变量间的相关关系及回归方程1.两个变量是否相关的判断方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下 角,两个变量负相关.(2)样本相关系数;当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判断,R2越接近1,模型的拟合效果越好,相关性越强.2.求经验回归方程的步骤(1)计算出 、 、 + +…+ 、x1y1+x2y2+…+xnyn;(2)计算 、 ;
(3)写出经验回归方程 = x+ .3.经验回归方程的应用(1)若已知经验回归方程(方程中无参数),则把自变量代入经验回归方程即可对因变量 进行预测.(2)若经验回归方程中有参数,则根据经验回归直线一定经过点( , )求出参数值,得到经验回归方程,进而完成预测.
例2 (多选)(2024浙江宁波期末,9)数字经济是继农业经济、工业经济之后的主要经 济形态.近年来,在国家的大力推动下,我国数字经济规模增长迅猛.某地区2023年上半 年月份x与对应数字经济的生产总值(即GDP)y(单位:亿元)如表所示.
根据上表可得到回归方程 = x+ ,则 ( )A. = B.y与x正相关C.若r表示变量y与x之间的相关系数,则r= D.若该地区对数字经济的相关政策保持不变,则该地区7月份的生产总值约为 亿元
解析 对于A, = ×(1+2+3+4+5+6)= , = ×(30+33+35+38+41+45)=37,所以 = - =37- × = ,故A正确;对于B,因为 = >0,所以y与x正相关,故B正确;对于C,根据|r|≤1知C错误;对于D,当x=7时, = ×7+ = ,故D正确.故选ABD.
例3 (2024华大新高考联盟教学质量测评,15)某农业大学组织部分学生进行作物栽培 试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期 标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作 物的高度变化.
(1)观察散点图可知,天数x与作物高度y之间具有较强的线性相关性,用最小二乘法求 出作物高度y关于天数x的经验回归方程 = x+ (其中 , 用分数表示);(2)小明测得使用营养液后第22天该作物的高度为21.3 cm,请根据(1)中的结果预测第2 2天该作物的高度的残差.参考公式: = , = - .参考数据: xiyi=710.
解析 (1)依题意,得 = =5.5, =10+ =12,故 = = = = , =12- ×5.5= ,故所求经验回归方程为 = x+ .(2)由(1)可知,当x=22时, = ×22+ =22 cm,故所求残差为21.3-22=-0.7 cm.
应用独立性检验解决实际问题的基本步骤1.提出零假设H0:X和Y相互独立,并给出在问题中的解释;2.根据抽样数据整理出2×2列联表,计算χ2的值;3.查表确定临界值xα;
4.得出推断结论.当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为 “不经常锻炼”.请完成以下2×2列联表,并依据小概率值α=0.1的独立性检验,能否认 为性别因素与学生体育锻炼的经常性有关系;
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会 导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取20名同学,其中“极度缺 乏锻炼”的人数为X,求E(X)和D(X);(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的 生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男 生人数为Y,求Y的分布列和数学期望.附:χ2= ,n=a+b+c+d.
解析 (1)2×2列联表为
零假设为H0:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关,根据列 联表的数据计算χ2= = ≈3.590>2.706=x0.1,根据小概率值α=0.1的独立性检验,推断H0不成立,即性别因素与学生体育锻炼的经常 性有关系,此推断犯错误的概率不超过0.1.(2)因学校总学生数远大于所抽取的学生数,故X近似服从二项分布,随机抽取一人为 “极度缺乏锻炼”者的概率p= = ,X~B ,故E(X)=20× = ,D(X)=20× × = .
(3)10名“运动爱好者”中有7名男生,3名女生,Y服从超几何分布:P(Y=0)= = ,P(Y=1)= = = ,P(Y=2)= = = ,P(Y=3)= = = ,故所求分布列为
E(Y)=0× +1× +2× +3× =2.1.
例1 (多选)(2024重庆八中多校月考,9)某社区通过简单随机抽样,获得了100户居民的 月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计 ( )A.平均数>中位数 B.中位数>平均数C.中位数>众数 D.众数>平均数
解析 由题中直方图在右边“拖尾”知平均数大于中位数,故A正确;由题图估计中位数接近7.2,众数为5.7,所以中位数大于众数,故C正确.故选AC.
风向解读 本题考查了平均数,中位数,众数的运算.平均数和中位数都描述了数据的 集中趋势,它们的大小关系和数据分布的形状有关.准确理解概念的本质是解题的关 键.
例2 (2024广东汕头第一次模拟,12)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2)中,x1,x2,…,xn不全相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y= x+1上,则这组成对样本数据的样本相关系数r= .
新高考数学一轮复习专题九计数原理、概率与统计9-5统计与成对数据的统计分析练习课件: 这是一份新高考数学一轮复习专题九计数原理、概率与统计9-5统计与成对数据的统计分析练习课件,共60页。
2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件: 这是一份2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件,共60页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,样本相关系数,2经验回归方程,2独立性检验,答案C,典例突破等内容,欢迎下载使用。
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。