所属成套资源:全套2024年高考数学一轮复习课时教学课件
2024年高考数学一轮复习第八章第二讲用样本估计总体课件
展开
这是一份2024年高考数学一轮复习第八章第二讲用样本估计总体课件,共60页。PPT课件主要包含了频率组距,3四分位数,1众数,3平均数,下列结论错误的是,图8-2-1,答案D,图8-2-2,率为089,A1216等内容,欢迎下载使用。
1.总体取值规律的估计
(1)绘制频率分布直方图的步骤
①求极差:即一组数据中最大值与最小值的差.
②决定组距和组数:当样本容量不超过 100 时,常分成5~12
组,组距= .
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组.④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.
⑤画频率分布直方图:把横轴分成若干段,每一段对应一个
组距,然后以线段为底作一小长方形,它的高等于该组的
这样得到一系列的长方形,每个长方形的面积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于 1.
(2)不同统计图的特点
扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续性数据.
2.总体百分位数的估计(1)第 p 百分位数的定义
一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组 n 个数据的第 p 百分位数的步骤第 1 步,按从小到大排列原始数据.第 2 步,计算 i=n×p%.
第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第(i+1)项数据的平均数.
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第 25 百分位数也称为第一四分位数或下四分位数,第 75 百分位数也称为第三四分位数或上四分位数.
3.总体集中趋势的估计
在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
样本数据的算术平均数,
4.总体离散程度的估计
(3)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【名师点睛】(1)频率分布直方图中的常见结论①众数的估计值为最高矩形的中点对应的横坐标.
②平均数的估计值等于频率分布直方图中每个小矩形的面积
乘以小矩形底边中点的横坐标之和.
③中位数的估计值的左边和右边的小矩形的面积和是相等的.
(2)平均数、方差的公式推广
考点一 频率分布直方图[例 1](1)为了了解某校九年级 1 600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图 8-2-1 所示的频率分布直方图,根据统计图的数据,
A.该校九年级学生 1 分钟仰卧起坐的次数的中位数为 26.25B.该校九年级学生 1 分钟仰卧起坐的次数的众数为 27.5C.该校九年级学生 1 分钟仰卧起坐的次数超过 30 的人数约为
D.该校九年级学生 1 分钟仰卧起坐的次数少于 20 的人数约为
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是 26.25;众数是最高矩形的中间值 27.5;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,所以估计 1 分钟仰卧起坐的次数超过 30 的人数为 320;1 分钟仰卧起坐的次数少于 20的频率为 0.1,所以估计 1 分钟仰卧起坐的次数少于 20 的人数为160.故选 D.
(2)(2022 年全国Ⅱ)在某地区进行流行病学调查,随机调查了100 位某种疾病患者的年龄,得到如图 8-2-2 所示的样本数据的频率分布直方图.
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用
该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的
(3)已知该地区这种疾病的患病率为 0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的 16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到 0.000 1)
解:(1)由频率分布直方图得该地区这种疾病患者的平均年龄
x =5×0.001×10+15×0.002×10+25×0.012×10+35×0.017×10+45×0.023×10+55×0.020×10+65×0.017×10+75×0.006×10+85×0.002×10=47.9(岁).
(2)该地区一位这种疾病患者的年龄位于区间[20,70)的频率为
(0.012+0.017+0.023+0.020+0.017)×10=0.89,
∴估计该地区一位这种疾病患者的年龄位于区间[20,70)的概
(3)设从该地区中任选一人,此人的年龄位于区间[40,50)为事
件 B,此人患这种疾病为事件 C,
【题后反思】频率分布直方图的数据特点
(1)频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
(2)频率分布直方图中各小长方形的面积之和为 1,这是解题
的关键,常利用频率分布直方图估计总体分布.
【变式训练】1.(2023 年梧州市期中)甲、乙两组各八名学生在一次英语听力测试中的成绩(单位:分)如下甲:9,16,25,18,24,x,27,24.乙:8,17,y,13,24,28,20,22.已知甲组数据的 25%分位数为 14,乙组数据的平均数为 18.5,
则 x,y 的值分别为(
2.(2022 年天津)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图 8-2-3 是根据试验数据制成的频率分布直方图.已知第一组与第二组共有 20人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为
解析:志愿者的总人数为
20(0.24+0.16)×1
=50,∴第 3 组的人
数为 50×0.36=18,有疗效的人数为 18-6=12(人).故选 B.
考点二 总体集中趋势的估计1.(2023 年南开区校级月考)已知一组数据的频率分布直方图
如图 8-2-4 所示,则数据的中位数估计值为(图 8-2-4
解析:因为(0.03+0.04)×10=0.7>0.5,所以中位数位于[60,70)之间,设中位数为 x,则 0.03×10+(x-60)×0.04=0.5,解得x=65,即中位数为 65.故选 B.
2.(多选题)(2021 年全国Ⅰ)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,
2,…,n),c 为非零常数,则(
A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同
解析:设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为 x ,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为 x +c,m+c,σ,t,因为 c≠0,所以 C,D 正确,故选 CD.
3.(多选题)(2023 年福州市期中)为推动学校体育运动发展,引导学生积极参与体育锻炼,增强健康管理意识,某校根据性别比例采用分层抽样方法随机抽取了 120 名男生和 80 名女生,调查并分别绘制出男、女生每天在校平均体育活动时间的频率分布直方
图(如图 8-2-5 所示),则(
B.该校男生每天在校平均体育活动时间中位数的估计值为 75C.估计该校至少有一半学生每天在校平均体育活动时间超过
D.估计该校每天在校平均体育活动时间不低于 80 分钟的学生
中男、女生人数比例为 3∶1
解析:对于 A,10a+10×0.020+10×0.035+10×0.020+10a+10×0.005=1,解得 a=0.010,正确;对于 B,a=0.010,前两个小矩形面积之和为 0.3,前三个小矩形面积之和为 0.65,即中位
估计值为 65.7,错误;对于 C,根据频率分布直方图可得,男生
中每天在校平均体育活动时间超过一小时的频率为 10×(0.035+0.020+0.010+0.005)=0.700,人数为 120×0.7=84,女生中每天在校平均体育活动时间超过一小时的频率为 10×(0.030+0.010+0.005)=0.450,人数为 80×0.450=36,故学生每天在校平均体育
活动时间超过一小时的频率为 =0.6,故该校至少有一半学
生每天在校平均体育活动时间超过一小时,正确;对于 D,男生
中每天在校平均体育活动时间不低于80分钟的频率为 10×(0.010+0.005)=0.15,人数为 120×0.15=18,女生中每天在校平均体育活动时间不低于80分钟的频率为10×0.005=0.050,人数为80×0.050=4,所以该校每天在校平均体育活动时间不低于 80 分钟的学生中男、女生人数比例为 18∶4=9∶2,正确.故选 AC.
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)求中位数时一定要先对数据按大小排序,若最中间有两个
数据,则中位数是这两个数据的平均数.
(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
考点三 总体离散程度的估计
考向 1 方差与标准差
[例 2](2021 年全国乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:
解:(1)由表格中的数据易得
【题后反思】利用样本的方差(标准差)解决优化决策问题的
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数
考向 2 分层随机抽样的方差与标准差
[例 3](2022 年深圳市高三月考)某学校统计教师职称及年龄,中级职称教师的人数为 50,其平均年龄为 38 岁,方差是 2,高级职称的教师中有 3 人 58 岁,5 人 40 岁,2 人 38 岁,求该校中级职称和高级职称教师年龄的平均数和方差.
解:由已知条件可知高级职称教师的平均年龄为
【题后反思】计算分层随机抽样的方差的步骤
【考法全练】1.(考向 1)(2020 年全国Ⅲ)设一组样本数据x1,x2,…,xn的方
差为0.01,则数据10x1,10x2,…,10xn的方差为( )
解析:∵样本数据x1,x2,…,xn的方差为0.01,∴样本数据10x1,10x2,…,10xn的方差为102×0.01=1,故选C.答案:C
2.(考向 2)某班成立了 A,B 两个数学兴趣小组,A 组 10 人,B 组 30 人,经过一周的补习后进行了一次测试,在该测试中,A组的平均成绩为 130 分,方差为 115,B 组的平均成绩为 110 分,方差为 215.求在这次测试中全班学生的平均成绩和方差.
⊙统计图表及其应用[例 4]已知某市某居民小区户主人数和户主对户型结构的满意率分别如图 8-2-6①和图 8-2-6②所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取 30%的户主进行调查,
则样本量和抽取的户主对四居室满意的人数分别为(
A.240,18C.240,20
②图 8-2-6B.200,20D.200,18
解析:样本量 n=(250+150+400)×30%=240,抽取的户主
对四居室满意的人数为 150×30%×40%=18.
[例 5](2022 年贵阳市模拟)某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了 2021 年 1 月至 2021 年 11 月期间该“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了如图
8-2-7 所示的折线图.根据折线图,下列结论正确的是(图 8-2-7
A.月跑步平均里程的中位数为 6 月份对应的里程数B.月跑步平均里程逐月增加
C.月跑步平均里程高峰期大致在 8、9 月份
D.1 月至 5 月的月跑步平均里程相对于 6 月至 11 月波动性更
解析:由折线图可知月跑步平均里程比6月份高的只有 9,10,11,共 3 个月,比 6 月份低的有 1,2,3,4,5,7,8,共7个月,故 6 月份对应里程数不是中位数,因此 A 不正确;月跑步平均里程在 1 月到 2 月,6 月到 7 月,7 月到 8 月,10 月到 11 月都是减少的,故不是逐月增加,因此 B 不正确;月跑步平均里程高峰期大致在 9,10,11 三个月,8 月份是相对较低的,因此 C 不正确;从折线图来看,1 月至 5 月的跑步平均里程相对于 6 月至 11 月,波动性更小,变化比较平稳,因此 D 正确.
【高分训练】1.已知某地区中小学生人数和近视情况分别如图 8-2-8①和图8-2-8②所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中
A.200,20C.200,10
B.100,20D.100,10
解析:由题意得样本容量为(3 500+2 000+4 500)×2%=
10 000×2%=200,
抽取的高中生人数为 2 000×2%=40,则近视人数为 40×50%=20.故选 A.
2.“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图 8-2-9是 2022 年 9 月到 2023 年 2 月这半年来,某个关键词的搜索指数变化的统计图.
根据该统计图判断,下列结论正确的是(
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2022 年 10 月的方差小于 11月的方差D.从该关键词的搜索指数来看,2022 年 12 月的平均值大于2023 年 1 月的平均值
相关课件
这是一份新高考数学一轮复习课件 第9章 §9.2 用样本估计总体,共60页。PPT课件主要包含了落实主干知识,探究核心题型,课时精练等内容,欢迎下载使用。
这是一份(新高考)高考数学一轮复习课件11.1《随机抽样、用样本估计总体》(含解析),共50页。PPT课件主要包含了机会都相等,随机数法,互不交叉,最大值,最小值,频率分布表,频率分布直方图,所分组数,出现次数最多,最中间等内容,欢迎下载使用。
这是一份(新高考)高考数学一轮复习课件第9章§9.2《用样本估计总体》(含解析),共60页。PPT课件主要包含了考试要求,落实主干知识,平均数,众数为5D错误,探究核心题型,思维升华,总体集中趋势的估计,总体离散程度的估计,课时精练等内容,欢迎下载使用。