专题6.2 用样本估计总体数字特征(5类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册)
展开TOC \ "1-3" \h \z \t "正文,1"
\l "_Tc123677764" 【考点1:众数、中位数、平均数】 PAGEREF _Tc123677764 \h 1
\l "_Tc123677765" 【考点2:方差、标准差】5
\l "_Tc123677766" 【考点3:频率分布直方图】8
\l "_Tc123677767" 【考点4:百分位数】13
\l "_Tc123677768" 【考点5:利用样本的数字特征解决优化决策问题】15
【考点1:众数、中位数、平均数】
【知识点:众数、中位数、平均数】
1.(2022春·江苏盐城·高一江苏省射阳中学开学考试)某篮球兴趣小组7名学生参加投篮比赛,每人投10个,投中的个数分别为:8、5、7、5、8、6、8,则这组数据的众数和中位数分别为( )
A.5、7B.6、7C.8、5D.8、7
2.(2022春·广东·高三校联考阶段练习)某同学掷骰子5次,分别记录每次骰子出现的点数,根据5次的统计结果,可以判断一定没有出现点数6的是( )
A.中位数是3,众数是2B.平均数是3,中位数是2
C.方差是2.4 ,平均数是2D.平均数是3,众数是2
3.(2022春·四川·高三统考阶段练习)某篮球运动员练习罚篮,共20组,每组50次,每组命中球数如下表:
则这组数据的中位数和众数分别为( )A.48,4B.48.5,4C.48,49D.48.5,49
4.(2021春·吉林四平·高二四平市第一高级中学校考开学考试)已知x是−4,−2,−1,1,x,3,5,6,11这九个数据的中位数,且−1,0,2,x2,y−1x这五个数据的平均数为3,则y的取值范围为( )
A.173,12B.6,14C.163,14D.5,14
5.(2022·全国·高三专题练习)已知数据x1,x2,⋅⋅⋅,xn的平均数为4,则数据2x1−1,2x2−1,⋅⋅⋅,2xn−1的平均数为( )
A.16B.15C.8D.7
6.(2022春·河南南阳·高一阶段练习)一段时间内没有大规模集体流感的标志为“连续10天,每天新增病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增病例数据,一定符合该标志的是( )
A.甲地:平均数为3,中位数为4
B.乙地:平均数为1,方差大于0
C.丙地:中位数为2,众数为3
D.丁地:平均数为2,方差为3
7.(2021春·山东临沂·高二统考开学考试)为提高生产效率,某汽车零件加工厂的甲乙两个车间进行比赛,下表是对甲乙两个车间某天生产零件个数的统计,根据表中数据分析得出的结论正确的是( )
A.甲、乙两车间这一天生产零件个数的平均数相同
B.甲车间这一天生产零件个数的波动比乙车间大
C.乙车间优秀的人数多于甲车间优秀的人数(这一天生产零件个数≥150个为优秀)
D.甲车间这一天生产零件个数的众数小于乙车间零件个数的众数
8.(2022·高一课时练习)已知x1,x2,x3,…,xn的平均数为a,则2x1+3,2x2+3,2x3+3,…,2xn+3的平均数为________.
9.(辽宁省大连市2022-2023学年高一上学期期末数学试题)在考察某中学的学生身高时,采用分层抽样的方法抽取男生24人,女生16人,得到了男生的平均身高是170cm,女生的平均身高是165cm,则估计该校全体学生的平均身高是______cm.
【考点2:方差、标准差】
【知识点:方差、标准差】
①标准差:样本数据到平均数的一种平均距离,一般用s表示,s= eq \r(\f(1,n)[x1-\(x,\s\up6(-))2+x2-\(x,\s\up6(-))2+…+xn-\(x,\s\up6(-))2]).
②方差:标准差的平方s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,eq \(x,\s\up6(-))是样本平均数.
③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.
④若数据x1,x2,…,xn的平均数为eq \(x,\s\up6(-)),方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为meq \(x,\s\up6(-))+a,方差为m2s2.
1.(辽宁省大连市2022-2023学年高一上学期期末数学试题)若x1,x2,…,x10的方差为2,则3x1+1,3x2+1,…,3x10+1的方差是( )
A.18B.7C.6D.2
2.(2022春·河南南阳·高一校考阶段练习)如果数据x1,x2,⋯ xn的平均数为10,方差为8,则3x1+4,3x2+4,⋯,3xn+4的平均数和方差分别为( )
A.10、8B.30、24C.34、72D.34、76
3.(2022春·河北邯郸·高三涉县第一中学校考期中)样本中共有5个个体,其中四个值分别为2,2,3,3,第五个值丢失,若该样本的平均数为3,则样本方差为( )
A.1B.3C.65D.625
4.(2022·云南昆明·昆明一中模拟预测)某单位有男职工60人,女职工40人,其中男职工平均年龄为35岁,方差为6,女职工平均年龄为30岁,方差是1,则该单位全体职工的平均年龄和方差分别是( )
A.32.5,3.5B.33,7C.33,10D.32.5,4
5.(2022·上海普陀·统考一模)某地“小康果”大丰收,现抽取5个样本,其质量分别为125、a、121、b、127(单位:克).若该样本的中位数和平均数均为124,则此样本的标准差为______(用数字作答).
6.(2022春·浙江杭州·高二学军中学校考期中)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为175,方差为20,女生样本均值为165,方差为30
(1)如果已知男、女的样本量按比例分配,请计算总样本的均值和方差各为多少?
(2)如果已知男、女的样本量都是25,请计算总样本均值和方差各为多少?
【考点3:频率分布直方图】
【知识点:频率分布直方图】
[方法技巧]
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是eq \f(频率,组距),而不是频率.
2.与频率分布直方图计算有关的两个关系式
(1)eq \f(频率,组距)×组距=频率;
(2)eq \f(频数,样本容量)=频率,此关系式的变形为eq \f(频数,频率)=样本容量,样本容量×频率=频数.
[方法技巧]
频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标为众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
1.(2022·浙江·模拟预测)从立德小学中随机抽取100名学生,将他们的身高(单位:厘米)数据进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,则抽取100名学生中,身高在120,140的人数为( )
A.30B.40C.45D.50
2.(2022春·江西九江·高二九江一中校考期中)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法错误的是(每组数据以区间的中点值为代表)( )
A.直方图中b的值为0.025
B.候选者面试成绩的中位数约为69.4
C.在被抽取的学生中,成绩在区间65,75之间的学生有30人
D.估计候选者的面试成绩的平均数约为69.5分
3.(2021秋·上海普陀·高三曹杨二中阶段练习)某校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的的频率分布直方图,根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数为:_____.
4.(2021春·新疆阿克苏·高二校考期末)新冠肺炎疫情期间,某地为了了解本地居民对当地防疫工作的满意度,从本地居民中随机抽取若干居民进行评分(满分为100分),根据调查数据制成如图频率分布直方图,已知评分在[70,90]的居民有2200人.
(1)求频率分布直方图中a的值及所调查的总人数;
(2)从频率分布直方图中,估计本次评测分数的众数、中位数(精确到0.1).
5.(2022春·辽宁铁岭·高一昌图县第一高级中学校考阶段练习)为了调查某市市民对出行的满意程度,研究人员随机抽取了1000名市民进行调查,并将满意程度以分数的形式统计成如图所示的频率分布直方图,其中a=4b.
(1)求a、b的值;
(2)求被调查的市民的满意程度的平均数、众数、中位数;
(3)若按照分层抽样从50,60,60,70中随机抽取8人,应如何抽取?
【考点4:百分位数】
【知识点:百分位数】
(1)一般地,当总体是连续变量时,给定一个百分数p(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
(2)25%, 50%, 75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后, 这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是14.因此这三个百分位数也称为总体的四分位数.
其他常用的百分位数有1%, 5%, 10%, 90%, 95%, 99%.
(3)总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确.
[方法技巧]
计算一组n个数据的p分位数的一般步骤如下:
第一步,按照从小到大排列原始数据;
第二步, 计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,
则p分位数为第i项与第(i+1)项数据的平均数.
1.(河北省部分学校2023届高三上学期期末数学试题)某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是( )
A.82.5B.85C.90D.92.5
2.(河南省(部分地市)新高考联盟2022-2023学年高一上学期12月教学质量大联考数学试题)已知按从小到大顺序排列的两组数据:甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则mn等于( )
A.43B.107C.127D.74
3.(2022春·天津和平·高三耀华中学阶段练习)2022年12月4日是第九个国家宪法日,主题为“学习宣传贯彻党的二十大精神,推动全面贯彻实施宪法”,耀华园结合线上教育教学模式,开展了云升旗,云班会等活动.其中由学生会同学制作了宪法学习问卷,收获了有效答卷2000份,先对其得分情况进行了统计,按照50,60、60,70、…、90,100分成5组,并绘制了如图所示的频率分布直方图,下列说法不正确的是( )
A.图中x的值为0.02
B.由直方图中的数据,可估计75%分位数是85
C.由直方图中的数据,可估计这组数据的平均数为77
D.90分以上将获得优秀,则全校有20人获得优秀
4.(2022春·北京西城·高三北京师大附中校考期末)10名工人某天生产工艺零件,生产的件数分别是19,19,20,20,13,14,17,18,22,22,那么数据的80%分位数是______.
5.(北京延庆区2022-2023学年高一上学期期末考试数学试题)某单位共有20人,他们的年龄分布如下表所示.
则这20人年龄的众数是___________,75%分位数是___________.
【考点5:利用样本的数字特征解决优化决策问题】
【知识点:利用样本的数字特征解决优化决策问题】
[方法技巧]
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
1.(2022秋·浙江丽水·高一校考阶段练习)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是( )A.甲B.乙C.丙D.丁
2.(2022·高一课时练习)某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的得分情况,从中抽取了50名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这50名学生的得分进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如下的频率分布直方图.
(1)求图中m的值,并估计此次竞赛活动学生得分的中位数;
(2)根据频率分布直方图,估计此次竞赛活动学生得分的平均值.若对得分不低于平均值的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.
3.(2020春·陕西榆林·高二校考期中)某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪50元,快递骑手每完成一单业务提成3元;方案2:规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单业务提成5元,该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为25,35、35,45、45,55、55,65、65,75、75,85、85,95七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替). 数字特征
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数体现了样本数据的最大集中点,不受极端值的影响.但显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数eq \(x,\s\up6(-))=eq \f(x1+x2+…+xn,n)
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
命中球数
46
47
48
49
50
频数
2
4
4
6
4
车间
参加人数
中位数
方差
平均数
甲
55
149
191
135
乙
55
151
110
135
年龄
28
29
30
32
36
40
45
人数
2
2
3
6
4
2
1
甲
乙
丙
丁
平均环数x
8.6
8.9
8.9
8.2
方差s2
3.5
3.5
2.1
5.6
专题4.1 对数运算(4类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册): 这是一份专题4.1 对数运算(4类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册),文件包含专题41对数运算4类必考点北师大版必修第一册原卷版docx、专题41对数运算4类必考点北师大版必修第一册解析版docx等2份试卷配套教学资源,其中试卷共21页, 欢迎下载使用。
专题3.2 指数函数(5类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册): 这是一份专题3.2 指数函数(5类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册),文件包含专题32+指数函数5类必考点北师大版必修第一册原卷版docx、专题32+指数函数5类必考点北师大版必修第一册解析版docx等2份试卷配套教学资源,其中试卷共44页, 欢迎下载使用。
专题3.1 指数(4类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册): 这是一份专题3.1 指数(4类必考点)-2023-2024学年高一数学专题突破(北师大版必修第一册),文件包含专题31+指数4类必考点北师大版必修第一册原卷版docx、专题31+指数4类必考点北师大版必修第一册解析版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。