







高中数学高考2022届高考数学一轮复习(新高考版) 第9章 §9 1 随机抽样、用样本估计总体课件PPT
展开1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体 中抽取样本,了解分层抽样和系统抽样的方法.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估 计总体的基本数字特征,理解用样本估计总体的思想.
ZHUGANSHULI JICHULUOSHI
1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于 .(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数 的数.(2)中位数:将数据从小到大排列,若有奇数个数,则 的数是中位数;若有偶数个数,则 是中位数.(3)平均数: = ,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s= .
(5)方差:s2= (xn是样本数据,n是样本容量, 是样本平均数).
1.三种抽样方法有什么共同点和联系?
提示 (1)抽样过程中每个个体被抽取的机会均等.(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样.
2.平均数、标准差与方差反映了数据的哪些特征?
提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.( )(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( )
2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20
同理可得这三个年龄段抽取人数分别为25,56,19.
解析 从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,
3.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是
A.7,7 B.8,7.5 C.7,7.5 D.8,6
4.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.
解析 0.5×0.5×100=25.
5.已知一组数据的频率分布直方图如图,则众数是____,平均数是____.
解析 因为最高小长方形中点的横坐标为65,所以众数为65;
平均数 =(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.
6.若数据x1,x2,x3,…,xn的平均数 =5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为______.
解析 ∵x1,x2,x3,…,xn的平均数为5,
∵x1,x2,x3,…,xn的方差为2,∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
TIXINGTUPO HEXINTANJIU
1.(2020·吉安模拟)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为附:第6行至第9行的随机数表如下:2635 7900 3370 9160 1620 3882 7757 49503211 4919 7306 4916 7677 8733 9974 67322748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 5125A.33 B.16 C.38 D.20
解析 按随机数法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.
2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是
3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为24,16,8.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为A.3 B.4 C.5 D.6
(1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回的抽样.(2)分层抽样适用于总体中个体差异较大的情况.
题型二 统计图表及应用
例1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
例2 下面两个图是2020年6月25日由国家卫健委发布的全国疫情累计趋势图,每图下面横向标注日期,纵向标注累计数量.现存确诊为存量数据,计算方法为:累计确诊数-累计死亡数-累计治愈数.
则下列对新冠肺炎叙述错误的是A.自1月20日以来一个月内,全国累计确诊病例属于快速增长时期B.自4月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制C.自6月16日至24日以来,全国每日现存确诊病例平缓增加D.自6月16日至24日以来,全国每日现存确诊病例逐步减少
解析 由图1可知A,B均正确;由图2数据计算得16日的现存确诊病例为84 867-79 926-4 645=296,同理可计算18,20,22,24日现存确诊分别为346,383,441,473.
例3 如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7
解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均数相等,
命题点4 频率分布直方图
例4 (2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为
A.10 B.18 C.20 D.36
解析 因为直径落在区间[5.43,5.47]内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.
(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(4)准确理解频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
跟踪训练 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查,得到的数据如图2.下列说法错误的是
A.样本容量为240B.若m=50,则本次自主学习学生的满意度不低于四成C.总体中对方式二满意的学生约为300人D.样本中对方式一满意的学生为24人
解析 选项A,样本容量为6 000×4%=240,该选项正确;
选项B,根据题意得自主学习的满意率为 ≈0.358<0.4,该选项错误;
选项C,样本可以估计总体,但会有一定的误差,总体中对方式二满意人数约为1 500×20%=300,该选项正确;
选项D,样本中对方式一满意人数为2 000×4%×30%=24,该选项正确.
(2)(2021·贵阳模拟)某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2019年 1月至2019年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了右面的折线图.根据折线图,下列结论正确的是
A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8,9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较 平稳
解析 由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;
月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.
(3)(2020·成都模拟)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数
解析 甲所得分数的极差为33-11=22,A正确;乙所得分数的中位数为18,B正确;甲所得分数的众数为22,乙所得分数的众数为22,C正确,故选D.
(4)如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值为_______.
故x=0.1-0.054-0.010-0.006×3=0.018.
题型三 用样本的数字特征估计总体的数字特征
1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到 7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数 B.平均数C.方差 D.极差
解析 记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.
2.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为me,平均数为 ,众数为m0,则
解析 由图知m0=5,由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,
解析 经停该站高铁列车所有车次的平均正点率的估计值为 =0.98.
3.(2019·全国Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
4.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
如果甲、乙两人中只有1人入选,则入选的最佳人选应是____.
∴甲更稳定,故最佳人选应是甲.
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值.实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.
KESHIJINGLIAN
1.要完成下列两项调查:(1)某社区有100户高收入家庭,220户中等收入家庭,80户低收入家庭,从中抽取100户调查购买力的某项指标;(2)从某中学高二年级的10名体育特长生中抽取3人调查学习负担情况.应采取的抽样方法是A.(1)(2)都用简单随机抽样法B.(1)用分层抽样法,(2)用简单随机抽样法C.(1)用简单随机抽样法,(2)用分层抽样法D.(1)(2)都用分层抽样法
解析 (1)中收入差距较大,采用分层抽样法较合适;(2)中总体容量较小,采用简单随机抽样法较合适.
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为A.100 B.150 C.200 D.250
总体容量为3 500+1 500=5 000,
3.(2021·四川双流中学检测)某调研机构随机调查了2020年某地区n名业主物业费的缴费情况,发现缴费金额(单位:万元)都在区间[0.5,1.1]内,其频率分布直方图如图所示,若第五组的频数为32,则样本容量n等于
A.200 B.400 C.800 D.1 600
解析 根据频率分布直方图,第五组的频率为0.8×0.1=0.08,
4.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是A.32 34 32B.33 45 35C.34 45 32D.33 36 35
解析 从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33;45出现的次数最多,所以这组数据的众数为45;最大值是47,最小值是12,故极差是35.
5.(多选)下表为2020年某煤炭公司1~10月份的煤炭生产量:
则下列结论正确的是A.极差为12.5万吨B.平均数为24万吨C.中位数为24万吨D.众数为17.5万吨
解析 将表格中的数据由小到大排列依次为17.5,17.5,21,23,24,25,26,27,29,30.极差为30-17.5=12.5(万吨),A正确;
众数为17.5(万吨),D正确.
6.(多选)(2021·江苏省南通市启东中学模拟)某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是A.样本中支出在[50,60)元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2 000名学生,则一定有600人 支出在[50,60)元
解析 样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;
若该校有2 000名学生,则可能有0.3×2 000=600人支出在[50,60)元,故D错误.
7.若数据x1,x2,…,xn的平均数为 ,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为____________.
方法二 原数据乘以2加上3得到一组新数据,
则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2 +3和4s2.
8.(2021·惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,这320名学生中每周的自习时间不足22.5小时的人数是_____.
解析 由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320×(0.02+0.07)×2.5=72(人).
9.某校为了解学生的身体素质情况,采用按年级分层抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k∶5∶4,抽取的样本中高一学生为120人,则k的值为______.
10.(2019·江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是_____.
11.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布表和频率分布直方图如下,回答下列问题:
(1)分别求出a,b,x,y的值,并补全频率分布直方图;
解 a=6,b=9,x=0.15,y=0.25,补全频率分布直方图如图.
(2)估计这次环保知识竞赛的平均分.
解 用组中值估计平均分:44.5×0.1+54.5×0.15+64.5×0.15+74.5×0.3+84.5×0.25+94.5×0.05=70.5.故这次环保知识竞赛的平均分约为70.5.
12.(2020·西安质检)某中学举行电脑知识竞赛,现将参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.
(1)求参赛学生的成绩的众数、中位数;
解 因为频率分布直方图中最高小长方形所在的区间的中点值为65,所以众数为65,又因为第一个小长方形的面积为0.3,第二个小长方形的面积为0.4,0.3+0.4>0.5 ,所以中位数在第二组,设中位数为x,则0.3+(x-60)×0.04=0.5,解得x=65,所以中位数为65.
(2)求参赛学生的平均成绩.
解 依题意,可得平均成绩为(55×0.03+65×0.04+75×0.015+85×0.010+95×0.005)×10=67,所以参赛学生的平均成绩为67分.
13.某校高二年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组为[90,100),[100,110),[110,120),[120,130),[130,140),[140,150),得到的频率分布直方图如图所示,则下列说法中正确的序号是________.
①a=0.045;②这800名学生中数学成绩在110分以下的人数为160;③这800名学生数学成绩的中位数约为121.4;④这800名学生数学成绩的平均数为125.
解析 由题意得(0.005+0.01+0.01+0.015+0.025+a)×10=1,解得a=0.035,①错;110分以下的人数为(0.01+0.01)×10×800=160,②正确;120分以下的频率是(0.01+0.01+0.025)×10=0.45,设中位数为x,
平均分为95×0.1+105×0.1+115×0.25+125×0.35+135×0.15+145×0.05=120,④错.
14.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃).①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,平均数为24;③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.则肯定进入夏季的地区有____个.
解析 甲地肯定进入夏季,因为众数为22,所以22 ℃至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,10.2×5-(32-26)2≥(26-x)2,所以15≥(26-x)2,所以x≤22不成立;乙地不一定进入,如13,23,27,28,29,肯定进入夏季的地区有2个.
15.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,右图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况.下列叙述中正确的是A.消耗1升汽油,乙车最多可行驶5千米
B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时.相同条件下,在该市用丙车比用 乙车更省油
解析 对于A,由图象可知当速度大于40 km/h时,乙车的燃油效率大于5 km/L,所以当速度大于40 km/h时,消耗1升汽油,乙车的行驶距离大于5 km,故A错误;
对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升
汽油,甲车的行驶路程最远,所以以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;
对于C,由图象可知当速度为80 km/h时,甲车的燃油效率为10 km/L,即甲车行驶10 km时,耗油1升,故行驶1小时,路程为80 km,燃油为8升,故C错误;
对于D,由图象可知当速度小于80 km/h时,丙车的燃油效率大于乙车的燃油效率,所以
用丙车比用乙车更省油,故D正确.
16.某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):
(1)请你计算这两组数据的平均数、中位数;
甲、乙两组数据的中位数分别为83分,84分.
(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.
①从平均数看,甲、乙均为85分,平均水平相同;②从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲;
④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;
⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.
2024年高考数学一轮复习(新高考版) 第9章 §9.2 用样本估计总体课件PPT: 这是一份2024年高考数学一轮复习(新高考版) 第9章 §9.2 用样本估计总体课件PPT,共60页。PPT课件主要包含了落实主干知识,探究核心题型,课时精练,大于或等于,平均数,方差和标准差,填表如下等内容,欢迎下载使用。
高考数学一轮复习第9章第1节随机抽样课件: 这是一份高考数学一轮复习第9章第1节随机抽样课件,共45页。PPT课件主要包含了不放回,抽签法,随机数法,总样本,一个或多个,子总体,属于且仅属于,简单随机抽样,比例分配,×××等内容,欢迎下载使用。
高考复习 9.1 随机抽样、用样本估计总体课件PPT: 这是一份高考复习 9.1 随机抽样、用样本估计总体课件PPT,共60页。PPT课件主要包含了随机数,最大值,最小值,100-p%,从小到大,平均数,答案B,答案A,答案BC,答案ABD等内容,欢迎下载使用。