专题10.1 统计(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用)
展开【核心素养】
1.会用简单随机抽样方法从总体中抽取样本,凸显数据分析的核心素养.
2.借助频率分布表画频率分布直方图、频率折线图,提升读图、数据分析的能力,凸显直观想象、数据分析的核心素养.
3.能从样本数据中提取样本的数字特征(如平均数、标准差),并做出合理的解释,凸显数学运算的核心素养.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题,凸显数学建模的核心素养.
知识点一
简单随机抽样
1.简单随机抽样的特点
(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
2.抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
3.分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”.
提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·eq \f(Ni,N)(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
知识点二
用样本估计总体
1.频率、频数、样本容量的计算方法
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,
样本容量×频率=频数.
(3)各个小方形的面积总和等于1 .
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=极差/组数;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.
4.茎叶图的画法步骤:
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的右(左)侧.
知识点三
中位数、众数、平均数、方差、标准差、百分位
1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
常考题型剖析
题型一: 简单随机抽样
【典例分析】
例1-1.(2023上·四川成都·高三石室中学校考期中)学校举行舞蹈比赛,现从报名的50位学生中利用下面的随机数表抽取10位同学参加,将这50位学生按01、02、、50进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第5个号码所对应的学生编号为( ).
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
5124 5179 3014 2310 2118 2191 3726 3890 0140 0523 2617
A.43B.25C.32D.12
例1-2.(2022·江苏·高三专题练习)采用抽签法从含有3个个体的总体中抽取一个容量为2的样本,则所有可能的样本为______.
【总结提升】
不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
【变式训练】
变式1-1.(2023·贵州·统考模拟预测)从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按、、、进行编号,然后从随机数表第一行的第列和第列数字开始往右依次选取两个数字,则选出的第个同学的编号为( )
(注:表中的数据为随机数表第一行和第二行)
A.B.C.D.
变式1-2.(2023·上海黄浦·上海市大同中学校考三模)北京时间2022年6月5日,搭载神舟十四号载人飞船的长征二号F遥十四运载火箭,在酒泉卫星发射中心点火发射,某中学为此举行了“讲好航天故事”演讲比赛.现从报名的40位学生中利用下面的随机数表抽取10位同学参加演讲比赛,将40位学生按01、02、、40进行编号,假设从随机数表第1行第3个数字开始由左向右依次选取两个数字,重复的跳过,则选出来的第7个号码所对应的学生编号为 .
0627 4313 2636 1547 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
5124 5179 3014 2310 2118 2191 3726 3890 0140 0523 2617
题型二:分层抽样
【典例分析】
例2-1.(2023上·陕西宝鸡·高三统考阶段练习)某学校为了解学生参加体育活动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取80名学生,已知该校初中部和高中部分别有250名和150名学生,则不同的抽样结果共有( )
A.种B.种C.种D.种
例2-2.(2023上·上海闵行·高三闵行中学校考期中)已知三个社区的居民人数分别为,现从中采用分层抽样方法抽取一个容量为的样本,若从社区抽取了15人,则( )
A.33B.18C.27D.21
【答案】A
【分析】根据抽样比即可求解.
【详解】三个社区的居民人数分别为,
从中抽取一个容量为的样本,从社区抽取了15人,
则,解得.
故选:A
【规律方法】
1.分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
2.进行分层抽样的相关计算时,常用到的两个关系
(1)抽样比=eq \f (样本容量n,总体的个体数N)=eq \f (该层抽取的个体数,该层的个体数).
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
【变式训练】
变式2-1.(2023·辽宁抚顺·校考模拟预测)2022年第22届卡塔尔世界杯决赛中,来自南美洲的阿根廷队战胜来自欧洲的法国队,夺得冠军,这22届世界杯冠军中,10个在南美洲,12个在欧洲.某专栏记者拟撰写一篇文章,按分层抽样的方法抽取11个冠军队伍对两大洲足球风格进行分析比较,则需从南美洲抽取的球队个数为( )
A.3B.4C.5D.6
变式2-2.(2023·全国·统考高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种B.种
C.种D.种
题型三:样本的数字特征的计算与应用
【典例分析】
例3-1.【多选题】(2023·全国·统考高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
例3-2.(2023·全国·统考高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【规律总结】
利用样本的数字特征解决决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)方差的简化计算公式:s2=eq \f (1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-neq \x\t(x)2],或写成s2=eq \f (1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \x\t(x)2,即方差等于原数据平方的平均数减去平均数的平方.
【变式训练】
变式3-1.(2022·全国·高考真题(理))某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
变式3-2.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
题型四: 频率分布直方图
【典例分析】
例4-1.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8B.12C.16D.18
例4-2.(2023·全国·统考高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【总结提升】
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
2.特别提醒:
(1)频率分布直方图的纵坐标是eq \f (频率,组距),而不是频率,切莫与条形图混淆.
(2)频率分布直方图考查时,重视求平均数、中位数、方差,计算要准确,解决突破口是各个矩形面积之和为1.
【变式训练】
变式4-1.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
变式4-2.(2020·全国·高考真题(文))某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
乙分厂产品等级的频数分布表
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
题型五: 统计与古典概率结合问题
【典例分析】
例5-1.(2023上·四川成都·高三石室中学校考阶段练习)为建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发《国家学生体质健康标准》,要求各学校每学年开展覆盖本校各年级学生的《标准》测试工作.为做好全省的迎检工作,成都市在高三年级开展了一次体质健康模拟测试,并从中随机抽取了200名学生的数据,根据他们的健康指数绘制了如图所示的频率分布直方图.
(1)估计这200名学生健康指数的平均数和样本方差(同一组数据用该组区间的中点值作代表);
(2)从健康指数在的两组中利用分层抽样抽出7人进行电话回访,并再随机抽出2人赠送奖品,求从7人中抽出的2人来自不同组的概率.
例5-2.(2019·天津·高考真题(文))2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.
(Ⅰ)应从老、中、青员工中分别抽取多少人?
(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.
【变式训练】
变式5-1.(2023上·四川成都·高三校考阶段练习)某部门为了解一企业在生产过程中的用水量情况,对每天的用水量作了记录,得到了大量该企业的日用水量的统计数据.从这些统计数据中随机抽取12天的用水量的数据作为样本,得到的统计结果如表:
(1)求,,的值;
(2)已知样本中日用水量在内的这六个数据分别为83,85,86,87,88,89.从这六个数据中随机抽取两个,求抽取的两个数据中至少有一个大于86的概率.
变式5-2.(2023·贵州遵义·统考三模)2018年12月8日,我国在西昌卫星发射中心用长征三号乙运载火箭成功发射嫦娥四号探测器,开启了月球探测的新旅程.为了解广大市民是否实时关注了这一事件,随机选取了部分年龄在20岁到70岁之间的市民作为一个样本,将此样本按年龄,,,,分为5组,并得到如图所示的频率分布直方图.
(1)求图中实数a的值,并估计样本数据中市民年龄的众数;
(2)为进一步调查市民在日常生活中是否关注国家航天技术发展的情况,现按照分层抽样的方法从,,三组中抽取了6人,再从这6人中任意抽取2人来讲述自己所了解的中国航天的发展历程,求这2人中至少有1人的年龄位于之间的概率.
题型六: 统计中的图、表及其应用
【典例分析】
例6-1.(2023上·湖南邵阳·高三校考阶段练习)假设你有一笔资金用于投资,现有三种投资方案供你选择,这三种方案每天的回报如图所示.横轴为投资时间,纵轴为每天的回报,根据以上信息,若使回报最多,下列说法错误的是( )
A.投资3天以内(含3天),采用方案一
B.投资4天,不采用方案三
C.投资6天,采用方案一
D.投资9天,采用方案三
例6-2.(2023·河南平顶山·校联考模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【变式训练】
变式6-1.(2022·河南·统考模拟预测)2021年秋季河南省在高一推行新教材,为此河南省某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确( )
A.这100名教师的测试成绩的极差是20分
B.这100名教师的测试成绩的众数是90分
C.这100名教师的测试成绩的中位数是87.5分
D.这100名教师中测试成绩不低于90分的人数占比超过50%
变式6-2.【多选题】(2023·广东佛山·统考一模)举世瞩目的第19届亚运会于9月23日至10月8日在杭州举行,亚运会点燃了国人激情,也将一股运动风吹到了大学校园.为提升学生身体素质,倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.下图为该校甲、乙两名同学在同一星期内每日步数的拆线统计图,则( )
A.这一星期内甲、乙的日步数的中位数都为12600
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的方差大于甲的日步数的方差
D.这一星期内乙的日步数的下四分位数是12200
.
一、选择题
1.(2023·河南郑州·统考模拟预测)为了树立和践行绿水青山就是金山银山的理念,市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( )
A.30棵B.50棵C.72棵D.80棵
2.(2020·全国·高考真题(理))在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A.B.
C.D.
3.(2023·安徽淮南·统考一模)为迎接北京年冬奥会,小王选择以跑步的方式响应社区开展的“喜迎冬奥爱上运动”(如图)健身活动.依据小王年月至年月期间每月跑步的里程(单位:十公里)数据,整理并绘制的折线图(如图),根据该折线图,下列结论正确的是( )
A.月跑步里程逐月增加
B.月跑步里程的极差小于
C.月跑步里程的中位数为月份对应的里程数
D.月至月的月跑步里程的方差相对于月至月的月跑步里程的方差更大
4.(2023·贵州·统考模拟预测)某校为了解高一学生一周课外阅读情况,随机抽取甲,乙两个班的学生,收集并整理他们一周阅读时间(单位:),绘制了下面频率分布直方图.根据直方图,得到甲,乙两校学生一周阅读时间的平均数分别为,标准差分别为,则于( )
A.,B.,
C.,D.,
多选题
5.(2023上·浙江湖州·高三期末)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
6.(2023上·江苏徐州·高三统考期中)为调研某地空气质量,连续10天测得该地PM2.5(PM2.5是衡量空气质量的重要指标,单位:)的日均值,依次为,则( )
A.前4天的极差大于后4天的极差
B.前4天的方差小于后4天的方差
C.这组数据的中位数为31或33
D.这组数据的第60百分位数与众数相同
填空题
7.(2022·全国·高三专题练习)下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是 (填序号).
8.(2023·吉林·统考一模)吉林市一中学有男生900人,女生600人.在“书香校园”活动中,为了解全校学生的读书时间,按性别比例分层随机抽样的方法抽取100名学生,其中男生、女生每天读书时间的平均值分别为60分钟和80分钟,方差分别为10和15.结合上述数据估计该校学生每天读书时间的平均值为 分钟,方差为 .
四、解答题
9.(2023上·陕西榆林·高三陕西省子洲中学校考期中)(1)求下列数据的第一四分位数.
.
(2)两个志愿者组织共有志愿者2400人,现用分层抽样的方法,从所有的志愿者中抽取一个容量为160的样本.已知从甲志愿者组织中抽取的人数为150,求乙志愿者组织中的人数.
10.(2019·全国·高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
11.(2023·四川宜宾·统考二模)2022年中国新能源汽车销量继续蝉联全球第一,以比亚迪为代表的中国汽车交出了一份漂亮的“成绩单”,比亚迪新能源汽车成为2022年全球新能源汽车市场销量冠军,为了解中国新能源车的销售价格情况,随机调查了10000辆新能源车的销售价格,得到如图的样本数据的频率分布直方图:
(1)估计一辆中国新能源车的销售价格位于区间(单位:万元)的概率,以及中国新能源车的销售价格的众数;
(2)现有6辆新能源车,其中2辆为比亚迪新能源车,从这6辆新能源车中随机抽取2辆,求至少有1辆比亚迪新能源车的概率.
12.(2023上·重庆沙坪坝·高三重庆八中校考阶段练习)树人中学有高一学生600人,其中男生400人,女生200人.为了获得该校全体高一学生的身高信息,采用分层抽样的方法抽取一个容量为60的样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为170,方差为18,女生样本的均值为161,方差为30.现有两种抽取样本的方案来计算总样本的均值和方差:①按比例分配分层抽样,男女样本量分别为40,20;②按等额分配分层抽样,男、女样本量都是30.
(1)你认为哪种方案得到的总样本的均值和方差作为总体的均值和方差的估计更合理?请说明理由;
(2)请用第(1)问中你选择的方案计算总样本的均值与方差s²;
(3)根据总样本数据发现有两个数据154,180在区间以外,在总样本数据中剔除这两个数据,用剩下的数据计算新总样本均值和方差(精确到0.1).0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
等级
A
B
C
D
频数
40
20
20
20
等级
A
B
C
D
频数
28
17
34
21
员工项目
A
B
C
D
E
F
子女教育
○
○
×
○
×
○
继续教育
×
×
○
×
○
○
大病医疗
×
×
×
○
×
×
住房贷款利息
○
○
×
×
○
○
住房租金
×
×
○
×
×
×
赡养老人
○
○
×
×
×
○
日用水量(单位:吨)
频数
3
6
频率
0.5
专题10.2 统计案例(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用): 这是一份专题10.2 统计案例(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用),文件包含专题102统计案例原卷版docx、专题102统计案例解析版docx等2份试卷配套教学资源,其中试卷共69页, 欢迎下载使用。
专题9.4 双曲线(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用): 这是一份专题9.4 双曲线(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用),文件包含专题94双曲线原卷版docx、专题94双曲线解析版docx等2份试卷配套教学资源,其中试卷共71页, 欢迎下载使用。
专题9.3 椭圆(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用): 这是一份专题9.3 椭圆(讲+练)-备战高考数学大一轮复习核心考点精讲精练(新高考专用),文件包含专题93椭圆原卷版docx、专题93椭圆解析版docx等2份试卷配套教学资源,其中试卷共71页, 欢迎下载使用。