还剩17页未读,
继续阅读
人教A版高中数学必修第二册第9章章末综合提升学案
展开
这是一份人教A版高中数学必修第二册第9章章末综合提升学案,共20页。
类型1 抽样方法1.抽样方法有:简单随机抽样、分层随机抽样.对抽样方法的考查,主要有两点:一是两种抽样方法的判断;二是关于分层随机抽样的样本容量的计算问题,特别与其他的问题结合在一起的问题要引起重视.2.掌握两种抽样方法,提升数据分析素养.【例1】 (1)某市举行以“学习党的二十大精神,培根铸魂育新人”为主题的中小学教师演讲比赛.若将报名的50位教师编号为00,01,…,49,利用下面的随机数表来决定他们的出场顺序,选取方法是从下面随机数表第1行第5列开始横向依次选取两个数字,重复的剔除,则选出来的第8个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.12 B.20 C.29 D.23(2)(多选)(2022·山东聊城一中月考)某校高二年级有男生600人,女生400人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到一个总样本量为100的样本,计算得到男生、女生的平均身高分别为170 cm和160 cm,方差分别为15和30,则下列说法正确的有( )A.若张华采用样本量比例分配的方式进行抽样,则男生、女生分别应抽取60人和40人B.若张华采用样本量比例分配的方式进行抽样,则样本的方差为37.8C.若张华采用样本量比例分配的方式进行抽样,则样本的平均数为166,此时可用样本平均数估计总体的平均数D.若张华采用等额抽取,即男生、女生分别抽取50人,则某男生甲被抽到的概率为110(1)B (2)AC [(1)根据随机数表的读数规则,依次从随机数表中读出的有效编号为:32,12,31,02,01,04,15,20,得到选出来的第8个个体的编号为20.故选B.(2)A选项,男生抽取100×600600+400=60,女生抽取100-60=40人,A选项正确.C选项,样本平均数为60100×170+40100×160=166,可以用样本平均数估计总体的平均数,C选项正确.B选项,样本方差为6010015+170-1662+4010030+160-1662=935+1325=45,所以B选项错误.D选项,男生甲被抽到的概率为50600=112,D选项错误.故选AC.] 类型2 统计图表及其应用1.常见的统计图表有:频率分布直方图、条形图、折线图、扇形图等等,不同的统计图表在表示数据上有不同的特点.2.掌握常见的统计图表,提升直观想象、数据分析和数学运算素养.【例2】 (1)(多选)(2022·江苏沭阳县修远中学期末)某中学举行安全知识竞赛,对全校参赛的1 000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )A.这组数据的极差为50 B.这组数据的众数为76C.这组数据的中位数为5407 D.这组数据的第75百分位数为85(2)(多选)(2022·山东济南市历城第二中学月考)某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:用该样本估计总体,以下说法正确的有( )A.57周岁以上参保人数最少 B.18~30周岁人群参保总费用最少C.C险种更受参保人青睐D.31周岁以上的人群约占参保人群80%(1)CD (2)ACD [(1)对于A:由频率分布直方图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;数据的众数为1270+80=75,故B错误;(0.005+0.02+0.035)×10=0.6>0.5,(0.005+0.02)×10=0.25<0.5,所以中位数位于70,80之间,设中位数为x,则(0.005+0.02)×10+x-70×0.035=0.5,解得x=5407,即这组数据的中位数为5407,故C正确;∵(0.005+0.02+0.035)×10=0.6,(0.005+0.02+0.035+0.03)×10=0.9,故估计第75分位数是80+0.75-0.60.3×10=85,故D正确.故选CD.(2)由扇形图可知,57周岁以上参保人数最少,故A正确;由折线图可知,18~30周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故B错误;由条形图可知,C险种参保比例最高,故C正确;由扇形图可知,31周岁以上的人群约占参保人群80%,故D正确.故选ACD.] 类型3 用样本的集中趋势、离散程度估计总体1.为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.2.掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学运算素养.【例3】 某工厂36名工人的年龄(单位:岁)数据如下:40,44,40,41,33,40,45,42,43,36,31,38,39,43,45,39,38,36,27,43,41,37,24,42,37,44,42,34,39,43,38,42,53,37,49,39.利用简单随机抽样抽取容量为9的样本,其年龄数据为44,40,36,43,36,37,44,43,37.(1)计算样本的平均数x和方差s2;(2)36名工人中年龄在x-s与x+s之间的有多少人?所占的百分比是多少?(精确到0.01%)[解] (1)由平均数公式知,x=19×(44+40+36+43+36+37+44+43+37)=40,由方差公式知,s2=19×[(44-40)2+(40-40)2+…+(37-40)2]=1009.(2)因为s2=1009,则s=103,所以36名工人中年龄在x-s和x+s之间的人数等于年龄在区间[37,43]内的人数,共23人.所以36名工人中年龄在x-s和x+s之间的人数所占的百分比为2336×100%≈63.89%.章末综合测评(四) 统计(时间:120分钟 满分:150分)一、选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.某工厂为了了解加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体 B.个体 C.样本 D.样本量C [总体是这一批零件的长度,个体是每个零件的长度,样本是抽取的200个零件的长度,样本量是200.]2.在实际生活中,有的问题适合普查,例如人口变化,有的问题适合抽样调查,例如产品质量.下列最适合抽样调查的是( )A.高一·一班数学作业完成情况B.了解一批牛奶的质量C.某汽车4S店想知晓新客户对服务的评价D.环保局调查管辖范围内湖泊的水质情况B [依据总体的特殊性,B项最适合抽样调查.]3.某地每十万人中拥有的各类受教育程度的人口情况,绘制了如图所示的扇形统计图,则( )A.每十万人中拥有高中(含中专)文化程度的人数最少B.每十万人中拥有大专及以上文化程度的人数少于2万C.每十万人中拥有小学文化程度的人数最多D.每十万人中拥有初中和高中(含中专)文化程度的人数占比不到50%B [对于A,每十万人中其他文化程度的人数最少,占比为10%,错误;对于B,每十万人中拥有大专及以上文化程度的人数为10×15%=1.5万,正确;对于C,每十万人中拥有初中文化程度的人数最多,占比为35%,错误;对于D,每十万人中拥有初中和高中(含中专)文化程度的人数占比为50%,错误.故选B.]4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为a,众数为b,平均值为c,则( )A.a=b=c B.a=b<c C.a<b<c D.b<a<cD [由统计图知众数b=5.将30名学生得分从小到大排列,第15个数是5,第16个数是6,所以中位数a=5+62=5.5.又平均值c=6+12+50+36+21+16+18+2030≈5.97.所以b<a<c.]5.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差B [讲座前中位数为70%+75%2>70%,所以A错误;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错误.故选B.]6.(2022·河北邯郸摸底考试)某高中2022年的高考考生人数是2021年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:下列结论正确的是( )A.该校2022年与2021年的本科达线人数比为6∶5B.该校2022年与2021年的专科达线人数比为6∶7C.2022年该校本科达线人数增加了80%D.2022年该校不上线的人数有所减少C [不妨设2021年的高考人数为100,则2022年的高考人数为150.2021年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为9∶5,本科达线人数增加了80%,故选项A错误,选项C正确;2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为9∶7,选项B错误; 2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项D错误.故选C.]7.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数录错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是( )A.70,75 B.70,50C.75,1.04 D.65,2.35B [因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2=148[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=148[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.]8.(2022·山东泰安期末)某校组织歌咏比赛,已知5位评委按百分制分别给出某参赛班级的评分(评分为整数),则下列选项中,可以判断出评分中一定出现100分的是( )A.平均数为97,中位数为95B.中位数为95,众数为98C.平均数为98,众数为98D.中位数为96,极差为8A [对于A,设这5个数为a,b,95,c,d,其中a≤b≤95≤c≤d≤100,则a+b≤190,a+b+95+c+d5=97,所以a+b+c+d=390,因为a+b≤190,所以c+d≥200,所以c=d=100,所以平均数为97,中位数为95时,评分中一定出现100分,故A符合;对于B,当这5个数分别为93,94,95,98,98时,则中位数为95,众数为98,没有出现100分,故B不一定;对于C,当这5个数分别为98,98,98,98,98时,则平均数为98,众数为98,没有出现100分,故C不一定;对于D,当这5个数分别为90,92,96,98,98时,则中位数为96,极差为8,没有出现100分,故D不一定.故选A.]二、选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求,全部选对的得5分,部分选对的得2分,有选错的得0分)9.(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同CD [设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x+c,m+c,σ,t,因为c≠0,所以C,D正确,故选CD.]10.(2022·重庆市两江育才中学月考)为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计正确的是( )A.众数为82.5 B.第80百分位数为91.7C.平均数为88 D.没有一半以上干部的成绩在80~90分之间AB [由图知:众数出现在[80,85)之间,故众数为82.5,故A正确;由图可得该次考试成绩在90分以下所占比例为5×(0.01+0.03+0.06+0.05)=0.75,在95分以下所占比例为5×(0.01+0.03+0.06+0.05+0.03)=0.9,因此,第80百分位数一定位于[90,95)内,所以第80百分位数为90+5×0.8-0.750.9-0.75≈91.7,故B正确;由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C错误;由(0.06+0.05)×5=0.55>0.5,有一半以上干部的成绩在80~90分之间,D错误.故选AB.]11.下列命题是真命题的是( )A.分层随机抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B.某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C.甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5BD [对于选项A:根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A错误;对于选项B:样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B正确;对于选项C:甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x=14×60+34×68=66,故选项C错误;对于选项D:将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D正确.]12.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x= 3小时,方差为s2= 2.003,其中高一学生、高二学生每天读书时间的平均数分别为x1=2.6,x2=3.2,又已知三个年级学生每天读书时间的方差分别为s1 2=1,s2 2=2,s3 2=3,则高三学生每天读书时间的平均数x3可能是( )A.3.2 B.3.3 C.2.7 D.4.5BC [由题意可得2.003=8002 000[1+(2.6-3)2]+6002 000[2+(3.2-3)2]+6002 000[3+(x3-3)2],解得x3=3.3或2.7.]三、填空题(本大题共4小题,每小题5分,共20分)13.下列数据的70%分位数为________.20,14,26,18,28,30,24,26,33,12,35,22.28 [把所给的数据按照从小到大的顺序排列可得:12,14,18,20,22,24,26,26,28,30,33,35,因为有12个数据,所以12×70%=8.4,不是整数,所以数据的70%分位数为第9个数28.]14.我国高铁发展迅速,技术先进.经统计在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.0.98 [x=10×0.97+20×0.98+10×0.9910+20+10=0.98,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.]15.(2022·江西贵溪一中月考)某口罩生产商为了检验产品质量,从总体编号为001,002,003,…,499,500的500盒口罩中,利用随机数表(以下摘取了随机数表中第12行至第13行)选取10个样本进行抽检,选取方法是从随机数表第12行第5列的数字开始由左向右读取,则选出的第4个样本的编号为________.16 00 11 66 14 90 84 45 11 65 73 88 05 90 52 27 41 14 86 22 9812 22 08 07 52 74 95 80 35 69 68 32 50 61 28 47 39 75 34 58 62222 [从随机数表第12行第5列的数字开始由左向右读取,依次可以得到:116,445,148,222,080,356,…,则选出的第4个样本的编号为222.]16.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.0.030 3 [∵5个矩形面积之和为1,即(0.005+0.010+0.020+a+0.035)×10=1,∴a=0.030.∵三组内学生数的频率分别为:0.3,0.2,0.1,∴三组内学生的人数分别为30,20,10.∴从身高在[140,150]内的学生选取的人数为18×1030+20+10=3.]四、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤)17.(本小题满分10分)(2022·黑龙江哈尔滨四中月考)从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查,结果如下:甲:5,5,6,6,8,8,8,10;乙:4,5,6,7,8,9,12,13;丙:3,3,4,7,9,10,11,12.(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出________(从“甲、乙、丙”三厂家中选择一个)厂家在广告中依据了统计数据中的哪个特征数?(2)计算甲厂家抽取的8件产品的方差.[解] (1)选择甲厂家,因为甲厂家抽取的8件产品的众数是8,所以甲厂家的广告依据了统计数据中的众数;选择乙厂家,因为乙厂家抽取的8件产品的平均数是8,所以乙厂家的广告依据了统计数据中的平均数;选择丙厂家,因为丙厂家抽取的8件产品的中位数是8,所以丙厂家的广告依据了统计数据中的中位数.(2)甲厂家抽取的8件产品的使用寿命为5,5,6,6,8,8,8,10,其平均数为x=18×(5+5+6+6+8+8+8+10)=7,方差为s2=18×(22+22+12+12+12+12+12+32)=2.75.18.(本小题满分12分)随机抽取某4S店分公司20位员工今年的销售业绩,统计如下所示(单位:辆):26 34 28 32 35 38 22 39 23 2528 30 24 38 33 33 22 34 21 27(1)若需要有10%的优秀员工,应将标准设定在多少?(2)若要给至少80%的员工年度考评评级为通过,应将标准设定在多少?[解] (1)将20个样本数据从小到大进行排序如下所示(单位:辆):21 22 22 23 24 25 26 27 28 2830 32 33 33 34 34 35 38 38 39由于20×90%=18是整数,所以临界值为有序样本中第18和19两个数的平均数,故为38.因此,可以规定如下:若需要有10%的优秀员工,应将标准设定在38辆.(2)由于20×20%=4是整数,所以临界值为有序样本中第4和5两个数的平均数,故为23.5.因此,可以规定如下:若要给至少80%的员工年度考评评级为通过,应将标准设定23辆,或22辆,或21辆.19.(本小题满分12分)某公司为了了解近期内的用水情况,抽取了10天的用水量,如下表所示:(1)在这10天中,该公司用水量的平均数是多少?(2)在这10天中,该公司每天用水量的中位数是多少?(3)你认为用平均数和中位数中的哪一个数来描述该公司每天的用水量更合适?[解] (1)x=110(22+38+40+2×41+2×44+50+2×95)=51(吨).(2)中位数为41+442=42.5(吨).(3)平均数受数据中的极端值(2个95)影响较大,使用平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.20.(本小题满分12分)随着老年人消费需求从“生存型”向“发展型”转变,消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在[60,80)的老年人的年收入按年龄[60,70),[70,80)分成两组进行分层抽样调查,已知抽取了年龄在[60,70)的老年人500人,年龄在[70,80)的老年人300人.现作出年龄在[60,70)的老年人年收入的频率分布直方图(如图所示).(1)根据频率分布直方图,估计该地年龄在[60,70)的老年人年收入的平均数及第95百分位数;(2)已知年龄在[60,70)的老年人年收入的方差为3,年龄在[70,80)的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在[60,80)的老年人年收入的方差.[解] (1)频率分布直方图中,该地年龄在[60,70)的老年人年收入的平均数约为:0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35,由频率分布直方图,年收入在8.5万元以下的老年人所占比例为1-0.04×1=0.96,年收入在7.5万元以下的老年人所占比例为1-(0.05×1+0.04×1)=0.91,因此,第95百分位数一定位于[7.5,8.5)内,由7.5+1×0.95-0.910.05=8.3,可以估计该地年龄在[60,70)的老年人年收入的第95百分位数为8.3.(2)设年龄在[60,70)的老年人样本的平均数记为x,方差记为sx2;年龄在[70,80)的老年人样本的平均数记为y,方差记为sy2;年龄在[60,80)的老年人样本的平均数记为z,方差记为s2.由(1)得x=5.35,由题意得,sx2=3,y=3.75,sy2=1.4,则z=500500+300×x+300500+300×y=4.75.由s2=1800×{500×[sx2+(x-z)2]+300×[sy2+(y-z)2]},可得s2=1800×{500×[3+(5.35-4.75)2]+300×[1.4+(3.75-4.75)2]}=3,即估计该地年龄在[60,80)的老年人的年收入方差为3.21.(本小题满分12分) 某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩(单位:分),整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图所示.(1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良生”的人数;(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明).[解] (1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),所以估计该校高一年级学生“体育良生”的人数为1 000×3040=750(人).(2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为x=140×(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).(3)因为甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,所以当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90.22.(本小题满分12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x==9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(1)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(2)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:0.008≈0.09.[解] (1)由于x =9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x-3s,x+3s)以外,因此需对当天的生产过程进行检查.(2)剔除离群值,即第13个数据,剩下数据的平均数为115(16× 9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.因为方差s2=,所以=16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008,所以这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.天数1112212用水量/吨22384041445095抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95
类型1 抽样方法1.抽样方法有:简单随机抽样、分层随机抽样.对抽样方法的考查,主要有两点:一是两种抽样方法的判断;二是关于分层随机抽样的样本容量的计算问题,特别与其他的问题结合在一起的问题要引起重视.2.掌握两种抽样方法,提升数据分析素养.【例1】 (1)某市举行以“学习党的二十大精神,培根铸魂育新人”为主题的中小学教师演讲比赛.若将报名的50位教师编号为00,01,…,49,利用下面的随机数表来决定他们的出场顺序,选取方法是从下面随机数表第1行第5列开始横向依次选取两个数字,重复的剔除,则选出来的第8个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.12 B.20 C.29 D.23(2)(多选)(2022·山东聊城一中月考)某校高二年级有男生600人,女生400人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到一个总样本量为100的样本,计算得到男生、女生的平均身高分别为170 cm和160 cm,方差分别为15和30,则下列说法正确的有( )A.若张华采用样本量比例分配的方式进行抽样,则男生、女生分别应抽取60人和40人B.若张华采用样本量比例分配的方式进行抽样,则样本的方差为37.8C.若张华采用样本量比例分配的方式进行抽样,则样本的平均数为166,此时可用样本平均数估计总体的平均数D.若张华采用等额抽取,即男生、女生分别抽取50人,则某男生甲被抽到的概率为110(1)B (2)AC [(1)根据随机数表的读数规则,依次从随机数表中读出的有效编号为:32,12,31,02,01,04,15,20,得到选出来的第8个个体的编号为20.故选B.(2)A选项,男生抽取100×600600+400=60,女生抽取100-60=40人,A选项正确.C选项,样本平均数为60100×170+40100×160=166,可以用样本平均数估计总体的平均数,C选项正确.B选项,样本方差为6010015+170-1662+4010030+160-1662=935+1325=45,所以B选项错误.D选项,男生甲被抽到的概率为50600=112,D选项错误.故选AC.] 类型2 统计图表及其应用1.常见的统计图表有:频率分布直方图、条形图、折线图、扇形图等等,不同的统计图表在表示数据上有不同的特点.2.掌握常见的统计图表,提升直观想象、数据分析和数学运算素养.【例2】 (1)(多选)(2022·江苏沭阳县修远中学期末)某中学举行安全知识竞赛,对全校参赛的1 000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )A.这组数据的极差为50 B.这组数据的众数为76C.这组数据的中位数为5407 D.这组数据的第75百分位数为85(2)(多选)(2022·山东济南市历城第二中学月考)某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:用该样本估计总体,以下说法正确的有( )A.57周岁以上参保人数最少 B.18~30周岁人群参保总费用最少C.C险种更受参保人青睐D.31周岁以上的人群约占参保人群80%(1)CD (2)ACD [(1)对于A:由频率分布直方图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;数据的众数为1270+80=75,故B错误;(0.005+0.02+0.035)×10=0.6>0.5,(0.005+0.02)×10=0.25<0.5,所以中位数位于70,80之间,设中位数为x,则(0.005+0.02)×10+x-70×0.035=0.5,解得x=5407,即这组数据的中位数为5407,故C正确;∵(0.005+0.02+0.035)×10=0.6,(0.005+0.02+0.035+0.03)×10=0.9,故估计第75分位数是80+0.75-0.60.3×10=85,故D正确.故选CD.(2)由扇形图可知,57周岁以上参保人数最少,故A正确;由折线图可知,18~30周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故B错误;由条形图可知,C险种参保比例最高,故C正确;由扇形图可知,31周岁以上的人群约占参保人群80%,故D正确.故选ACD.] 类型3 用样本的集中趋势、离散程度估计总体1.为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.2.掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学运算素养.【例3】 某工厂36名工人的年龄(单位:岁)数据如下:40,44,40,41,33,40,45,42,43,36,31,38,39,43,45,39,38,36,27,43,41,37,24,42,37,44,42,34,39,43,38,42,53,37,49,39.利用简单随机抽样抽取容量为9的样本,其年龄数据为44,40,36,43,36,37,44,43,37.(1)计算样本的平均数x和方差s2;(2)36名工人中年龄在x-s与x+s之间的有多少人?所占的百分比是多少?(精确到0.01%)[解] (1)由平均数公式知,x=19×(44+40+36+43+36+37+44+43+37)=40,由方差公式知,s2=19×[(44-40)2+(40-40)2+…+(37-40)2]=1009.(2)因为s2=1009,则s=103,所以36名工人中年龄在x-s和x+s之间的人数等于年龄在区间[37,43]内的人数,共23人.所以36名工人中年龄在x-s和x+s之间的人数所占的百分比为2336×100%≈63.89%.章末综合测评(四) 统计(时间:120分钟 满分:150分)一、选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.某工厂为了了解加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体 B.个体 C.样本 D.样本量C [总体是这一批零件的长度,个体是每个零件的长度,样本是抽取的200个零件的长度,样本量是200.]2.在实际生活中,有的问题适合普查,例如人口变化,有的问题适合抽样调查,例如产品质量.下列最适合抽样调查的是( )A.高一·一班数学作业完成情况B.了解一批牛奶的质量C.某汽车4S店想知晓新客户对服务的评价D.环保局调查管辖范围内湖泊的水质情况B [依据总体的特殊性,B项最适合抽样调查.]3.某地每十万人中拥有的各类受教育程度的人口情况,绘制了如图所示的扇形统计图,则( )A.每十万人中拥有高中(含中专)文化程度的人数最少B.每十万人中拥有大专及以上文化程度的人数少于2万C.每十万人中拥有小学文化程度的人数最多D.每十万人中拥有初中和高中(含中专)文化程度的人数占比不到50%B [对于A,每十万人中其他文化程度的人数最少,占比为10%,错误;对于B,每十万人中拥有大专及以上文化程度的人数为10×15%=1.5万,正确;对于C,每十万人中拥有初中文化程度的人数最多,占比为35%,错误;对于D,每十万人中拥有初中和高中(含中专)文化程度的人数占比为50%,错误.故选B.]4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为a,众数为b,平均值为c,则( )A.a=b=c B.a=b<c C.a<b<c D.b<a<cD [由统计图知众数b=5.将30名学生得分从小到大排列,第15个数是5,第16个数是6,所以中位数a=5+62=5.5.又平均值c=6+12+50+36+21+16+18+2030≈5.97.所以b<a<c.]5.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差B [讲座前中位数为70%+75%2>70%,所以A错误;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错误.故选B.]6.(2022·河北邯郸摸底考试)某高中2022年的高考考生人数是2021年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:下列结论正确的是( )A.该校2022年与2021年的本科达线人数比为6∶5B.该校2022年与2021年的专科达线人数比为6∶7C.2022年该校本科达线人数增加了80%D.2022年该校不上线的人数有所减少C [不妨设2021年的高考人数为100,则2022年的高考人数为150.2021年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为9∶5,本科达线人数增加了80%,故选项A错误,选项C正确;2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为9∶7,选项B错误; 2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项D错误.故选C.]7.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数录错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是( )A.70,75 B.70,50C.75,1.04 D.65,2.35B [因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2=148[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=148[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.]8.(2022·山东泰安期末)某校组织歌咏比赛,已知5位评委按百分制分别给出某参赛班级的评分(评分为整数),则下列选项中,可以判断出评分中一定出现100分的是( )A.平均数为97,中位数为95B.中位数为95,众数为98C.平均数为98,众数为98D.中位数为96,极差为8A [对于A,设这5个数为a,b,95,c,d,其中a≤b≤95≤c≤d≤100,则a+b≤190,a+b+95+c+d5=97,所以a+b+c+d=390,因为a+b≤190,所以c+d≥200,所以c=d=100,所以平均数为97,中位数为95时,评分中一定出现100分,故A符合;对于B,当这5个数分别为93,94,95,98,98时,则中位数为95,众数为98,没有出现100分,故B不一定;对于C,当这5个数分别为98,98,98,98,98时,则平均数为98,众数为98,没有出现100分,故C不一定;对于D,当这5个数分别为90,92,96,98,98时,则中位数为96,极差为8,没有出现100分,故D不一定.故选A.]二、选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求,全部选对的得5分,部分选对的得2分,有选错的得0分)9.(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同CD [设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x+c,m+c,σ,t,因为c≠0,所以C,D正确,故选CD.]10.(2022·重庆市两江育才中学月考)为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计正确的是( )A.众数为82.5 B.第80百分位数为91.7C.平均数为88 D.没有一半以上干部的成绩在80~90分之间AB [由图知:众数出现在[80,85)之间,故众数为82.5,故A正确;由图可得该次考试成绩在90分以下所占比例为5×(0.01+0.03+0.06+0.05)=0.75,在95分以下所占比例为5×(0.01+0.03+0.06+0.05+0.03)=0.9,因此,第80百分位数一定位于[90,95)内,所以第80百分位数为90+5×0.8-0.750.9-0.75≈91.7,故B正确;由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C错误;由(0.06+0.05)×5=0.55>0.5,有一半以上干部的成绩在80~90分之间,D错误.故选AB.]11.下列命题是真命题的是( )A.分层随机抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B.某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C.甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5BD [对于选项A:根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A错误;对于选项B:样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B正确;对于选项C:甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x=14×60+34×68=66,故选项C错误;对于选项D:将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D正确.]12.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x= 3小时,方差为s2= 2.003,其中高一学生、高二学生每天读书时间的平均数分别为x1=2.6,x2=3.2,又已知三个年级学生每天读书时间的方差分别为s1 2=1,s2 2=2,s3 2=3,则高三学生每天读书时间的平均数x3可能是( )A.3.2 B.3.3 C.2.7 D.4.5BC [由题意可得2.003=8002 000[1+(2.6-3)2]+6002 000[2+(3.2-3)2]+6002 000[3+(x3-3)2],解得x3=3.3或2.7.]三、填空题(本大题共4小题,每小题5分,共20分)13.下列数据的70%分位数为________.20,14,26,18,28,30,24,26,33,12,35,22.28 [把所给的数据按照从小到大的顺序排列可得:12,14,18,20,22,24,26,26,28,30,33,35,因为有12个数据,所以12×70%=8.4,不是整数,所以数据的70%分位数为第9个数28.]14.我国高铁发展迅速,技术先进.经统计在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.0.98 [x=10×0.97+20×0.98+10×0.9910+20+10=0.98,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.]15.(2022·江西贵溪一中月考)某口罩生产商为了检验产品质量,从总体编号为001,002,003,…,499,500的500盒口罩中,利用随机数表(以下摘取了随机数表中第12行至第13行)选取10个样本进行抽检,选取方法是从随机数表第12行第5列的数字开始由左向右读取,则选出的第4个样本的编号为________.16 00 11 66 14 90 84 45 11 65 73 88 05 90 52 27 41 14 86 22 9812 22 08 07 52 74 95 80 35 69 68 32 50 61 28 47 39 75 34 58 62222 [从随机数表第12行第5列的数字开始由左向右读取,依次可以得到:116,445,148,222,080,356,…,则选出的第4个样本的编号为222.]16.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.0.030 3 [∵5个矩形面积之和为1,即(0.005+0.010+0.020+a+0.035)×10=1,∴a=0.030.∵三组内学生数的频率分别为:0.3,0.2,0.1,∴三组内学生的人数分别为30,20,10.∴从身高在[140,150]内的学生选取的人数为18×1030+20+10=3.]四、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤)17.(本小题满分10分)(2022·黑龙江哈尔滨四中月考)从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查,结果如下:甲:5,5,6,6,8,8,8,10;乙:4,5,6,7,8,9,12,13;丙:3,3,4,7,9,10,11,12.(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出________(从“甲、乙、丙”三厂家中选择一个)厂家在广告中依据了统计数据中的哪个特征数?(2)计算甲厂家抽取的8件产品的方差.[解] (1)选择甲厂家,因为甲厂家抽取的8件产品的众数是8,所以甲厂家的广告依据了统计数据中的众数;选择乙厂家,因为乙厂家抽取的8件产品的平均数是8,所以乙厂家的广告依据了统计数据中的平均数;选择丙厂家,因为丙厂家抽取的8件产品的中位数是8,所以丙厂家的广告依据了统计数据中的中位数.(2)甲厂家抽取的8件产品的使用寿命为5,5,6,6,8,8,8,10,其平均数为x=18×(5+5+6+6+8+8+8+10)=7,方差为s2=18×(22+22+12+12+12+12+12+32)=2.75.18.(本小题满分12分)随机抽取某4S店分公司20位员工今年的销售业绩,统计如下所示(单位:辆):26 34 28 32 35 38 22 39 23 2528 30 24 38 33 33 22 34 21 27(1)若需要有10%的优秀员工,应将标准设定在多少?(2)若要给至少80%的员工年度考评评级为通过,应将标准设定在多少?[解] (1)将20个样本数据从小到大进行排序如下所示(单位:辆):21 22 22 23 24 25 26 27 28 2830 32 33 33 34 34 35 38 38 39由于20×90%=18是整数,所以临界值为有序样本中第18和19两个数的平均数,故为38.因此,可以规定如下:若需要有10%的优秀员工,应将标准设定在38辆.(2)由于20×20%=4是整数,所以临界值为有序样本中第4和5两个数的平均数,故为23.5.因此,可以规定如下:若要给至少80%的员工年度考评评级为通过,应将标准设定23辆,或22辆,或21辆.19.(本小题满分12分)某公司为了了解近期内的用水情况,抽取了10天的用水量,如下表所示:(1)在这10天中,该公司用水量的平均数是多少?(2)在这10天中,该公司每天用水量的中位数是多少?(3)你认为用平均数和中位数中的哪一个数来描述该公司每天的用水量更合适?[解] (1)x=110(22+38+40+2×41+2×44+50+2×95)=51(吨).(2)中位数为41+442=42.5(吨).(3)平均数受数据中的极端值(2个95)影响较大,使用平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.20.(本小题满分12分)随着老年人消费需求从“生存型”向“发展型”转变,消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在[60,80)的老年人的年收入按年龄[60,70),[70,80)分成两组进行分层抽样调查,已知抽取了年龄在[60,70)的老年人500人,年龄在[70,80)的老年人300人.现作出年龄在[60,70)的老年人年收入的频率分布直方图(如图所示).(1)根据频率分布直方图,估计该地年龄在[60,70)的老年人年收入的平均数及第95百分位数;(2)已知年龄在[60,70)的老年人年收入的方差为3,年龄在[70,80)的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在[60,80)的老年人年收入的方差.[解] (1)频率分布直方图中,该地年龄在[60,70)的老年人年收入的平均数约为:0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35,由频率分布直方图,年收入在8.5万元以下的老年人所占比例为1-0.04×1=0.96,年收入在7.5万元以下的老年人所占比例为1-(0.05×1+0.04×1)=0.91,因此,第95百分位数一定位于[7.5,8.5)内,由7.5+1×0.95-0.910.05=8.3,可以估计该地年龄在[60,70)的老年人年收入的第95百分位数为8.3.(2)设年龄在[60,70)的老年人样本的平均数记为x,方差记为sx2;年龄在[70,80)的老年人样本的平均数记为y,方差记为sy2;年龄在[60,80)的老年人样本的平均数记为z,方差记为s2.由(1)得x=5.35,由题意得,sx2=3,y=3.75,sy2=1.4,则z=500500+300×x+300500+300×y=4.75.由s2=1800×{500×[sx2+(x-z)2]+300×[sy2+(y-z)2]},可得s2=1800×{500×[3+(5.35-4.75)2]+300×[1.4+(3.75-4.75)2]}=3,即估计该地年龄在[60,80)的老年人的年收入方差为3.21.(本小题满分12分) 某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩(单位:分),整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图所示.(1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良生”的人数;(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明).[解] (1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),所以估计该校高一年级学生“体育良生”的人数为1 000×3040=750(人).(2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为x=140×(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).(3)因为甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,所以当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90.22.(本小题满分12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x==9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(1)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(2)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:0.008≈0.09.[解] (1)由于x =9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x-3s,x+3s)以外,因此需对当天的生产过程进行检查.(2)剔除离群值,即第13个数据,剩下数据的平均数为115(16× 9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.因为方差s2=,所以=16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008,所以这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.天数1112212用水量/吨22384041445095抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95
相关资料
更多