搜索
    上传资料 赚现金
    英语朗读宝
    知识讲解_用样本估计总体_提高练习题第1页
    知识讲解_用样本估计总体_提高练习题第2页
    知识讲解_用样本估计总体_提高练习题第3页
    还剩6页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    知识讲解_用样本估计总体_提高练习题

    展开

    这是一份知识讲解_用样本估计总体_提高练习题,共9页。
    用样本估计总体【学习目标】1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.5.会用样本的基本数字特征估计总体的基本数字特征.【要点梳理】要点一、频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值与最小值的差,即求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.要点二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.要点诠释:总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.要点三、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.要点诠释:茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.要点四、众数、中位数与平均数1.众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.2.中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.3.平均数样本数据的算术平均数,即.要点诠释:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.要点五、标准差与方差1.标准差样本数据的标准差的算法:(1)算出样本数据的平均数.(2)算出每个样本数据与样本数据平均数的差:(3)算出(2)的平方.(4)算出(3)n个平方数的平均数,即为样本方差.(5)算出(4)中平均数的算术平方根,,即为样本标准差.其计算公式为:2.方差从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:要点诠释:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.【典型例题】类型一:频率分布表、频率分布直方图1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为51日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为234641,第三组的频数为12,请解答下列问题:            1)本次活动共有多少件作品参加评比?    2)哪组上交的作品数最多?有多少件?    3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?    【答案】(160 2)四组  183)六组【解析】(1)依题意知第三组的频率为第三组的频数为12本次活动的参评作品数为件).    2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有(件).    3)第四组的获奖率是    第六组上交的作品数量为(件),    第六组的获奖率为    显然第六组的获奖率较高.【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.举一反三:    【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________             2.阅高考试卷有一个环节叫试批.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:分):    135  98   102  110  99  121   110  96   100  103    125  97   117  113  110  92   102  109  104  112    105  124  87   131  97  102   123  104  104  128    109  123  111  103  105  92   114  108  104  102    129  126  97   100  115  111  106  117  104  109    111  89   110  121  80   120  121  104  108  118    129  99   90   99   121  123  107  111  91   100    99   101  116  97   102  108  101  95   107  101    102  108  117  99   118  106  119  97   126  108    123  119  98   121  101  113  102  103  104  108    1)列出频率分布表;    2)画出频率分布直方图和折线图;    3)估计该省考生数学成绩在100120分之间的比例;    4)设该省有20万考生,估计该省考生数学成绩不及格的人数(满分150分,90分及以上视为及格);    5)根据折线图估计该省考生的数学成绩在哪一个分数段的人数将会最多.  【思路点拨】理解频率分布直方图的具体含义. 【解析】100个数据中,最大值为135,最小值为80,极差为13580=55    100个数据分成11组,这时组距    1)频率分布表如下:分组频数频率[808510.010.002[859020.020.004[909540.040.008[95100140.140.028[100105240.240.048[105110150.150.030[110115120.120.024[11512090.090.018[120125110.110.022[12513060.060.012[130135]20.020.004合计10010.2    注:表中加上一列,这是为画频率直方图准备的,因为它是频率直方图的纵坐标.    2)根据频率分布表中的有关信息画出频率分布直方图及折线图,见下图.            3)从频率分布表中可知,这100名考生的数学成绩在100120分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在100120分之间的比例为60%(0.60=60%).    4100名考生中,数学成绩不及格的频率为0.01+0.02=0.03.比例为3%.    200000×3=6 000(人).    估计该省考生数学成绩不及格的有6000人.    5)折线图的最高点位于100105之间,据此估计该省考生的数学成绩在100105分这个分数段的人数将会最多.   【总结升华】本例中,决定分点时,直接使用了最小值加组距,即80+5kk=1211),而没有把最小值减去某一个数(例如800.5=79.5)作为第1个分点,这是因为100个分数是明确的,即它们都在80135之间.凡事都要具体问题具体分析,不可教条化.本例是把5分看成一个分数段,统计各段的情况.举一反三:【变式12014秋 河南月考)某班的全体学生参加某项技能测试,成绩的频率分布直方图如图,数据的分组依次为:[2040),[4060),[6080),[80100],若不低于80分的人数是8,则该班的学生人数是(    A45    B50    C55    D60【答案】D【解析】根据频率分布直方图,得:不低于80分的频率是0.015×10=0.15该班人数是故选:D高清课堂:用样本估计总体 400450 1【变式2】对某电子元件进行寿命追踪调查,情况如下:寿命/h100200200300300400400500500600个数2030804030    1)列出频率分布表;    2)画出频率分布直方图;    3)估计该电子元件寿命在100400 h以内的占总体的比例;    4)估计该电子元件寿命在400 h以上的在总体中占的比例.【解析】1)样本频率分布表如下:寿命/h频数频率100200200.10200300300.15300400800.40400500400.20500600300.15合计2001  2)频率分布直方图如下图所示;          3)估计该电子元件寿命在100400 h以内占总体的比例为65%;  4)估计该电子元件寿命在400 h以上的在总体中占的比例为35%.类型二:众数、中位数、平均数3.据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资(元)5500500035003000250020001500    1)求该公司人员月工资的平均数、中位数、众数;(精确到元)    2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)    3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.【思路点拨】理解平均数、中位数、众数的概念.【答案】(12091  1500  1500 23288 3)中位数和众数【解析】(1)平均数是(元),中位数是1500元,众数是1500元.2)平均数是(元),中位数是1500元,众数是1500元.    3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.    【总结升华】(1)深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,结合实际情况,灵活运用.2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各数据的重心.举一反三: 【变式1为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【答案】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以   (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.类型三:方差、标准差4.在一次科技知识竞赛中,两组学生的成绩如下表:分数5060708090100人数甲组251013146乙组441621212    已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由. 【解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.    2[2(5080)2+5(6080)2+10(7080)2+13(8080)2+14(9080)2+6(10080)2]=(2×900+5×400+10×100+13×0+14×100+6×400)=172    (4×900+4×400+16100+2×0+12×100+12×400)=256甲组成绩较乙组成绩稳定,故甲组成绩好些.    3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.    4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好【总结升华】要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的满分人数;其次要在恰当地评估后,组织好正确的语言作出结论.举一反三:高清课堂:用样本估计总体 400450 2【变式1】甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10,它们的尺寸分别如下(单位:mm)甲机床:    10.2  10.1  10.0   9.8   9.9      10.3   9.7  10.0   9.9  10.1乙机床:    10.3  10.4   9.6   9.9  10.1      10.9   8.9   9.7  10.2  10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm从计算的结果来看哪台机床加工这种零件较合适?【解析】.=0.03=0.06.    用甲机床比乙机床稳定,即用甲机床加工较合适.类型四:茎叶图5.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:    甲:9581759186897165768894110107    乙:838693998810398114987978106101    画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据.【答案】乙同学的成绩比较稳定【解析】甲、乙两人数学成绩的茎叶图如图所示.            从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.举一反三:【变式12015年 广东江门一模)某班甲、乙两位同学升入高中以来的5次数学考试成绩的茎叶图如图,则乙同学这5次数学成绩的中位数是________,己知两位同学这5次成绩的平均数都是84,成绩比较稳定的是________(第二个空填).【答案】82,甲.【解析】根据茎叶图中的数据,乙的5次数学成绩按照大小顺序排列后,第3个数据是82中位数是82观察甲乙两位同学的5次数学成绩,甲的成绩分布在8190之间,集中在平均数84左右,相对集中些;乙的成绩分布在7991之间,也集中在平均数84左右,但相对分散些;甲的方差相对小些,成绩较稳定些.故答案为:82,甲.   高清课堂:用样本估计总体 400450 3【变式2】随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.   【答案】(1乙班(257【解析】(1)由茎叶图可知:甲班身高集中于之间,而乙班身高集中于之间.因此乙班平均身高高于甲班; (2)  甲班的样本方差为  

    相关试卷

    知识讲解_随机抽样_提高练习题:

    这是一份知识讲解_随机抽样_提高练习题,共10页。

    知识讲解_用样本估计总体_基础练习题:

    这是一份知识讲解_用样本估计总体_基础练习题,共7页。

    知识讲解_平面_提高练习题:

    这是一份知识讲解_平面_提高练习题,共8页。

    文档详情页底部广告位
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map