


抽样调查与样本估计总体专题训练
展开
这是一份抽样调查与样本估计总体专题训练,共26页。
解:方法一(抽签法)
①编号,将这60名学生编号为1,2,…,60;
②制签,将这60个号码分别写在60张大小、形状相同的纸片上;
③搅拌,将这60张纸片放到一个不透明的盒子里搅拌均匀;
④抽签入样,抽出一张记下上面的号码(不放回),然后再搅拌均匀,接着抽取第2张,记下号码.重复这个过程直到取到10个号码为止.
这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
方法二(随机数表法)
①将60名学生编号,可以编为00,01,02,…,59;
②选定随机数表中的起始数,任选一方向作为读数方向,如指定从随机数表中的第2行第2个数7开始;
③从选定的起始数7开始向右每次读取两位,凡不在00~59中的数或已读过的数,都跳过不作记录,直至取得10个不同号码.
于是得到抽取的样本号码是42,46,24,28,11,45,04,25,33,23,这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
点拨 考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行.注意掌握随机数表的使用方法.应用随机数表法的三个关键点:一是确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;二是读数时注意结合编号特点进行读取,若编号为两位数字,则两位两位地读取,若编号是三位数字,则三位三位地读取;三是注意筛选,超出编号范围的不取,重复的不取.
(2)某企业共有5个分布在不同区域的工厂,职工3万人,其中职工比例为3∶2∶5∶2∶3.现从3万人中抽取一个300人的样本,分析员工的生产效率.已知生产效率与不同的地理位置的生活习俗及文化传统有关,问应采取什么样的方法?并写出具体过程.
解:应采取分层抽样的方法.过程如下:
①将3万人分为五层,其中一个工厂为一层.
②按照样本容量的比例随机抽取各工厂应抽取的样本:
300×eq \f(3,15)=60(人);300×eq \f(2,15)=40(人);
300×eq \f(5,15)=100(人);300×eq \f(2,15)=40(人);
300×eq \f(3,15)=60(人).
因此各工厂应抽取的人数分别为60人,40人,100人,40人,60人.
③将300人组到一起即得到一个样本.
点拨 分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样.解决分层抽样的关键:先确定抽样比,然后把各层个体数乘抽样比,即得各层要抽样的个体数,常用公式:①抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本容量,各层总量);②层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
变式1 (1)某颁奖典礼准备邀请20名艺人参与演出,其中从30名舞蹈艺人中随机挑选10人,从18名歌唱艺人中随机挑选6人,从10名相声艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
解:第一步,先确定艺人:①将30名舞蹈艺人从01~30编号,然后用相同的纸条做成30个号签,分别写上这些编号,再放入一个不透明小盒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出.②运用相同的办法分别从10名相声艺人中抽取4人,从18名歌唱艺人中抽取6人.
第二步,确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1~20这20个数字,代表演出的顺序,放在暗盒中搅匀后让每个艺人抽一张,每人抽到的号签上的数字就是这位艺人的演出顺序,再汇总即可.
(2)(2018·南宁市第二中学高三6月考试)如图,某学校共有教师120人,现用分层抽样的方法从中选出一个30人的样本,则其中被选出的青年女教师的人数为 ( )
A.12 B.6 C.4 D.3
解:青年教师的人数为120×30%=36人,所以青年女教师为12人,故青年女教师被选出的人数为12×eq \f(30,120)=3.故选D.
(3)(四川2018届高三春季诊断)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有________人.
解:设北乡有x人,则eq \f(108,x)=eq \f(300-108,7 488+6 912),解得x=8 100.Z故填8 100.
考点二 数字特征及其应用
例2 (1)某科研所共有职工20人,其年龄统计表如下:
由于电脑故障,有两个数字在表格中不能显示出来,则下列说法正确的是 ( )
A.年龄数据的中位数是40,众数是38
B.年龄数据的中位数和众数一定相等
C.年龄数据的平均数∈(39,40)
D.年龄数据的平均数一定大于中位数
解:根据表中数据,得eq \f(1,20)(5×38+10×39+3×41+2×42)<<eq \f(1,20)(5×38+10×40+3×41+2×42),解得39.35<<39.85,所以∈(39,40).故选C.
(2)(2019·葫芦岛期末)若样本x1+1,x2+1,…,xn+1的平均数为10,其方差为2,则对于样本2x1+2,2x2+2,…,2xn+2,下列结论正确的是( )
A.平均数为20,方差为8
B.平均数为20,方差为10
C.平均数为21,方差为8
D.平均数为21,方差为10
解:若样本x1+1,x2+1,…,xn+1的平均数为10,其方差为2,则对于样本2x1+2,2x2+2,…,2xn+2,
其平均数为2×10=20,方差为22×2=8.
故选A.
点拨 若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
变式2 (1)某校高一年级开设了丰富多彩的校本课程,现从甲、乙两个班随机抽取了5名学生校本课程的学分,统计如表:
用seq \\al(2,1),seq \\al(2,2)分别表示甲、乙两班抽取的5名学生学分的方差,计算seq \\al(2,1)= ,成绩更稳定的班级是 班.
解:甲班学生学分的平均数1=eq \f(1,5)(8+11+14+15+22)=14,
所以甲班学生学分的方差seq \\al(2,1)=eq \f(1,5)[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22;
乙班学生学分的平均数2=eq \f(1,5)(6+7+10+23+24)=14,
所以乙班学生学分的方差seq \\al(2,2)=eq \f(1,5)[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62.
所以seq \\al(2,2)=62,由seq \\al(2,1)<seq \\al(2,2)可判断成绩更稳定的班级是甲班.
故填22;甲.
(2)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数的平均数为,方差为s2,则 ( )
A. =5,s2>3 B. =5,s2<3
C. >5,s2<3 D. >5,s2>3
解:=5,s2=eq \f(1,9)(8×3+02)<3.故选B.
类型三 频率分布表、频率分布直方图及其应用
例3 (1)(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(Ⅰ)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(Ⅱ)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(Ⅲ)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
解:(Ⅰ)
(Ⅱ)根据以上数据,该家庭使用水龙头后50天日用水量小于0.35 m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.
(Ⅲ)该家庭未使用节水龙头50天日用水量的平均数为
1=eq \f(1,50)(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
2=eq \f(1,50)(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
(2)(eq \a\vs4\al(重庆八中2019届高三5月月考))某种产品的质量按照其质量指标值M进行等级划分,具体如下表.
现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.
(Ⅰ)记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率;
(Ⅱ)已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;
(Ⅲ)根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值(精确到0.01).
解:(Ⅰ)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,
且由频率分布直方图估计P(B)=0.2+0.3+0.15=0.65,P(C)=0.1+0.09=0.19,
又P(A)=P(B+C)=P(B)+P(C)=0.84,
所以事件A的概率估计为0.84.
另解:先由频率分布直方图估计P()=0.06+0.1=0.16,故P(A)=1-P()=0.84.
(Ⅱ)由(Ⅰ)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,
故任取一件产品是三等品的概率估计值为0.16.
从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件,
故利润估计为1900×10+6500×6+1600×2=61200元.
(Ⅲ)因为在产品质量指标值M的频率分布直方图中,
质量指标值M
