2019届二轮复习 统计与统计案例学案(全国通用)
展开
第3讲 统计与统计案例
[考情考向分析] 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.
热点一 抽样方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.
2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例1 (1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1 000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为( )
A.107 B.097 C.207 D.187
答案 D
解析 根据题意组距为=20,则抽取学生的编号组成以7为首项,20为公差的等差数列,其通项公式为an=7+20(n-1),∴a10=7+20=187.
(2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为________.
答案 43
解析 由题意可知,在高二年级中抽调的人数为128×=43.
思维升华 (1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练1 (1)(2018·福州检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按年龄段分层抽样 D.系统抽样
答案 C
解析 我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.了解某地区的“微信健步走”活动情况,按年龄段分层抽样,这种方式具有代表性,比较合理.
(2)(2018·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是( )
A.5,10,15,20,25
B.3,13,23,33,43
C.1,2,3,4,5
D.2,10,18,26,34
答案 B
解析 由系统抽样方法的概念可知,抽取5位,必须每层都有,则每10个里面有1个,所以符合要求的编号可能是3,13,23,33,43.
热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( )
A.-11 B.3 C.9 D.17
答案 C
解析 设没记清的数为x,若x≤2,则这列数为x,2,2,2,4,5,10,平均数为,中位数为2,众数为2,所以2×2=+2,得x=-11;若2x乙,乙比甲成绩稳定,应选乙参加比赛
B.x甲>x乙,甲比乙成绩稳定,应选甲参加比赛
C.x甲乙,m甲>m乙
C.甲>乙,m甲6.635,
所以有99%的把握认为两种生产方式的效率有差异.
B组 能力提高
11.某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是( )
A.这种抽样方法是分层抽样
B.这种抽样方法是系统抽样
C.这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差
D.该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数
答案 C
解析 根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A,B是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s=8,5名女职员的测试成绩的方差为s=6,所以C正确.故选C.
12.某青少年成长关爱机构为了调查所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是( )
A.据样本数据估计,该地区青少年身高与年龄成正相关
B.所抽取数据中,5 000名青少年平均身高约为145 cm
C.直线l的斜率的值近似等于样本中青少年平均身高每年的增量
D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上
答案 D
解析 在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均数大约是145 cm,故B正确;根据直线斜率的意义可知,斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误.
13.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为=0.85x-0.25.由以上信息,可得表中c的值为________.
天数x
3
4
5
6
7
繁殖数量y(千个)
2.5
3
4
4.5
c
答案 6
解析 ==5,==,代入线性回归方程,得=0.85×5-0.25,
解得c=6.
14.(2018·泉州质检)某工厂有两台不同机器A和B生产同一种产品各10万件,现从各自生产的产品中分别随机抽取20件,进行品质鉴定,鉴定成绩的茎叶图如下所示:
该产品的质量评定标准规定:鉴定成绩达到[90,100)的产品,质量等级为优秀;鉴定成绩达到 [80,90)的产品,质量等级为良好;鉴定成绩达到[60,80)的产品,质量等级为合格.将这组数据的频率视为整批产品的概率.
(1)从等级为优秀的样本中随机抽取两件,记X为来自B机器生产的产品数量,写出X的分布列,并求X的期望;
(2)完成下列2×2列联表,以产品等级是否达到良好以上(含良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为B机器生产的产品比A机器生产的产品好;
A机器生产的产品
B机器生产的产品
总计
良好以上(含良好)
合格
总计
(3)已知优秀等级产品的利润为12元/件,良好等级产品的利润为10元/件,合格等级产品的利润为5元/件,A机器每生产10万件的成本为20万元,B机器每生产10万件的成本为30万元.该工厂决定:按样本数据测算,两种机器分别生产10万件产品,若收益之差达到5万元以上,则淘汰收益低的机器,若收益之差不超过5万元,则仍然保留原来的两台机器.你认为该工厂会仍然保留原来的两台机器吗?
附:(1)独立性检验计算公式:
K2=,n=a+b+c+d.
(2)临界值表:
P(K2≥k0)
0.25
0.15
0.10
0.05
0.025
k0
1.323
2.072
2.706
3.841
5.024
解 (1)由茎叶图可知,样本中优秀的产品有2件来自A机器,3件来自B 机器,
所以X的可能取值为0,1,2,
P(X=0)==0.1,P(X=1)==0.6,
P(X=2)==0.3.
X的分布列为
X
0
1
2
P
0.1
0.6
0.3
所以E(X)=0×0.1+1×0.6+2×0.3=1.2.
(2)由已知可得,2×2列联表为
A机器生产的产品
B机器生产的产品
总计
良好以上(含良好)
6
12
18
合格
14
8
22
总计
20
20
40
K2=
==≈3.6365,
所以该工厂不会仍然保留原来的两台机器,应该会卖掉A机器,同时购买一台B机器.