高中数学高考专题11 统计-备战2019年高考数学(理)之纠错笔记系列(解析版)
展开
这是一份高中数学高考专题11 统计-备战2019年高考数学(理)之纠错笔记系列(解析版),共53页。
易错点1 不能正确区分总体、样本、样本容量
为了了解2016年参加市运动会的240名运动员的身高情况,从中抽取40名运动员进行测量.下列说法正确的是
A.总体是240名运动员
B.个体是每一名运动员
C.40名运动员的身高是一个个体
D.样本容量是40
【错解】选择A、B、C中的一个.
【错因分析】对于选项A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C,把个体和样本混淆致误.学科*网
【试题解析】选D.根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻.在这个问题中,总体是240名运动员的身高,个体是每名运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D.
【参考答案】D.
1.明确相关概念
对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区别,如本例选项C,是对概念把握不准.
2.注意考察对象
解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员.
1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是
A.1000名学生是总体 B.每名学生是个体
C.每名学生的成绩是所抽取的一个样本 D.样本的容量是100
【答案】D
【名师点睛】本题主要考查总体、个体与样本的概念,解决成立问题的关键是明确考查的对象,根据有关的概念可得总体、个体与样本的考查对象是相同的,此题属于基础题.
易错点2 对随机抽样的概念理解不透彻
对于下列抽样方法:
①运动员从8个跑道中随机抽取1个跑道;②从20个零件中一次性拿出3个来检验质量;③某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛;④为了保证食品安全,从某厂提供的一批月饼中,拿出一个检查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查.其中,属于简单随机抽样的是_______.(把正确的序号都填上)
【错解】②③④
【错因分析】对简单随机抽样的概念理解不透彻.
【试题解析】对于②,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定其中成绩优异的2名学生,不满足等可能抽样的要求;对于④,不满足不放回抽样的要求.故填①.
【参考答案】①
1.简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.
2.应用简单随机抽样应注意的问题:
(1)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;
二是号签是否易搅匀.
一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
(3)简单随机抽样需满足:
①被抽取的样本总体的个体数有限;
②逐个抽取;
③是不放回抽取;
④是等可能抽取.
2.某班50名学生中有30名男生,20名女生,用简单随机抽样抽取1名学生参加某项活动,则抽到女生的可能性为
A.40% B.50%
C.60% D.
【答案】A
简单随机抽样在抽样过程中每一个个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为n,总体的个体数为N,则用简单随机抽样时,每一个个体被抽到的可能性都是,体现了这种抽样方法的客观性和公平性.
易错点3 对系统抽样的特点理解不到位
从2003名学生中抽取一个容量为40的样本,应如何抽取?
【错解】将2003名学生按0001到2003编上号;将号码随机分成40份,每一份再用抽签法随机抽取一名学生,即得到了一个容量为40的样本.学科@网
【错因分析】由于2003不能被40整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解不到位.
【试题解析】先将2003名学生按0001到2003编上号,利用随机数表法从中剔除3名学生,再对剩余的2000名学生重新从0001到2000编号,按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006,依次在其他组抽取0056,0106,…,1956,这样就得到了一个容量为40的样本.
【参考答案】见试题解析
1.当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不是整数时,要先在总体中剔除部分个体.
2.系统抽样的操作步骤:
第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k=;
第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);
第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.
系统抽样是等距抽样,用系统抽样法抽取样本,当不为整数时,取,即先从总体中用简单随机抽样的方法剔除(N-nk)个个体,且剔除多余的个体不影响抽样的公平性.
3.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2000人中抽取100人做问卷调查,为此将他们随机编号1,2, ,2000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间的人做问卷,编号落入区间的人做问卷,其余的人做问卷,则抽到的人中,做问卷的人数为
A. B.
C. D.
【答案】B
【名师点睛】本题主要考查系统抽样的方法,属于简单题. 系统抽样适合抽取样本较多且个体之间没有明显差异的总体,系统抽样最主要的特征是,所抽取的样本相邻编号等距离,可以利用等差数列的性质解答.
易错点4 对个体的入样可能性与抽样间隔理解不透
中央电视台动画城节目为了对本周的热心观众给予奖励,要从2014名小观众中抽取50名幸运小观众.先用简单随机抽样从2014人中剔除14人,剩下的2000人再按系统抽样方法抽取50人,则在2014人中,每个人被抽取的可能性
A.均不相等 B.不全相等
C.都相等,且为 D.都相等,且为
【错解】选A或D.
【错因分析】对于选项A,误认为剔除14人,被抽取到的机会就不相等了,错选A;
对于选项D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选D.
【试题解析】选C.因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先剔除14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等.所以,每个个体被抽到的机会都相等,均为=.学科*网
【参考答案】C.
1.明确系统抽样的操作要领
系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部分中抽取一个个体,得到所需样本.系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中2000人要分为50段.
2.对系统抽样合理分段
在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等.如本题中剔除14人后,每个人被抽取的可能性不变.
4.为了了解参加某次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么从总体中应随机剔除的个体数目为
A.2 B.3
C.4 D.5
【答案】A
【名师点睛】本题考查系统抽样,系统抽样的步骤,得到总数不能被容量整除时,应从总体中随机剔除个体,保证整除是解题的关键.学科!网
在系统抽样中,总体的每个个体被剔除的机会是均等的,也就是每个个体不被剔除的机会也是均等的,由此可知在整个抽样过程中每个个体被抽到的机会仍然相等. 若计算为:每名志愿者被抽到的可能性为,则是错误的.
易错点5 忽略分层抽样的特点
某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是
A.简单随机抽样 B.系统抽样
C.直接运用分层抽样 D.先从老年人中剔除1人,再用分层抽样
【错解】因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为36,由于按抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为.若从老年人中随机地剔除1人,则老年人应抽取27×=6(人),中年人应抽取54×=12(人),青年人应抽取81×=18(人),从而组成容量为36的样本.故选D.
【错因分析】如果用简单随机抽样先从老年人中剔除1人的话,老年人被抽到的概率显然比其他人群小了,这不符合随机抽样的特征——每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除1人”,这和以前做的从总体中随机剔除1人是不一样的.
【试题解析】直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为×28≈6,×54≈12,×81≈18,故选C.
【方法点睛】分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是整数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质.
【参考答案】C.
1.分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
2.与分层抽样有关问题的常见类型及解题策略:
(1)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.
(2)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.
进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
5.某学校老师中,型血有36人、型血有24人、型血有12人,现需要从这些老师中抽取一个容量为的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量减少一个,则在采用系统抽样时,需要在总体中剔除2个个体,则样本容量可能为
A. B.
C. D.
【答案】C
在分层抽样中,确定抽样比k是抽样的关键.一般地,抽样比k=(N为总体容量,n为样本容量),再按抽样比k
在各层中抽取个体,就能确保抽样的公平性.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.
易错点6 误将频率分布直方图的纵坐标当作频率
中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
【错解】由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5×.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×=25000(人).
【错因分析】表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解答出错.学科*网
【试题解析】由图可知,第五小组的频率为0.5×0.3=0.15,
所以第一小组的频率为0.15×=0.125.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7500(人).
【参考答案】7500.
在数据的频率分布直方图中,纵坐标表示的是频率与组距的比, 每个小长方形的面积=组距×=频率,将频率与组距的比错认成频率是初学者经常犯的错误之一,解题过程中要引起足够的重视.
1.画频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
(1)落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
(2)频率分布直方图与众数、中位数与平均数的关系
①最高的小长方形中的某个(些)点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
绘制频率分布直方图的注意事项:
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.学科!网
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
6.我国是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过的部分按平价收费,超过的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)已知平价收费标准为元/吨,议价收费标准为元/吨,当时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替)
【答案】(1);(2)8.42.
(2)设居民月用水量为吨,相应的水费为元,
则即,
由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
9
分组
频率
0.04
0.08
0.15
0.20
0.26
0.15
0.06
0.04
0.02
根据题意,该市居民的月平均水费估计为
.
【名师点睛】本题考查的知识点是频率分布直方图,用样本估计总体,考查计算能力,难度不大,属于中档题.有关频率分布直方图的考查常见的有:众数,中位数,平均数的计算等,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与总体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
易错点7 对茎叶图的画法规则认识不够
某市对上下班情况作了抽样调查,上下班时间各抽测了12辆机动车的车速如下(单位:km/h):
上班时间:30,33,18,27,32,40,26,28,21,28,35,20;
下班时间:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示以上数据.
【错解】机动车行驶速度的茎叶图如图所示.
【错因分析】茎叶图对于重复出现的数据要重复记录.
【试题解析】机动车行驶速度的茎叶图如图.
【方法点睛】画茎叶图需要注意,将每个数据分为茎和叶两部分,将表示茎的数字按照大小顺序由上到下排列,在写每行叶子的时候,重复出现的数字应该按原次数写入叶子部位,不能只按一次写入.学科*网
【参考答案】见试题解析.
1.茎叶图将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
2.绘制茎叶图的关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
3.应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较.
4.茎叶图只适用于样本数据较少的情况.
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
7.某大学为调查来自南方和北方的同龄大学生的身高差异,从2016级的年龄在18~19岁之间的大学生中随机抽取了来自南方和北方的大学生各10名,测量他们的身高,量出的身高如下(单位:cm):
南方:158,170,166,169,180,175,171,176,162,163.
北方:183,173,169,163,179,171,157,175,184,166.
(1)根据抽测结果,画出茎叶图,对来自南方和北方的大学生的身高作比较,写出统计结论.
(2)设抽测的10名南方大学生的平均身高为x cm,将10名南方大学生的身高依次输入如图所示的程序框图进行运算,问输出的s大小为多少?并说明s的统计学意义.
(3)为进一步调查身高与生活习惯的关系,现从来自南方的这10名大学生中随机抽取2名身高不低于170 cm的学生,求身高为176 cm的学生被抽中的概率.
【答案】(1)答案见解析;(2)答案见解析;(3).
【解析】(1)茎叶图如图所示.统计结论(给出下述四个结论供参考):①北方大学生的平均身高大于南方大学生的平均身高;②南方大学生的身高比北方大学生的身高更整齐;③南方大学生的身高的中位数为169.5 cm,北方大学生的身高的中位数是172 cm; ④南方大学生的身高基本上是对称的,而且大多数集中在均值附近,北方大学生的身高分布较为分散.
【名师点睛】这个题目考查了概率统计中的茎叶图的应用,以及如何根据条件进行评价;一般情况下高考易在这道题目中出现新颖的背景及应用,面对这一特点,要静下心来认真读题,将题目中的问题,转化为我们熟知的知识,应用数学工具来解决.学科@网
易错点8 忽略方差的统计意义
甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t /km2):
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
若某村要从中引进一种冬小麦大量种植,给出你的建议.
【错解】由题意得(9.8+9.9+10.1+10+10.2)=10,
(9.4+10.3+10.8+9.7+9.8)=10,
甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦的任意一种都可以.
【错因分析】上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论.
【试题解析】由题意得(9.8+9.9+10.1+10+10.2)=10,
(9.4+10.3+10.8+9.7+9.8)=10,
×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
甲、乙两种冬小麦的平均产量都等于10,且,
所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.
【方法点睛】平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如“谁发挥更好、谁更稳定、谁更优秀”之类的题目,除比较数据的平均值外,还应该比较方差或标准差的大小,以作出更为公正、合理的判断.
【参考答案】推荐引进甲种冬小麦大量种植.
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述.
2.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.
3.数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感.一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
8.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
【答案】甲种水稻的产量比较稳定
【解析】甲品种的样本平均数为10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.244.
因为0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
易错点9 运用数字特征作评价时考虑不周
一次数学知识竞赛中,两组学生成绩如下:
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.
【错解】由于乙组90分以上的人数比甲组90分以上的人数多,所以乙组更优秀.
【错因分析】对一组数据进行分析的时候,应从平均数、众数、中位数、方差、极差等多个角度进行判断.
【试题解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.
(2)×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172.
同理=256.
因为,所以甲组的成绩比乙组的成绩稳定.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.学科/网
(4)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.
【参考答案】见解析.
1.平均数受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.
2.运用数字特征进行评价时,要全面考虑各数字特征的优缺点,从不同层面或两两综合进行评价,才能得到较为可靠的估计.
9.全国大学生机器人大赛是由共青团中央,全国学联,深圳市人民政府联合主办的赛事,是中国最具影响力的机器人项目,是全球独创的机器人竞技平台.全国大学生机器人大赛比拼的是参赛选手们的能力,坚持和态度,展现的是个人实力以及整个团队的力量.2015赛季共吸引全国240余支机器人战队踊跃报名,这些参赛战队来自全国六大赛区,150余所高等院校,其中不乏北京大学,清华大学,上海交大,中国科大,西安交大等众多国内顶尖高校,经过严格筛选,最终由111支机器人战队参与到2015年全国大学生机器人大赛的激烈角逐之中,某大学共有“机器人”兴趣团队1000个,大一、大二、大三、大四分别有100,200,300,400个,为挑选优秀团队,现用分层抽样的方法,从以上团队中抽取20个团队.
(1)应从大三抽取多少个团队?
(2)将20个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的分数如下:
甲:125,141,140,137,122,114,119,139,121,142
乙:127,116,144,127,144,116,140,140,116,140
从甲、乙两组中选一组强化训练,备战机器人大赛.从统计学数据看,若选择甲组,理由是什么?若选择乙组,理由是什么?
【答案】(1)6个团队;(2)见解析.
(2)甲组数据的平均数,乙组数据的平均数,
甲组数据的方差,乙组数据的方差,
选甲队理由:甲、乙两队平均数相差不大,且,甲组成绩波动小.
选乙队理由:,且乙队中不低于140分的团队多,在竞技比赛中,高分团队获胜的概率大.
本题考查分层抽样的方法,平均数、方差的计算方法以及应用,考查用样本的数据特征估计总体的数据特征的方法,考查运算求解能力和数据处理能力,考查运用基本知识分析解决实际问题的能力.学科!网
平均数:能较好地反映一组数据的总体平均水平,但易受少数极端值的影响;
方差:反映数据的波动程度,方差值越大,数据的波动越大.
易错点10 弄错回归方程中,的位置
某班5名学生的数学和物理成绩如下表:
(1)画出散点图.
(2)求物理成绩y对数学成绩x的线性回归方程.
【错解】(1)散点图如图所示:
(2)计算得,,
,
,
所以,.
所以y对x的线性回归方程是.学科*网
【错因分析】错解中回归方程记忆错误,应为.
【试题解析】(1)散点图如图所示:
【参考答案】.
由回归直线方程得到的预报值不是预报变量的精确值,事实上,它是预报变量的可能取值的平均值.
1.求回归直线方程的一般步骤:
(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系.
(2)当两变量具有线性相关关系时,求回归系数,写出回归直线方程.
(3)根据方程进行估计.
2.不要受前面学习的直线方程的影响,而将回归方程写为,实际上,回归方程应为.
10.是指空气中直径小于或等于微米的颗粒物(也称可入肺颗粒物).为了探究车流量与的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与的数据如下表:
时间
周一
周二
周三
周四
周五
车流量(万辆)
的浓度(微克/立方米)
(1)根据上表数据,请在所给的坐标系中画出散点图;
(2)根据上表数据,用最小二乘法求出关于的线性回归方程;
(3)若周六同一时间段的车流量是万辆,试根据(Ⅱ)求出的线性回归方程,预测此时的浓度为多少(保留整数)?
参考公式:由最小二乘法所得回归直线的方程是:,
,.
其中,称为样本点的中心.
【答案】(1)见解析;(2) ;(3)37.
【解析】(1)散点图如下图所示.
(3)当时,,
所以可以预测此时的浓度约为.
回归系数的含义是:
(1)代表x每增加一个单位,y的平均增加单位数,而不是增加单位数.
(2)当>0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加个单位数;
当0时,表明两个变量正相关;当r
相关试卷
这是一份高中数学高考专题13 概率-备战2019年高考数学(理)之纠错笔记系列(解析版),共27页。试卷主要包含了事件关系的判断方法,求互斥事件概率的两种方法等内容,欢迎下载使用。
这是一份高中数学高考专题12 计数原理-备战2019年高考数学(理)之纠错笔记系列(解析版),共25页。
这是一份高中数学高考专题11 统计-备战2019年高考数学(文)之纠错笔记系列(原卷版),共47页。