专题26 统计 常考点归纳与变式演练 作业 高中数学 一轮复习 人教版(2021年)
展开
这是一份专题26 统计 常考点归纳与变式演练 作业 高中数学 一轮复习 人教版(2021年),共43页。
专题26 统计
目录
常考点01 抽样方法 1
常考点02 样本估计总体 4
常考点03 样本的数字特征数的应用 9
常考点04 统计数据与图表在实际问题中的应用 14
常考点05 线性回归方程与回归分析 19
常考点06 独立性检验 25
易错点01 利用随机数表确定样本忘记去掉重复数字 30
易错点02 求解独立性检验问题对的值理解不准确 30
专项训练 (全卷共22题) 32
专项训练:按新高考真题的试题量和难度标准编写
常考点01 抽样方法
【典例1】(2021.山东高三专项训练)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0 B.1 C.2 D.3
【答案】A
【解析】①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.
【典例2】(1)(2021·陕西西北工业大学附属中学)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第4个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07 C.02 D.01
(2).(2021·北京房山区·高三开学考试)某中学高一、高二和高三各年级人数见表,采用分层抽样的方法调查学生的视力状况,在抽取的样本中,高二年级有20人,那么该样本中高三年级的人数为( )
年级
人数
高一
550
高二
500
高三
m
合计
1500
A.16 B.18 C.22 D.40
【答案】(1)B(2)B
【解析】(1)从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,数字依次为:65,72,08,02,63,14,07,02,…,而符合条件的数字有08,02,14,07,02,…,故第4个个体编号为07.故选:B
(2)由题意得高三学生人数为,
因为在抽取的样本中,高二年级有20人,所以样本容量满足,得所以样本中高三年级的人数为,故选:B
【技巧点拨】
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2. 分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
3. 两种抽样方法的特点、联系及适用范围
类别
共同点
各自特点
联系
适用范围
简单随机抽样
①抽样过程中每个个体被抽到的可能性相等;
②每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样
总体由差异明显的几部分组成
【变式演练1】(2021·广东惠州·高三)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )
A.10 B.09 C.71 D.20
【答案】B
【解析】从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B
【变式演练2】(2021·陕西高三)某乡政府对甲、乙、丙三个村的扶贫对象进行抽样调查,其中甲村30人,乙村25人,丙村40人,用分层抽样的方法抽取19人,则从甲、丙两村共抽取的人数为( )
A.8 B.11 C.13 D.14
【答案】D
【解析】设甲、丙两村抽取的人数分别为、.
依题意得,解得,,所以.故选:D.
【变式演练3】(2019·全国高考真题)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生 B.200号学生 C.616号学生 D.815号学生
【答案】C
【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.
【详解】由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,
所以第一组抽到6号,且每组抽到的学生号构成等差数列,公差,
所以,
若,则,不合题意;若,则,不合题意;
若,则,符合题意;若,则,不合题意.故选C.
【点睛】本题主要考查系统抽样.
常考点02 样本估计总体
【典例1】(1)(2021·全国高三开学考试)在五场篮球比赛中,甲、乙两名运动员得分的茎叶图如图所示.下列说法正确的是( )
A.甲得分的中位数和极差都比乙大 B.甲得分的中位数比乙小,但极差比乙大
C.甲得分的中位数和极差都比乙小 D.甲得分的中位数比乙大,但极差比乙小
(2)(2021·贵州贵阳)2021年4月8日,教育部办公厅“关于进一步加强中小学生体质健康管理工作的通知”中指出,各地要加强对学生体质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班团队活动、家校协同联动等多种形式加强教育引导,让家长和中小学生科学认识体质健康的影响因素.了解运动在增强体质、促进健康、预防肥胖与近视、锤炼意志、健全人格等方面的重要作用,提高学生体育与健康素养.增强体质健康管理的意识和能力.某高中学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100 名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示.根据此图,下列说法中错误的是( )
A.样本的众数约为 B.样本的中位数约为 C.样本的平均值约为66 D.为确保学生体质健康,学校将对体重超过的学生进行健康监测,该校男生中需要监测的学生频数约为200人
【答案】(1)B(2)C
【解析】(1)甲得分依次为、、、、,中位数是,极差为,
乙得分依次为、、、、,中位数是,极差为,
则甲得分的中位数比乙小,极差比乙大,故选:B.
(2)对于A,样本的众数为,A对;
对于B,设样本的中位数为,,解得,B对;
对于C,由直方图估计样本平均值为
,C错误;对于D,2000名男生中体重大于的人数大约为,D对.故选:C.
【典例2】(2019·全国高考真题)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】(1) ,;(2) ,.
【解析】 (1)由题得,解得,
由,解得.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
乙离子残留百分比的平均值为
【技巧点拨】
(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2)×组距=频率;
(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数
【变式演练1】(2020·海南高三期中)为了评估某家快递公司的服务质量,某评估小组进行了客户满意度调查,从该公司参与调查的客户中随机抽取500名客户的评分,评分均在区间上,分组为,,,,,其频率分布直方图如图所示.规定评分在60分以下表示对该公司的服务质量不满意,则这500名客户中对该公司的服务质量不满意的客户的人数为( )
A.15 B.16 C.17 D.18
【答案】A
【解析】由频率分布直方图可知,评分在区间上的频率为,
所以评分在区间上的客户有(人),
即对该公司的服务质量不满意的客户有15人.故选:A
【变式演练2】(2021北京高三模拟)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数学.科网不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【答案】(Ⅰ)0.4;(Ⅱ)5人;(Ⅲ).
【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为. 所以总体中分数在区间内的人数估计为.
【变式演练3】(2021·重庆市江津中学校高三月考)某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量(小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).
(1)求月光照量(小时)的平均数和中位数;(取各组数据的中点值)
(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量,,的区间内各抽取多少个月份?
(3)假设每年中最热的5,6,7,8,9,10月的月光照量是大于等于240小时,且6,7,8月的月光照量是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量(小时)都不低于320的概率.
【答案】(1)平均数为260(小时),中位数为240(小时);(2)月份数分别为2、1、1;(3).
【解析】(1)根据各频率之和为1,则,解得.
月光照量(小时)的平均数为所以(小时)
设月光照量(小时)的中位数为,则.根据中位数的定义,其左右两边的频率相等,都为0.5,可得,解得.
所以月光照量(小时)的中位数为240(小时).
(2)因为月光照量、、的频率之比为,所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,
那么,抽取的月光照量,,的月份数分别为,,.
(3)由题意,月光照量的有5,9,10月,月光照量的有6,7,8月,
故从该村庄2018年的5,6,7,8,9,10月份,之中随机抽取2个月份的月光照量(小时)
进行调查,所有的情况有:,,,,;,,,;,,;,;共15种;
其中,抽取到的2个月份的月光照量(小时)都不低于320的情况有:,;共3种;
故所抽取到的2个月份的月光照量(小时)都不低于320的概率.
常考点03 样本的数字特征数的应用
【典例1】(1)(2021·广东高三开学考试)四名同学各掷骰子五次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( ).
A.平均数为3,中位数为2 B.中位数为3,众数为2
C.平均数为2,方差为2.4 D.中位数为3,方差为2.8
(2).(2021·全国高三(理))在某次射击比赛中,甲、乙两人各射击5次,射中的环数如图,则下列说法正确的是( )
A., B.,
C., D.,
(3)(2021·辽宁高三开学考试)一样本的频率分布直方图如图所示,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15 C.16 D.17
【答案】(1)C(2)C(3)A
【解析】(1)对于A,当投掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故A错误;对于B,当投掷骰子出现结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点数6,故B错误;对于C,若平均数为2,且出现6点,则方差S2>(6﹣2)2=3.2>2.4,
∴平均数为2,方差为2.4时,一定没有出现点数6,故C正确;
对于D,当投掷骰子出现结果为1,2,3,3,6时,满足中位数为3,平均数为:=(1+2+3+3+6)=3
方差为S2=[(1﹣3)2+(2﹣3)2+(3﹣3)2+(3﹣3)2+(6﹣3)2]=2.8,可以出现点数6,故D错误.
故选:C.
(2)由图可知,甲射击5次所得环数分别为:9,8,10,9,10;
乙射击5次所得环数分别为:6,9, 9,8,10;
故,,
,,故选:C.
(3)由题图知,数据落在区间[5,10)上的频率为0.04×(10-5)=0.20,数据落在区间[10,15)上的频率为0.10×5=0.50,所以第60百分位数是10+5×=14.故选:A
【典例2】(2019·全国高考真题(理))演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数 C.方差 D.极差
【答案】A
【解析】设9位评委评分按从小到大排列为.
则①原始中位数为,去掉最低分,最高分,后剩余,中位数仍为,A正确.
②原始平均数,后来平均数
平均数受极端值影响较大,与不一定相同,B不正确
③由②易知,C不正确.④原极差,后来极差可能相等可能变小,D不正确.
【技巧点拨】
1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
【变式演练1】(2021·四川宜宾·高三)某学校调查了高三名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为、、、、.根据直方图,以下结论不正确的是( )
A.估计这名学生每周的自习时间的众数是
B.估计这名学生每周的自习时间的中位数是
C.估计这名学生每周的自习时间小于小时的人数是
D.估计这名学生每周的自习时间不小于小时的人数是
【答案】A
【解析】对于A,在频率直方图中,众数即为频率分布直方图中最高矩形的底边中点的横坐标,
故估计这名学生每周的自习时间的众数是,故选项A错误;
对于B,在频率直方图中,中位数即为把频率分布直方图分成两个面积相等部分的平行于轴的直线横坐标,
设中位数为,则有,解得,
所以估计这名学生每周的自习时间的中位数是,故选项B正确;
对于C,每周的自习时间小于小时的频率为,
所以估计这名学生每周的自习时间小于小时的人数是,故选项C正确;
对于D,每周的自习时间不小于小时的频率为,
所以估计这名学生每周的自习时间不小于小时的人数是,故选项D正确.故选:A.
【变式演练2】(2021·广东高三月考)某高中有学生人,其中男生人,女生人,希望获得全体学生的身高信息,按照分层抽样的原则抽取了容量为的样本.经计算得到男生身高样本均值为,方差为;女生身高样本均值为,方差为.下列说法中正确的是( )
A.男生样本量为 B.每个女生入样的概率均为
C.所有样本的均值为 D.所有样本的方差为
【答案】AC
【解析】对于A:抽样比为,所以样本中男生有人,故选项A正确;
对于B:每个女生入样的概率等于抽样比,故选项B不正确;对于C:由分层抽样知,样本中男生有人,男生有人,所有的样本均值为:,故选项C正确;
对于D:设男生分别为,,,,平均数,,女生分别为,,,,平均数,,总体的平均数为,方差为,
因为,
而,
所以,
同理可得,
所以,故选项D不正确;故选:AC
【变式演练3】(2019年高考全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:.
【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为.产值负增长的企业频率为.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2),
,,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
常考点04 统计数据与图表在实际问题中的应用
【典例1】(2020·新高考全国2卷真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
【答案】CD
【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确.
【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;
由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;
由图可知,第3天至第11天复工复产指数均超过80%,故C正确;
由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;
【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.
【典例2】(2021·全国高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A. 该地农户家庭年收入低于4.5万元的农户比率估计为6%
B. 该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C. 估计该地农户家庭年收入的平均值不超过6.5万元
D. 估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.故选:C.
【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于.
【技巧点拨】条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
同时也需要主要一些新定义的统计图表。
【变式演练1】(2018·全国高考真题(文))某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A
【分析】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.
【详解】设新农村建设前的收入为M,而新农村建设后的收入为2M,
则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.
点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.
【变式演练2】(2017·全国高考真题)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【答案】A
【分析】观察折线图可知月接待游客量每年7,8月份明显高于12月份,且折线图呈现增长趋势,高峰都出现在7、8月份,1月至6月的月接待游客量相对于7月至12月波动性更小.
【详解】对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,D,由图可知显然正确.故选A.
【点睛】本题考查折线图,考查考生的识图能力,属于基础题.
【变式演练3】(2021·八校联考)如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解正确的是( )
A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件
B.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
【答案】ABC
【解析】对于A,2019年1~4月份快递业务量3月份最高,有4 397万件,2月份最低,有2 411万件,其差值接近2 000万件,所以A正确;对于B,2019年1~4月份快递业务量的同比增长率分别为55%,53%,62%,58%,均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关,所以B正确;对于C,由两图易知增量与增长速度并不完全一致,其业务量从高到低变化是3月→4月→1月→2月,业务收入从高到低变化是3月→4月→1月→2月,保持高度一致,所以C正确;对于D,由图知业务收入2月对1月减少,4月对3月减少,整体不具备高速增长之说,所以D不正确.综上,选A、B、C.
常考点05 线性回归方程与回归分析
【典例1】(2021·江苏徐州·高三)对于数据组,如果由线性回归方程得到的对应于自变量的估计值是,那么将称为相应于点的残差.某工厂为研究某种产品产量(吨)与所需某种原材料吨)的相关性,在生产过程中收集4组对应数据如下表所示:
3
4
5
6
2.5
3
4
根据表中数据,得出关于的线性回归方程为,据此计算出样本点处的残差为-0.15,则表中的值为( )
A.3.3 B.4.5 C.5 D.5.5
【答案】B
【解析】由题意可知,在样本(4,3)处的残差-0.15,则,即,
解得,即,又,且线性方程过样本中心点(,),
则,则,解得.故答案为:B
【典例2】(2021·孟津县第一高级中学)西部某深度贫困村,从2014—2019年的人均纯收入(单位:千元)情况如下表,时间变量从2014-2019年的值依次为1,2,……6.
2014—2019年的人均纯收入情况表:
年份
2014
2015
2016
2017
2018
2019
人均纯收入(千元)
2.6
3.0
3.6
3.9
4.4
5.1
(1)在图中画出表中数据的散点图,根据散点图,是否可用线性回归模型拟合与的关系,请用相关系数加以说明;(2)建立关于的回归方程(保留两位小数),预测该村2020年的人均纯收入为多少?
附注:参考数据:,,,,.参考公式:相关系数,
回归方程中斜率和截距的最小二乘法估计公式分别为:,.
【答案】(1)散点图见解析;可以用线性回归方程拟合与的关系;说明见解析;(2);该村2020年人均收入约为5450元左右.
【解析】(1)作出散点图如图:由散点图可知各点大致分布在一条直线附近,
,因为与的相关系数约为0.99,说明与的相关程度是很高的,所以可以用线性回归方程拟合与的关系.
(2),所以回归直线方程,
,即该村2020年人均收入约为5450元左右.
【技巧点拨】
1、线性回归分析问题的类型及解题方法
1)求线性回归方程
(1)利用公式,求出回归系数,.
(2)待定系数法:利用回归直线过样本点的中心求系数.
2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数.
2、模型拟合效果的判断
(1)残差平方和越小,模型的拟合效果越好.
(2)相关指数R2越大,模型的拟合效果越好.
(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
【变式演练1】(2021·全国高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①,②,其中,,,均为常数,为自然对数的底数.现该公司对收集的近12年的年研发资金投入量和年销售额()的数据作了初步处理,令,,经计算得到如下数据:
20
66
770
200
460
4.2
3125000
21500
0.308
14
(1)设和的样本相关系数为,和的样本相关系数为,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立关于的非线性经验回归方程;(ii)若下一年销售额需达到90亿元,预测下一年的研发资金投入量约为多少亿元?
参考数据为,,.
【答案】(1)模型的拟合效果更好;(2)(i);(ii)36.66亿元.
【解析】(1),
,
因为,所以从样本相关系数的角度判断,模型的拟合效果更好.
(2)(i)先建立关于的经验回归方程.由,得,即.
,,
所以关于的经验回归方程为,所以,即.
(ii)若下一年销售额需达到90亿元,则由,得,
又,所以,所以,
所以预测下一年的研发资金投入量约为36.66亿元.
【变式演练2】(2021·贵州贵阳·(理))据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数(,且)表示是否下雨:当时表示该地区下雨,当时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出k的值,使得该地区每一天下雨的概率均为;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:
时间
2016年
2017年
2018年
2019年
2020年
年份
1
2
3
4
5
降雨量
28
27
25
23
22
经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量与年份具有线性相关关系,求回归直线方程.并预测该地区2022年端午节有降雨的话,降雨量约为多少?
参考公式:,.
【答案】(1)4, ;(2),.
【解析】(1)由题意可知,,解得,即表示下雨,表示不下雨.
所给的20组数据中,,,,,,,,共组表示天中恰好有天下雨,
故所求的概率为.
(2)由题中所给的数据可得,,
所以,,
所以回归方程为,当时,.
所以该地区年端午节有降雨的话,降雨量约为.
【变式演练3】(2020·河南郑州一中高三期中)新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x
1
2
3
4
5
6
7
8
累计确诊人数y .
4
8
16
31
51
71
97
122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,,,,其中,.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?
附:回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1)选择模型①,理由见解析;(2);(3)157人.
【解析】(1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好
(2)由(1),知y关于x的回归方程为,令,则.
由所给数据得:,
.
,∴y关于x的回归方程为
(3)将代入上式,得(人)
所以预测该地区第9天新型冠状病毒感染确诊的累计人数为157人.
常考点06 独立性检验
【典例1】(2021·河南高三月考)某外语学校要求学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取名学生,得到下面的数据表:
选择德语
选择日语
男生
女生
根据表中提供的数据可知( )
附:,.
A.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别无关
B.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关
C.有的把握认为选择第二外语的倾向与性别无关
D.有的把握认为选择第二外语的倾向与性别有关
【答案】D
【解析】由题意得,
所以有的把握认为选择第二外语的倾向与性别有关,或在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关,故选:D
【典例2】(2019·全国高考真题)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1);(2)能有的把握认为男、女顾客对该商场服务的评价有差异.
【解析】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为,50名女顾客对商场满意的有30人,
所以女顾客对商场服务满意率估计为,
(2)由列联表可知,
所以能有的把握认为男、女顾客对该商场服务的评价有差异.
【技巧点拨】
1、2个明确:(1)明确两类主体;(2)明确研究的两个问题.
2、2个关键:(1)准确画出2×2列联表;(2)准确求解K2
3、3个步骤:(1)根据样本数据制成2×2列联表;
(2)根据公式K2=,计算K2的值;
(3)查表比较K2与临界值的大小关系,作统计判断
【变式演练1】(2021·定远县育才学校高三开学考试)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到列联表:
分类
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
由此列联表得到的正确结论是( )
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”
【答案】C
【解析】列联表如下:
分类
做不到“光盘”
能做到“光盘”
总计
男
45
10
55
女
30
15
45
总计
75
25
100
所以,且,
所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”.故选:C
【变式演练2】(2021·云南昆明市·高三(理))一种配件的标准尺寸为,误差不超过均为合格品,其余为不合格品.科研人员在原有生产工艺的基础上,经过技术攻关,推出一种新的生产工艺.下面的表格分别给出了用两种工艺生产的20个配件的尺寸(单位:):
新工艺
500
499
503
500
505
500
502
499
500
498
502
496
498
501
500
497
498
503
500
499
旧工艺
497
502
499
495
502
494
500
496
506
503
499
496
505
498
503
502
496
498
501
505
(1)完成下面的列联表,并分别计算用新、旧两种工艺生产的配件的合格率;
合格品
不合格品
合计
新工艺
旧工艺
合计
(2)根据所得样本数据判断,能否有95%的把握认为用两种工艺生产的配件合格率有差异?
,
0.15
0.050
0.025
0.005
2.072
3.841
5.024
7.879
【答案】(1)填表见解析;新工艺生产的配件的合格率:,用旧工艺生产的配件的合格率:;(2)有95%的把握认为用两种工艺生产的配件合格率有差异.
【解析】(1)列联表如下:
合格品
不合格品
合计
新工艺
18
2
20
旧工艺
12
8
20
合计
30
10
40
新工艺生产的配件的合格率:,
用旧工艺生产的配件的合格率:.
(2),因为,
所以,根据所得样本数据判断,有95%的把握认为用两种工艺生产的配件合格率有差异.
【变式演练3】(2021·全国高三月考)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道时,应当停车让行,俗称“礼让行人”.下表是某市一主干道路口监控设备所抓拍的个月内驾驶员不“礼让行人”行为统计数据:
月份
违章驾驶人次
(1)由表中看出,可用线性回归模型拟合违章驾驶人次与月份之间的关系,求关于的回归直线方程,并预测该路口月份不“礼让行人”的违章驾驶人次;
(2)交警从这个月内通过该路口的驾驶员中随机抽查人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:
不“礼让行人”
“礼让行人”
驾龄不超过年
驾龄年以上
能否据此判断有的把握认为“礼让行人”行为与驾龄有关?
附:,,(其中).
【答案】(1),该路口月份不“礼让行人”的违章驾驶人次预测为人次;(2)有的把握认为“礼让行人”行为与驾龄有关.
【解析】(1)由表格数据得:,,
,,
所求的回归直线方程为.
令,则,即该路口月份不“礼让行人”的违章驾驶人次预测为人次.
(2)由表中的数据可得:,
根据临界值可得:有的把握认为“礼让行人”行为与驾龄有关.
易错点01 利用随机数表确定样本忘记去掉重复数字
【例】某工厂为了对40个零件进行抽样调查,将其编号为00,01,…38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第5个零件编号是( )
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
A.36 B.16 C.11 D.14
【错解】选B
【错因分析】前面有2个36,忽略去掉重复数字
【正解】从第一行第3列开始,由左至由一次读取,即47开始读取,在编号范围内的提取出来,可得,则选出来的第5个零件编号是.故选C.
【纠错笔记】在使用随机数法时,要注意起始位置,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,注意把超过总体号码或出现重复号码的数字舍去.
易错点02 求解独立性检验问题对的值理解不准确
【例】在研究吸烟是否对患肺癌有影响的案例中,通过对列联表的数据进行处理,计算得到随机变量的观测值.在犯错误的概率不超过0.001的前提下,下面说法正确的是()
下面临界值表供参考
0.025
0.010
0.005
0.001
5.024
6.635
7.879
10.828
A.由于随机变量的观测值,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不超过0.001
B.由于随机变量的观测值,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不低于0.001
C.由于随机变量的观测值,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不超过0.001
D.由于随机变量的观测值,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不低于0.001
【错解】B
【错因分析】不理解的含义
【正解】由题意知,通过对列联表的数据进行处理,计算得到随机变量的观测值,其中,所以在犯错误的概率不超过0.001的前提下,认为“吸烟与患肺癌有关系”.故选A.
【纠错笔记】在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.在利用2×2列联表计算K2的值之前,先假设两个分类变量是无关的,最后再利用K2的值的大小对二者关系进行含概率的判断
满分:150分 完成时间:120分钟
一、选择题:本题共8小题,每小题5分,共40分.每小题给出的四个选项中,只有一项是符合题目要求的.
1.(2021·全国高三专题练习)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是,则下列说法正确的是( )
A.,乙比甲成绩稳定,应选乙参加比赛 B.,甲比乙成绩稳定,应选甲参加比赛
C.,甲比乙成绩稳定,应选甲参加比赛 D.,乙比甲成绩稳定,应选乙参加比赛
【答案】D
【解析】由茎叶图可知,甲的平均数是,
乙的平均数是,所以乙的平均数大于甲的平均数,即,
从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛.故选:D.
2.(2020·全国高考真题(理))某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【分析】根据散点图的分布可选择合适的函数模型.
【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.故选:D.
【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
3.(2021·广东高三月考)下列表述中,正确的个数是( )
①将一组数据中的每一个数据都加上同一个常数后,方差不变;
②设有一个回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量,的相关系数为,那么越接近于0,,之间的线性相关程度越高;
④在一个列联表中,根据表中数据计算得到的观测值,若的值越大,则认为两个变量间有关的把握就越大.
A.0 B.1 C.2 D.3
【答案】C
【解析】①将一组数据中的每一个数据都加上同一个常数后,方差不变,正确;
②设有一个回归方程,变量增加1个单位时,平均减少5个单位,错误;
③设具有相关关系的两个变量,的相关系数为,那么越接近于1,,之间的线性相关程度越高,错误;④在一个列联表中,根据表中数据计算得到的观测值,若的值越大,两个变量有关系的出错概率越小,则认为两个变量间有关的把握就越大,正确.故选:C
4.(2021·沙坪坝·重庆南开中学高三月考)某校为了了解高三学生平时的体育锻炼情况,从高三年级1045名同学中抽取50名同学进行调查.先用简单随机抽样从1045人中剔除45人,再按系统抽样方法从剩下的1000人中抽取50人,则在这1045人中,每个人被抽取的可能性( )
A.都相等,且为 B.不全相等 C.都相等,且为 D.都不相等
【答案】C
【解析】由随机抽样的特性知,每个个体不被剔除的概率,
从剩下的1000人中抽取50人,每个个体被抽到的概率,
所以在这1045人中,每个人被抽取的可能性为.故选:C
5.(2020·天津高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36
【答案】B
【分析】根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可.
【详解】根据直方图,直径落在区间之间的零件频率为:,
则区间内零件的个数为:.故选:B.
【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.
6.(2021·辽宁高三)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是( )
A.该公司职工的测试成绩不低于60分的人数约占总人数的80%
B.该公司职工测试成绩的中位数约为75分
C.该公司职工测试成绩的平均值约为68分
D.该公司职工测试成绩的众数约为60分
【答案】C
【解析】由频率分布直方图,得:
对于A,该公司职工的测试成绩不低于60分的频率为:(0.02+0.015)×20=0.70,
∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;
对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,
测试成绩在[60,80)的频率为0.02×20=0.4,
∴该公司职工测试成绩的中位数约为:分,故B错误;
对于C,该公司职工测试成绩的平均值约为:
分,故C正确;
对于D,该公司职工测试成绩的众数约为:分,故D错误.故选:C.
7.(2021·全国·高三专题练习)为贯彻落实健康第一的指导思想,切实加强学校体育工作,促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平.某市抽调三所中学进行中学生体育达标测试,现简称为校、校、校.现对本次测试进行调查统计,得到测试成绩排在前200名学生层次分布的饼状图、校前200名学生的分布条形图,则下列结论不一定正确的是( )
A.测试成绩前200名学生中校人数超过校人数的2倍
B.测试成绩前100名学生中校人数超过一半以上
C.测试成绩前151—200名学生中校人数最多33人
D.测试成绩前51—100名学生中校人数多于校人数
【答案】D
【分析】计算判定选项A、B一定正确;计算前1—150名学生中校人数和校最多可能的人数,得到校最少可能的人数,得前151—200名学生中校人数最多可能值,判定选项C一定正确;考虑到这200名学生中校学生总数为68人,至多有可能会有25人在151—200名之间,可以判定选项D不一定正确.
【详解】前200名学生中校人数人,校人数人,,故A一定正确;前100名学生中校人数约为人,超过半数的50人,故B一定正确;
成绩前150名以内的学生中校人数约为人,校人数最多全在这个范围,有人,所以校至少有人,又∵成绩前200名学生中校人数为40人,所以校至多有=33人测试成绩前151—200名之间,故C一定正确;
测试成绩前51—100名学生中校人数约为25人,这200名学生中校学生总数为人,有可能也有25人在51—100名之间,故D不一定正确,故选:D.
【点睛】本题考查饼图和条形图的应用,涉及最多可能与最少可能的极端思维策略,涉及频率与频数的计算,考查计算能力和逻辑推理能力,属中档题.
8.(2021·云南大理·模拟预测(理))在发生某公共卫生事件期间,有专业机构认为该事件在一段事件内没有发生大规模群体感染的标志是“连续日,每天新增疑似病例不超过人”.过去日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:总体平均数为,中位数为; 乙地:总体平均数为,总体方差大于;
丙地:中位数为,众数为; 丁地:总体平均数为,总体方差为.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】D
【分析】通过反例可知甲乙丙三地均不符合没有发生大规模群体感染的标志;假设丁地某天数据为,结合平均数可知方差必大于,由此知丁地没有发生大规模群体感染.
【详解】对于甲地,若连续日的数据为,则满足平均数为,中位数为,但不符合没有发生大规模群体感染的标志,A错误;
对于乙地,若连续日的数据为,则满足平均数为,方差大于,但不符合没有发生大规模群体感染的标志,B错误;
对于丙地,若连续日的数据为,则满足中位数为,众数为,但不符合没有发生大规模群体感染的标志,C错误;
对于丁地,若总体平均数为,假设有一天数据为人,则方差,不可能总体方差为,则不可能有一天数据超过人,符合没有发生大规模群体感染的标志,D正确.故选:D.
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.(2021·全国高三专题练习)冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( )
A.中位数为3,众数为2 B.均值小于1,中位数为1
C.均值为2,标准差为 D.均值为3,众数为4
【答案】BC
【解析】由题意,连续7天,每天体温高于37.3℃的人数分别为,
可得,
对于A中,取,则满足中位数为3,众数为2,但第7天的人数,所以A不正确;
对于B中,若,由中位数为1,可知均值为,与均值小于1矛盾,所以B正确;对于C中,当均值为2,标准差为时,,且,
若,则,例如:,符合题意,所以C正确;
对于D中,取,则满足均值为3,众数为4,但第7天人数,所以D不正确.故选:BC.
10.(2021·广东高三月考)若甲组样本数据,,…,(数据各不相同)的平均数为2,方差为4,乙组样本数据,,…,的平均数为4,则下列说法正确的是( )
A.a的值为-2 B.乙组样本数据的方差为36
C.两组样本数据的样本中位数一定相同 D.两组样本数据的样本极差不同
【答案】ABD
【解析】由题意可知:,故,故A正确;乙组样本数据方差为,故B正确;
设甲组样本数据的中位数为,则乙组样本数据的中位数为,所以两组样本数据的样本中位数不一定相同,故C错误;甲组数据的极差为,则甲组数据的极差为,所以两组样本数据的样本极差不同,故D正确;故选:ABD
12.(2021·广东广雅中学高三月考)如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出正确的选项( )
A.2020年下半年,每个月的异地快递量部是同城快递量的6倍以上
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,同城和异地快递量最高均出现在11月
【答案】BCD
【分析】根据统计图表中的数据计算可得答案.
【详解】对于A,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不是同城快递量的6倍,故A不正确;对于B,因为,9月异地快递增长率明显高于10月异地快递增长率,故B正确;对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;
对于D,由图可看出,同城和异地快递量最高都在11月份,故D正确.故选:BCD
12.(2021·重庆巴蜀中学高三月考)中国茶文化博大精深,茶水的口感与茶叶类型和水的温度有关为了建立茶水温度随时间变化的函数模型,小明每隔1分钟测量一次茶水温度,得到若干组数据,,,,绘制了如图所示的散点图.小明选择了如下2个函数模型来拟合茶水温度随时间的变化情况,函数模型一:;函数模型二:,下列说法正确的是( )
A.变量与具有负的相关关系
B.由于水温开始降得快,后面降得慢,最后趋于平缓,故模型二能更好的拟合茶水温度随时间的变化情况
C.若选择函数模型二,利用最小二乘法求得到的图象一定经过点
D.当时,通过函数模型二计算得,用温度计测得实际茶水温度为65.2,则残差为0.1
【答案】ABD
【分析】根据题中所给散点图,根据正负相关的概念即可判断选项A;根据水温的变化情况,以及指数函数的单调性,即可判断B是否正确;根据最小二乘法可求出的回归方程一定经过,即可判断选项C是否正确;根据“残差=真实值-预测值”即可判断选项D是否正确.
【详解】观察散点图,变量与具有负的相关关系,A正确;
由于函数模型二中的函数,在时,函数单调递减,可得B正确;
若选择函数模型二,利用最小二乘法求出的回归方程一定经过,C错误;
由于残差=真实值-预测值,因此残差为,故D正确.故选: ABD.
三、填空题:本题共4小题,每小题5分,共20分.
13.(2021·南昌市第三中学高三月考(理))总体由编号为01,02,03,…,29,30的30个个体组成,利用随机数表(以下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第4列开始由左向右读取,读取完毕后转下一行继续读取,则读出来的第4个个体的编号为________.
78 16 65 72 08 02 63 14 07 02 43 69 69 38 74
32 04 94 23 49 55 80 20 36 35 48 69 97 28 01
【答案】02
【解析】第1行的第4列开始,读取的数是20,26,24,02,03,
所以读出来的第4个个体的编号是02. 故答案为:02
14.(2021·辽宁抚顺·一模)“水能载舟,亦能覆舟”是古代思想家荀子的一句名言,意指事物用之得当则有利,反之必有弊害.对于高中生上学是否应该带手机,有调查者进行了如下的随机调查:调查者向被调查者提出两个问题:(1)你的编号是奇数吗?(2)你上学时是否带手机?学生在被调查时,先背对着调查人员抛掷一枚硬币(保证调查人员看不到硬币的抛掷结果),如果正面向上,就回答第一个问题,否则就回答第二个问题.被调查的学生不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,由于只有被调查者本人知道回答了哪一个问题,所以都如实地做了回答.
某次调查活动共有800名高中生(编号从1至800)参与了调查,则回答为“不是”的人数的最大值是______.如果其中共有260人回答为“是”,则由此可以估计这800名学生中,上学带手机的人数约为______.
【答案】800 120
【分析】第一空因为样本容量为800,则回答“不是”的人数不超过样本容量即可;结合掷一枚硬币正面向上和反面向上的概率均为0.5,则回答第一个问题和第二个问题的人数大约为400,而学号为奇数和偶数的概率均为0.5,则回答第一个问题的人中回答“是”的占200人,由此可得出第二空答案.
【详解】解:∵某次调查活动共有800名高中生参与了调查,∴回答为“不是”的人数的最大值是800,
∵掷一枚硬币正面向上和反面向上的概率均为0.5,∴回答第一个问题和第二个问题的人数大约为400,
而学号为奇数和偶数的概率均为0.5,则回答第一个问题的人中回答“是”的占200人,
∵其中共有260人回答为“是”,∴在回答问题(2)的400人中,回答“是”人数为260-200=60,
∴这800名学生中,上学带手机的人数约为120,故答案为:800;120.
【点睛】本题主要考查随机抽样的概念及特征,考查涉及敏感性信息的问卷调查,属于中档题.
15.(2021·西城·北京铁路二中高三期中)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:
① 第3天至第11天复工复产指数均超过80%;
② 这11天期间,复产指数增量大于复工指数的增量;
③ 第9天至第11天复产指数增量大于复工指数的增量;
④ 第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.
其中所有正确结论的序号是____________________.
【答案】①③
【解析】由图像可得,第3天至第11天复工复产指数均超过80%,故①正确;
由图像可得,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;
由图像可得,第9天至第11天复产指数增量大于复工指数的增量;故③正确;
由图像可得,第1天至第3天复工指数波动较小,第2天至第4天复工指数波动较大,所以第1天至第3天复工指数的方差小于第2天至第4天复工指数的方差,故④错误.故答案为:①③
16.(2021·全国·高三专题练习)2021年受疫情影响,国家鼓励员工在工作地过年.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如下的表格:
A区
B区
C区
D区
E区
外来务工人员数
5000
4000
3500
3000
2500
留在当地的人数占比
80%
90%
80%
80%
84%
根据这5个地区的数据求得留在当地过年人员数y与外来务工人员数x的线性回归方程为.该市对外来务工人员选择留在当地过年的每人补贴1000元,该市F区有10000名外来务工人员,根据线性回归方程估计F区需要给外来务工人员中留在当地过年的人员的补贴总额为___________万元.(参考数据:取)
【答案】
【分析】求出,利用中心点求得,然后令代入可得估计值,求得留在当地过年的人员数可得补贴总额.
【详解】由已知,
,
所以,则,即,
时,,估计应补贴(万元).故答案为:.
【点睛】关键点点睛:本题考查结尾回归直线方程的应用,线性回归直线的性质:线性回归直线一定过中心点,由此可求得方程中的参数值,得方程,从而用回归方程进行计算估计.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(2021广东高二期中)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5), [0.5,1),……[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.
【答案】(Ⅰ);(Ⅱ)36000;(Ⅲ)2.04.
【解析】(Ⅰ)由频率分布直方图,可知:月用水量在[0,0.5]的频率为0.08×0.5=0.04.
同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02. 由1–(0.04+0.08+0.21+.025+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(Ⅱ)由(Ⅰ),100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.13=36000.
(Ⅲ)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48
相关试卷
这是一份专题25 抛物线 常考点归纳与变式演练 作业 高中数学 一轮复习 人教版(2021年),共52页。
这是一份专题23 椭圆 常考点归纳与变式演练 作业 高中数学 一轮复习 人教版(2021年),共41页。
这是一份专题04 复数 常考点归纳与变式演练 作业 高中数学 一轮复习 人教版(2021年),共31页。