高考数学二轮复习热点突破专题4概率与统计第1讲统计与统计案例课件
展开第1讲 统计与统计案例
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数C.方差 D.极差解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.答案 A
A.p1=p4=0.1,p2=p3==p4=0.4,p2=p3==p4=0.2,p2=p3==p4=0.3,p2=p3=0.2
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18 C.20 D.36
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.答案 B
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
1.抽样方法抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
4.回归分析与独立性检验
热点一 抽样方法【例1】 (1)总体由编号为01,02,…,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为( )
附:第6行至第9行的随机数表2748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 51253211 4919 7306 4916 7677 8733 9974 67322635 7900 3370 9160 1620 3882 7757 4950A.3 B.19 C.38 D.20
(2)(2020·百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生1 800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1 800名学生中抽取一个容量为72的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为( )A.800 B.750 C.700 D.650
解析 (1)由题意知,编号为01~50的个体才是需要的个体.由随机数表依次可得41,48,28,19,16,20,……故第4个个体的编号为19.故选B.
答案 (1)B (2)D
探究提高 解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.
【训练1】 (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第6列的数字开始,由左到右依次选取两个数字,则选出来的第5个个体的编号为________.
附:第1行至第2行的随机数表21 16 65 08 90 34 20 76 43 81 26 34 91 64 17 50 71 59 45 0691 27 35 36 80 72 74 67 21 33 50 25 83 12 02 76 11 87 05 26(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
解析 (1)从随机数表的第1行第6列的数字开始,按规则得到的编号依次为50,89,03,42,07,64,38,12,63,49,16,41,75,07,15,94,50,……其中编号在01至20之间的依次为03,07,12,16,07,15,……按照编号重复的删除后一个的原则,可知选出来的第5个个体的编号为15.
答案 (1)15 (2)18
(2)2020年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为( )
A.2 750,200 B.2 750,110C.1 120,110 D.1 120,200
(2)学生总数为15 500+5 000+7 500=28 000人,由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120(人).故高中生应抽取的人数为5 000×4%=200(人),而高中生中参与“家务劳动”的比率为0.55,故高中生中参与“家务劳动”的人数为200×0.55=110(人).答案 (1)C (2)C
角度2 用样本的频率分布估计总体分布【例3】 (2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解 (1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.2.在例3中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
【训练2】 (1)(2020·新高考海南卷)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A.这11天复工指数和复产指数均逐日增加B.这11天期间,复产指数增量大于复工指数的增量C.第3天至第11天复工复产指数均超过80%D.第9天至第11天复产指数增量大于复工指数的增量
解析 由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;故选C、D.答案 CD
(2)(2019·全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
所以用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
②100个企业的产值增长率平均数为
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
热点三 回归分析在实际问题中的应用【例4】 如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
(2)利用模型②得到的预测值更可靠.理由如下:
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
【训练3】 (1)(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x
(2)(2020·百强名校领军考试)已知变量x,y的关系可以用模型y=cekx拟合,设z=ln y,其变换后得到一组数据如下:
解析 (1)由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D.
答案 (1)D (2)D
热点四 独立性检验【例5】 (2020·新高考山东、海南卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:
(2)根据抽查数据,可得2×2列联表:
(3)根据(2)的列联表得
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
【训练4】 某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
高中数学高考板块2 核心考点突破拿高分 专题4 第1讲 概率与统计(小题)(1)课件PPT: 这是一份高中数学高考板块2 核心考点突破拿高分 专题4 第1讲 概率与统计(小题)(1)课件PPT,共40页。PPT课件主要包含了内容索引,热点分类突破,真题押题精练,押题预测,真题体验等内容,欢迎下载使用。
高中数学高考板块2 核心考点突破拿高分 专题4 第2讲 概率与统计(大题)(1)课件PPT: 这是一份高中数学高考板块2 核心考点突破拿高分 专题4 第2讲 概率与统计(大题)(1)课件PPT,共46页。PPT课件主要包含了内容索引,热点分类突破,真题押题精练,所以X的分布列为,列联表如下,押题预测,真题体验等内容,欢迎下载使用。
2023届高考数学二轮复习专题4第1讲统计与统计案例课件: 这是一份2023届高考数学二轮复习专题4第1讲统计与统计案例课件,共60页。PPT课件主要包含了专题四统计与概率,考情分析,真题热身,2列联表,感悟高考,考点一统计图表,典例1,考点二回归分析,典例2,考点三独立性检验等内容,欢迎下载使用。