搜索
    上传资料 赚现金
    英语朗读宝

    高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析

    高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析第1页
    高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析第2页
    高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析第3页
    还剩12页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析

    展开

    这是一份高考数学二轮复习第2部分专题篇素养提升文理专题四第2讲统计与统计案例文理学案含解析,共15页。
    第2讲 统计与统计案例(文理)JIE TI CE LUE MING FANG XIANG解题策略·明方向 ︱考情分析︱1.抽样方法、样本的数字特征、统计图表主要以选择题、填空题形式命题,难度较小.2.注重知识的交汇渗透,统计与概率,回归分析、独立性检验与概率是近年命题的热点.︱真题分布︱(理科)年份卷别题号考查角度分值20205散点图的识别518平均数的估计值、相关系数的计算以及抽样方法的选取123、18标准差的大小比较、方差公式的应用;利用频数分布表计算频率和平均数、独立性检验的应用172019   5样本的数字特征517频率分布直方图、均值的应用1220183统计图的识别和分析518折线图、线性回归方程模型问题1218茎叶图的应用以及独立性检验12(文科)年份卷别题号考查角度分值20205、17散点图的识别,频率分布表的应用1718平均数的估计值、相关系数的计算以及抽样方法的选取123、18方差及其性质,利用频数分布表计算频率和平均数、独立性检验的应用1720196、12(2)系统抽样,独立性检验1019样本的频率分布以及样本的数字特征124、17随机抽样以及用样本估计总体;由频率分布直方图求参数的平均值1720183统计图的识别与分析518折线图、线性回归方程模型问题1214、18抽样方法;茎叶图的应用及独立性检验17KAO DIAN FEN LEI XI ZHONG DIAN考点分类·析重点 考点一 抽样方法抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.典例1 (1)(2020·中卫三模)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2 400名学生中抽取30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2 321~2 400号),若第3组抽出的号码为176,则第6组抽到的号码是( A )A.416   B.432 C.448   D.464(2)(2020·太原模拟)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从乙车间的产品中抽取了4件,则n=( D )A.9   B.10 C.12   D.13【解析】 (1)样本间隔为2 400÷30=80,设首个号码为x,则第三个号码为x+160,则x+160=176,解得x=16,则第6组抽到的号码为16+80×5=400+16=416,故选A.(2)甲、乙、丙三个车间的数量之比依次为1208060=643,现用分层抽样的方法抽出的样本中乙车间抽4件,由分层抽样性质,得:解得n=13.故选D.解决抽样问题的方法(1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.(2)在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔为(N为样本容量),首先确定在第一组中抽取的个体的号码,再从后面的每组中按规则抽取每个个体.1.(2020·福田区校级模拟)某校举行“我和我的祖国”文艺汇演,需征集20名志愿者参与活动服务工作,现决定采取分层抽样的方式从“摄影协会”、“记者协会”、“管理爱好者协会”中抽取,已知三个协会的人数比为5︰2︰3,且每个人被抽取的概率为0.2,则该校“摄影协会”的人数为( C )A.10   B.20 C.50   D.100【解析】 由题意知从“摄影协会”抽取的人数为×20=10,因为每个人被抽取的概率为0.2,故该校“摄影协会”的人数为=50.故选C.2.(2020·武汉模拟)某校有高中生1 500人,现采用系统抽样法抽取50人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、490人、515人)按1,2,3,…,1 500编号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( C )A.15   B.16 C.17   D.18【解析】 由系统抽样法知,按编号依次每30个编号作为一组,共分50组,高二学生编号为496到985,在第17组到33组内,第17组编号为16×30+23=503,为高二学生,第33组编号为32×30+23=983,为高二学生,故所抽样本中高二学生的人数为33-17+1=17.故选C.考点二 用样本估计总体1.直方图的两个结论(1)小长方形的面积=组距×=频率.(2)各小长方形的面积之和等于1.2.统计中的四个数字特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即(x1+x2+…+xn).(4)方差与标准差方差:s2[(x1)2+(x2)2+…+(xn)2].标准差:s=.考向1 样本的数字特征典例2 (2020·唐山二模)某科考试成绩公布后,发现判错一道题,经修改后重新公布,如表是抽取10名学生的成绩,依据这些信息修改后的成绩与修改前的相比,这10名学生成绩的( D )学生学号12345678910修改前成绩126130104100133123100120139103修改后成绩126135991001381239512014498A.平均分、方差都变小   B.平均分、方差都变大C.平均分不变、方差变小   D.平均分不变、方差变大【解析】 经计算,修改前后的平均数均为117.8,故可排除AB,又经计算修改前的方差为(8.22+12.22+13.82+17.82+15.22+5.22+17.82+2.22+21.22+14.82)=197.16修改后的方差为(8.22+17.22+18.82+17.82+20.22+5.22+22.82+2.22+26.22+19.82)=307.16,故选D.关于平均数、方差的计算样本数据的平均数与方差的计算关键在于准确记忆公式,要特别注意区分方差与标准差,不能混淆,标准差是方差的算术平方根.3.(2020·广陵区校级模拟)某地区连续5天的最低气温(单位:℃)依次为8,-4,-1,0,2,则该组数据的方差为__16__.【解析】 由题意平均数(8-4-1+0+2)=1,所以方差s2[(8-1)2+(-4-1)2+(-1-1)2+(0-1)2+(2-1)2]=16.4.(2020·亭湖区校级一模)若样本a1、a2、a3的方差是2,则样本2a1+3,2a2+3,2a3+3的标准差是__2__.【解析】 样本a1、a2、a3的方差是2,设平均数为则样本2a1+3,2a2+3,2a3+3的平均数为2+3,方差s2[(2a1-2)2+(2a2-2)2+(2a3-2)2],×4[(a1)2+(a2)2+(a3)2],=4×2=8.故样本2a1+3,2a2+3,2a3+3的标准差为:2.考向2 统计图表典例3 (1)(2019·广东百校联考)如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( D )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2 000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看,2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长(2)(2019·株洲二模)某企业对其生产的一批产品进行检测,得出每件产品中某种物质含量(单位:克)的频率分布直方图如图所示.则该物质含量的众数和平均数分别为( C )A.8384    B.8385C.8584    D.8585【解析】 (1)对于选项A:2019年1~4月的业务量,3月最高,2月最低,差值为4 397-2 411=1 986,接近2 000万件,所以A是正确的;对于选项B:2019年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B是正确的;对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.故选D.(2)根据频率分布直方图得出众数落在第三组[80,90)内,所以众数为=85;含量在[60,70)之间的频率为0.1,含量在[70,80)之间的频率为0.2,含量在[80,90)之间的频率为0.4,根据概率和为1,可得含量在[90,100)之间的频率为0.3,所以频率分布直方图的平均数为65×0.1+75×0.2+85×0.4+95×0.3=84.故选C.众数、中位数、平均数与直方图的关系(1)众数为频率分布直方图中最高矩形的底边中点的横坐标.(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.(3)平均数等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.5.(2019·绵阳二诊)下图所示的茎叶图记录的是甲、乙两个班各5名同学在一次数学小测试中的选择题总成绩(每道题5分,共8道题).已知两组数据的中位数相同,则m的值为( D )A.0    B.2   C.3    D.5【解析】 甲班成绩:25、30、35、40、40,中位数为35,乙班成绩30、30、30+m、35、40,因为中位数相同,所以30+m=35,解得m=5.故选D.考点三 统计案例1.线性回归方程方程x+称为线性回归方程,其中;()称为样本点的中心.2.随机变量K2(K2也可表示为x2).若K2>3.841,则有95%的把握说两个事件有关;若K2>6.635,则有99%的把握说两个事件有关.考向1 回归分析典例4 (2020·长治模拟)《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.(1)若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;(2)该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间y(单位:小时)与年龄x(单位:岁),并制作了对照表(如表所示):年龄x20304050每周学习诗词的平均时间y33.53.54由表中数据分析,x与y呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.参考公式:【解析】 (1)设污损的数字为x,由北方观众平均人数超过南方观众平均人数得>x<6,即x=0,1,2,3,4,5,P=.(2)(20+30+40+50)=35,(3+3.5+3.5+4)=3.5,4·=490,iyi=20×3+30×3.5+40×3.5+50×4=505,=202+302+402+502=5 400,=0.03,=3.5-0.03×35=2.45,=0.03x+2.45,x=60时,=4.25.答:年龄为60岁的观众每周学习诗词的平均时间大约为4.25小时.求回归直线方程的方法(1)若所求的回归直线方程是在选择题中,常利用回归直线必经过样本点的中心()快速解决.(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤:依据样本数据画出散点图,确定两个变量具有线性相关关系;计算xxiyi的值;计算回归系数写出回归直线方程x+.6.(2020·四川省成都市期末)某公司在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图,计算图中各小长方形的宽度;(2)根据频率分布直方图,估计投入4万元广告费用之后,销售收益的平均值(以各组的区间中点值代表该组的取值);(3)按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元)12345销售收益y(单位:百万元)232 7表中的数据显示,x与y之间存在线性相关关系,请将(2)的结果填入空白栏,并计算y关于x的回归方程.附公式:【解析】 (1)设各小长方形的宽度为m,由频率分布直方图各小长方形面积总和为1,可知(0.08+0.1+0.14+0.12+0.04+0.02)·m=0.5m=1,故m=2.(2)由(1)知各小组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为1×0.16+3×0.2+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)由(2)知空白栏中填5.由题意可知,=3,=3.8,iyi=1×2+2×3+3×2+4×5+5×7=69,=12+22+32+42+52=55,根据公式,可求得=1.2,=3.8-1.2×3=0.2,即回归直线的方程为=1.2x+0.2.考向2 独立性检验典例5 (2020·珠海三模)随机调查某城市有80名子女在读小学的成年人,以研究晚上八点至十点时间段辅导子女作业与性别的关系,得到下面的数据表:    是否辅导性别    辅导不辅导合计25 60   合计40 80(1)请将表中数据补充完整;(2)用样本的频率估计总体的概率,估计这个城市有子女在读小学的成年女士晚上八点至十点辅导子女作业的概率;(3)根据以上数据,能否有99%以上的把握认为“晚上八点至十点时间段是否辅导子女作业与性别有关?”.参考公式附:K2其中n=a+b+c+d.参考数据:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828【解析】 (1) 辅导不辅导合计25356015520合计404080(2)在样本中有20位女士,其中有15位辅导孩子作业,其频率为P==0.75.估计成年女士晚上八点至十点辅导孩子作业的概率为0.75.(3)K2≈6.67>6.635.可知有99%的把握认为“晚上八点至十点时间段是否辅导孩子作业与性别有关”.独立性检验的关键(1)根据2×2列联表准确计算K2的观测值k0,若没有列出2×2列联表,要先列出此表.(2)K2的观测值k0越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.7.(2020·四川省绵阳市二诊)每年的4月23日为“世界读书日”,某调查机构对某校学生做了一个是否喜爱阅读的抽样调查.该调查机构从该校随机抽查了100名不同性别的学生(其中男生45名),统计了每个学生一个月的阅读时间,其阅读时间t(小时)的频率分布直方图如图所示:(1)求样本学生一个月阅读时间t的中位数m;(2)已知样本中阅读时间低于m的女生有30名,请根据题目信息完成下面的2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为阅读与性别有关.2×2列联表 总计t≥m   t<m   总计   附表:P(K2≥k0)0.150.100.05k02.0722.7063.841其中:K2.【解析】 (1)由题意得,直方图中第一组,第二组的频率之和为0.04×5+0.06×5=0.5.所以阅读时间的中位数m=10.(2)由题意得,男生人数为45人,因此女生人数为55人,由频率分布直方图知,阅读时长大于等于m的人数为100×0.5=50人,故列联表补充如下: 总计t≥m252550t<m203050总计4555100K2的观测值k=≈1.01<2.706,所以不能在犯错误的概率不超过0.1的前提下认为阅读与性别有关.YI CUO QING LING MIAN SHI WU易错清零·免失误 1.忘记回归直线过样本中心致错典例1 某单位为了了解用电量(度)与当天平均气温()之间的关系,随机统计了某4天的当天平均气温与用电量(如表),由数据运用最小二乘法得线性回归方程=-2x+a,则a=__60__.平均气温(℃)181310-1用电量y(度)25353763【错解】 将点(18,25)带入=-2x+a,得25=-2×18+a,所以a=61.【剖析】 (1)不理解回归直线过样本中心点(),随便带入数据导致结果错误.(2)求出样本的中心点(),代入回归方程,即可求得.【正解】 =10,=40,样本中心为(10,40),回归直线经过样本中心,所以40=-2×10+aa=60.2.混淆回归直线的斜率和截距典例2 (2020·襄阳四中月考)某城市新开一大型楼盘,由于该楼盘位于城市的黄金地段,预售场面异常火爆,故该楼盘开发商采用房屋竞价策略,竞价的基本规则是:所有参与竞价的人都是网络报价,每个人并不知道其他人的报价,也不知道参与当期竞价的总人数;竞价采用“一月一期制”,当月竞价时间截止后,系统根据当期房屋配额,按照竞价人的出价从高到低分配名额,某人拟参加2019年11月份的房屋竞价,他为了预测最低成交价,根据网站的公告,统计了最近5个月参与竞价的人数,如表所示:月份678910月份编号t12345竞价人数y/万人0.50.611.41.7(1)若可用线性回归模型拟合竞价人数y(单位:万)与月份编号t之间的关系,请用最小二乘法求y关于t的回归方程t+,并预测2019年11月份(月份编号为6)参与竞价的人数;(2)某市场调研机构对200位拟参加2019年11月份房屋竞价人员报价进行了一个抽样调查,得到如表所示的频数表:报价(万元/m2)[1,2)[2,3)[3,4)[4,5)[5,6)[6,7]频数206060302010求这200位竞价人员报价X的平均值和方差s2(同一区间的报价用该价格区间的中点值代替);假设所有竞价人员的报价X可视为服从正态分布N(μ,σ2),且μ与σ2可分别由中所求的样本平均数及s2估计,若2019年11月份计划发放房源数量为3 174,请你合理预测竞价的最低成交价,并说明理由.参考公式及数据:回归方程x+其中=55,iyi=18.8,≈1.3;若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.682 7,P(μ-2σ<X<μ+2σ)≈0.954 5,P(μ-3σ<X<μ+3σ)≈0.997 3.【解析】 (1)由题意求出=3,=1.04.=55,iyi=18.8,得=0.32.那么=1.04-0.32×3=0.08.从而得到回归方程为=0.32t+0.08.当t=6时,可得y=0.32×6+0.08=2(万人),故预测2019年11月份参与竞价的人数为2万人.(2)×1.5+×2.5+×3.5+×4.5+×5.5+×6.5=3.5(万元).s2×(-2)2×(-1)2+0+×12×22×32=1.7.得μ=3.5,σ=≈1.3,竞价成功的概率约为=0.158 7.由P(μ-σ<X<μ+σ)≈0.682 7,得P(X≥μ+σ)==0.158 65.又μ+σ≈4.8,所以2019年11月份竞价的最低成交价约为4.8万元.【剖析】 (1)回归直线的斜率是线性回归方程x+中x的系数,在应用公式以及将数据代入线性回归方程时,不要把回归直线的斜率与回归直线的截距搞混;(2)已知变量的某个值去预测相应变量的某个值时,常将已知变量代入线性回归方程x+中,求出的估计值;(3)不理解独立性检验的思想而致错典例3 (2020·沈阳铁路中学月考)司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命.为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的2×2列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关; 开车时使用手机开车时不使用手机合计男性司机人数   女性司机人数   合计   (2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望E(X)参考公式附:K2其中n=a+b+c+d.参考数据:P(K2≥k0)0.150.100.050.0250.0100.005k02.0722.7063.8415.0246.6357.879【解析】 (1)填写2×2列联表,如下: 开车时使用手机开车时不使用手机合计男性司机人数401555女性司机人数202545合计6040100根据数表,计算K2≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关.(2)由题意,任意抽取1辆车中司机为男性且开车时使用手机的概率是则X的可能取值为:0,1,2,3,且X~B可得P(X=k)=C·3-k·k所以P(X=0)=C·3·0P(X=1)=C·2·P(X=2)=C··2P(X=3)=C·0·3所以X的分布列为:X0123P数学期望为E(X)=3×.【剖析】 (1)在找出相关数据,填写2×2列联表,把所给的数据代入独立性检验公式,求K2的观测值时出错,只要认真计算,就能有效避开此易错点;(2)在将K2的观测值与临界值进行对比时,不知比大还是比小,导致推理出错.  

    相关学案

    高考数学二轮复习第2部分专题篇素养提升文理专题二数列文理第2讲数列求和及其综合应用文理学案含解析:

    这是一份高考数学二轮复习第2部分专题篇素养提升文理专题二数列文理第2讲数列求和及其综合应用文理学案含解析,共11页。

    高考数学二轮复习第2部分专题篇素养提升文理专题六函数与导数第4讲导数的综合应用文理学案含解析:

    这是一份高考数学二轮复习第2部分专题篇素养提升文理专题六函数与导数第4讲导数的综合应用文理学案含解析,共10页。

    高考数学二轮复习第2部分专题篇素养提升文理专题六函数与导数第2讲基本初等函数函数与方程文理学案含解析:

    这是一份高考数学二轮复习第2部分专题篇素养提升文理专题六函数与导数第2讲基本初等函数函数与方程文理学案含解析,共12页。

    文档详情页底部广告位
    • 精品推荐
    • 所属专辑
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map