第二篇专题四概率与统计 2022版高考数学复习讲义
展开统计与概率高考小题概率与统计用样本估计总体1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【解析】选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D正确. 本题条件不变,如果该地共有农户2 000户,估计家庭年收入超过11.5万元的户数.【解析】由频率分布直方图可得,家庭年收入超过11.5万元的农户约为2 000×(0.02+0.02+0.02)×1=120(户).2.(多选题)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到的新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同【命题意图】本题考查样本的数字特征.旨在考查基本运算求解能力.【解析】选CD.由题可知x=,y==+c=x+c,因为c≠0,所以x≠y,所以A错;若x1,x2,…,xn的中位数为xk,因为yi=xi+c,所以y1,y2,…,yn的中位数为yk =xk+c≠xk,所以B错; y1,y2,…,yn的标准差为sy====sx,所以C正确;设样本数据x1,x2,…,xn中最大为xn,最小为x1,因为yi=xi+c,所以样本数据y1,y2,…,yn中最大为yn,最小为y1,极差为yn-y1=(xn+c)-(x1+c)=xn- x1,所以D正确.3.(2021·蚌埠三模)国家统计局官方网站2021年2月28日发布了《中华人民共和国2020年国民经济和社会发展统计公报》,全面展示了一年来全国人民顽强奋斗取得的令世界瞩目、可载入史册的伟大成就.如图是2016-2020年国内生产总值及其增长速度统计图和三次产业增加值占国内生产总值比重统计图.给出下列说法:①从2016年至2020年国内生产总值逐年递增;②从2016年至2020年国内生产总值增长速度逐年递减;③从2016年至2020年第三产业增加值占国内生产总值比重逐年递增;④从2016年至2020年第二产业增加值占国内生产总值比重逐年递减.其中正确的是( )A.①④ B.②③C.②④ D.①③【思维通关】关键点弄清图1图2分别描述的内容,读懂图中条形图、折线图数据的含义障碍点读不懂图形易错点直观地把图1中的折线图看为下降趋势【解析】选D.对于①,由图1可知,从2016年到2020年国内生产总值数不断增大,条形图中对应的长方形的高度不断升高,故选项①正确;对于②,由图1可知,在2016年到2017年国内生产总值增长速度从6.8%到6.9%折线是上升的,故选项②错误;对于③,由图2可知,从2016年到2020年第三产业增加值占国内生产总值比重变化为52.4%,52.7%,53.3%,54.3%,54.5%,是不断增加的,故选项③正确;对于④,由图2可知,从2016年到2017年第二产业增加值占国内生产总值比重由39.6%上升到了39.9%,故选项④错误.4.(多选题)(2021·重庆名校联盟三模)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大.指数范围[0,50],[51,100],[101,200],[201,300],[301,500]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级,下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是( )A.从2日到5日空气质量越来越好B.这14天中空气质量指数的极差为195C.这14天中空气质量指数的中位数是103.5D.这14天中空气质量指数为“良”的频率为【解析】选BC.对于A,由折线图可知,从2日到5日空气质量指数越来越大,所以空气质量越来越差,故选项A错误;对于B,这14天中空气质量指数的极差为220-25=195,故选项B正确;对于C,这14天中空气质量指数为25,37,40,57,79,86,86,121,143,158,160,160,217,220,所以中位数是(86+121)÷2=103.5,故选项C正确;对于D,这14天中空气质量指数为“良”的频率为=,故选项D错误.考向解题策略分层随机抽样中的计算=.频率分布直方图的应用(1)组距、频率:频率分布直方图中每个矩形的宽表示组距,高表示,面积表示该组数据的频率,各个矩形的面积之和为1;(2)众数:最高小长方形底边中点的横坐标;(3)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(4)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和;(5)参数:若纵轴上存在参数,则根据所有小长方形的面积之和为1,列方程即可求得参数值数字特征平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小变量间的相关关系、统计案例1.(2021·常德一模)2021年3月全国两会上,“碳达峰”“碳中和”备受关注.为应对气候变化,我国提出“二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和”等庄严的目标承诺.在今年的政府工作报告中,“做好碳达峰、碳中和工作”被列为2021年重点任务之一;“十四五”规划也将加快推动绿色低碳发展列入其中.我国自1981年开展全民义务植树以来,全国森林面积呈线性增长,第三次全国森林资源清查的时间为1984-1988年,每5年清查一次,历次清查数据如表:第x次3456789森林面积y(亿平方米)1.251.341.591.751.952.082.20经计算得到线性回归直线为=0.167 5x+(参考数据:i=12.16)据此估算我国森林面积在第几次森林资源清查时首次超过3亿平方米( )A.12 B.13C.14 D.15【解析】选C.由题意可知,==6,==≈1.74,又因为=0.167 5,则=-=1.74-0.167 5×6=0.735,故=0.167 5x+0.735,令>3,又x为整数,所以x≥14,x为整数.2.(2021·佛山二模)A,B两个物理兴趣小组在实验室研究某粒子运动轨迹.共同记录到粒子的13个位置的坐标信息如表:x-0.93-0.82-0.77-0.61-0.55-0.33y-0.26-0.41-0.45-0.45-0.60-0.67-0.270.100.420.580.640.670.76-0.68-0.710.640.550.550.530.46A小组根据表中数据,直接对y,x作线性回归分析,得到回归方程为=0.599 3x+0.005,相关指数R2=0.447 2;B小组先将数据依变换u=x2,v=y2,进行整理,再对v,u作线性回归分析,得到回归方程为=-0.500 6u+0.492 2,相关指数R2=0.937 5.根据统计学知识,下列方程中,最有可能是该粒子运动轨迹方程的是( )A.0.599 3x-y+0.005=0B.0.500 6x+y-0.492 2=0C.+=1D.+=1【思维通关】关键点由统计学知识可知,R2越大,拟合效果越好障碍点确定选择哪个组的回归方程易错点忽视变量之间的变换,错选B选项【解析】选C.由统计学知识可知,R2越大,拟合效果越好,又A小组的相关指数R2=0.447 2,B小组的相关指数R2=0.937 5,所以B组的拟合效果好,则回归方程为=-0.500 6u+0.492 2,又u=x2,v=y2,所以y2=-0.500 6x2+0.492 2,即+=1.3.(2021·新高考Ⅱ卷)某物理量的测量结果服从正态分布N(10,σ2),则下列结论中不正确的是( )A.σ越小,该物理量一次测量结果落在(9.9.10.1)内的概率越大B.该物理量一次测量结果大于10的概率为0.5C.该物理量一次测量结果大于10.01的概率与小于为9.99的概率相等D.该物理量一次测量结果落在(9.9.10.2)内的概率与落在(10,10.3)内的概率相等【解析】选D.对于A,σ2为数据的方差,所以σ越小,数据在μ=10附近越集中,所以测量结果落在(9.9,10.1)内的概率越大,故A正确;对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;对于D,因为该物理量一次测量结果落在(9.9,10.0)的概率与落在(10.2,10.3)的概率不同,所以一次测量结果落在(9.9,10.2)的概率与落在(10,10.3)的概率不同,故D错误.考向解题策略回归方程回归直线必过样本点的中心回归分析(1)散点图:确定两个变量是否相关,是正相关还是负相关;(2)相关系数r:判断相关性的强弱;(3)残差平方和、相关指数:判断模型拟合效果的优劣独立性检验充分利用2×2列联表准确计算K2的观测值,与临界值进行比对,作出统计推断概率问题 1.(2021·全国甲卷)将3个1和2个0随机排成一行,则2个0不相邻的概率为( )A.0.3 B.0.5C.0.6 D.0.8【解析】选C.列出所有情况为:00111,01011,01101,01110,10011,10101,10110,11001,11010,11100,共10种情况,其中2个0不相邻的情况有6种情况,故所求概率为=0.6.2.(2021·重庆名校联盟三模)孪生素数猜想是希尔伯特在1900年提出的23个问题中的第8个:存在无穷多个素数p,使得p+2是素数,素数对(p,p+2)称为孪生素数.2013年华人数学家张益唐发表的论文《素数间的有界距离》,第一次证明了存在无穷多组间距小于定值的素数对.那么在不超过16的素数中任意取出不同的两个,可组成孪生素数的概率为( )A. B. C. D.【解析】选A.不超过16的素数有2,3,5,7,11,13,在不超过16的素数中任意取出不同的两个,基本事件总数n=C=15,可组成孪生素数包含的基本事件有:(3,5),(5,7),(11,13),共3个,所以在不超过16的素数中任意取出不同的两个,可组成孪生素数的概率为P==.3.(2021·锦州一模)已知随机变量X服从正态分布N,若P+P=1,则μ=( )A.-1 B.1 C.-2 D.2【解析】选D.因为随机变量X服从正态分布N,对称轴为X=μ,又P+P=1,而P+P=1,所以P=P,所以5和-1关于对称轴对称,则μ==2.4.某单位举行诗词大会比赛,给每位参赛者设计了“保留题型”“升级题型”“创新题型”三类题型,每类题型均指定一道题让参赛者回答.已知某位参赛者答对每道题的概率均为,且各次答对与否相互独立,则该参赛者答完三道题后至少答对两道题的概率为________.【解析】由题意,设该参赛者答完三道题后答对的题目道数为X,则X~B,所以至少答对两道题的概率:P=3+C2=.答案:考向解题策略古典概型(1)判断是否为古典概型;(2)计算公式:P=.正态分布(1)曲线以x=μ为对称轴;(2)曲线与x轴之间的面积等于1.二项分布(1)条件:独立性与重复性;(2)公式:P=Cpkn-k.1.(2021·唐山二模)已知多项选择题的四个选项A,B,C,D中至少有两个选项正确,规定:如果选择了错误选项就不得分.若某题的正确答案是ABC,某考生随机选了两个选项,则其得分的概率为( )A. B. C. D.【解析】选A.某考生从四个选项A,B,C,D中随机选了两个选项,基本事件总数n=6,该考生得分包含的基本事件个数m=3,则其得分的概率为P===.2.(2021·邯郸二模)某商场有三层楼,最初规划一层为生活用品区,二层为服装区,三层为餐饮区,招商工作结束后,共有100家商家入驻,各楼层的商铺种类如表所示,若从所有商铺中随机抽取一家,该商铺所在楼层与最初规划不一致的概率为( ) 生活用品店服装店餐饮店一层2573二层4274三层6123A.0.75 B.0.6 C.0.4 D.0.25【解析】选D.100家商铺中与最初规划一致的有25+27+23=75家,故不一致的有100-75=25家,所以从所有商铺中随机抽取一家,该商铺所在楼层与最初规划不一致的概率为=0.25.3.“三药”分别为金花清感颗粒、连花清瘟胶囊、血必清注射液;“三方”分别为清肺排毒汤、化湿败毒方、宜肺败毒方.若某医生从“三药三方”中随机选出两种,事件A表示选出的两种中有一药,事件B表示选出的两种中有一方,则P=( )A. B. C. D.【解析】选D.某医生从“三药三方”中随机选出两种,事件A表示选出的两种中有一药,事件B表示选出的两种中有一方,则P(A)==,P==,所以P===.4.(2021·武汉二模)已知随机变量X服从正态分布N(10,σ2),若P(X<8)=0.23,则P(X<12)=__________.【解析】因为随机变量X服从正态分布N(10,σ2),P(X<8)=0.23,所以P(X>12)=0.23,所以P(X<12)=1-0.23=0.77.答案:0.77