终身会员
搜索
    上传资料 赚现金
    高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】
    立即下载
    加入资料篮
    高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】01
    高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】02
    高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】03
    还剩53页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】

    展开
    这是一份高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】,共56页。

    【热点聚焦】
    主要以生活中的实际问题为背景,考查随机抽样与样本估计总体、线性回归方程的求解与运用、独立性检验问题.统计与统计案例的命题,一般以一道小题、一道大题的形式考查,难度中等.
    【重点知识回眸】
    (一)随机抽样
    1.简单随机抽样的特点
    (1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
    2.抽签法与随机数法的适用情况
    (1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
    (2)一个抽样试验能否用抽签法,关键看两点:
    一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
    3.分层抽样问题类型及解题思路
    (1)求某层应抽个体数量:按该层所占总体的比例计算.
    (2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
    (3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”.
    提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·eq \f(Ni,N)(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
    (二)用样本估计总体
    1.频率、频数、样本容量的计算方法
    (1)eq \f(频率,组距)×组距=频率.
    (2)eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,
    样本容量×频率=频数.
    (3)各个小方形的面积总和等于1 .
    2.频率分布表的画法
    第一步:求极差,决定组数和组距,组距=极差/组数;
    第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
    第三步:登记频数,计算频率,列出频率分布表.
    3.频率分布直方图中数字特征的计算
    (1)最高的小长方形底边中点的横坐标即是众数.
    (2)中位数左边和右边的小长方形的面积和是相等的.
    (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
    (4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.
    4.茎叶图
    茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
    ①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
    ②茎叶图上重复出现的数据要重复记录,不能遗漏.
    (三)中位数、众数、平均数、方差、标准差、百分位
    1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
    2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
    平均数:反应一组数据的平均水平;
    3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差的简化计算公式:s2=eq \f(1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-n eq \x\t(x)2]或写成s2=eq \f(1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \x\t(x)2,即方差等于原数据平方的平均数减去平均数的平方.
    4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
    5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
    (四)回归分析
    1.两个变量的线性相关
    (1)正相关
    在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
    (2)负相关
    在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
    (3)线性相关关系、回归直线
    如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
    2.回归方程
    (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
    (2)回归方程:方程eq \(y,\s\up7(^))=eq \(b,\s\up7(^))x+eq \(a,\s\up7(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq \(a,\s\up7(^)),eq \(b,\s\up7(^))是待定参数.
    3.回归分析
    (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
    (2)样本点的中心
    对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中称为样本点的中心,即回归直线经过点.
    (3)相关系数
    当r>0时,表明两个变量正相关;
    当r<0时,表明两个变量负相关.
    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
    (4)常用结论
    = 1 \* GB3 ①回归直线必过样本点的中心.
    = 2 \* GB3 ②当两个变量的相关系数|r|=1时,两个变量呈函数关系.
    (五)独立性检验
    1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
    2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
    2×2列联表
    构造一个随机变量,其中为样本容量.
    【典型考题解析】
    热点一 随机抽样
    【典例1】(2023·全国高一课时练习)某班有30位同学,他们依次编号为01,02,,29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第7列和第8列数字开始,由左到右依次选取两个数字,则选出来的第5位同学的编号为( )
    A.08B.21C.09D.29
    【典例2】(2023·天津·高考真题(文))2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.
    (Ⅰ)应从老、中、青员工中分别抽取多少人?
    (Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
    (i)试用所给字母列举出所有可能的抽取结果;
    (ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.
    【总结提升】
    1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
    2. 分层抽样的前提和遵循的两条原则
    (1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
    (2)遵循的两条原则:
    ①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
    ②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
    热点二 频率分布直方图
    【典例3】(2023·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
    A.8B.12C.16D.18
    【典例4】(2023·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中不正确的是( )
    A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
    B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
    C.估计该地农户家庭年收入的平均值不超过6.5万元
    D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    【典例5】(2023·全国高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
    记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
    (1)求乙离子残留百分比直方图中的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    1.两个主要考查角度:
    (1)利用频率分布直方图求频率、频数.
    (2)利用频率分布直方图估计总体
    2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
    (2) eq \f(频率,组距)×组距=频率;
    (3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数
    3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率
    热点三 样本的数字特征
    【典例6】(2023·全国·高考真题(理))某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
    则( )
    A.讲座前问卷答题的正确率的中位数小于
    B.讲座后问卷答题的正确率的平均数大于
    C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
    D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
    【典例7】(2023·全国·高考真题(文))分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
    则下列结论中错误的是( )
    A.甲同学周课外体育运动时长的样本中位数为7.4
    B.乙同学周课外体育运动时长的样本平均数大于8
    C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
    D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
    【典例8】【多选题】(2023·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
    A.两组样本数据的样本平均数相同
    B.两组样本数据的样本中位数相同
    C.两组样本数据的样本标准差相同
    D.两组样本数据的样本极差相同
    【典例9】(2023·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
    旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
    (1)求,,,;
    (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
    【总结提升】
    主要命题角度有三个:
    (1)样本的数字特征与频率分布直方图交汇
    (2)样本的数字特征与茎叶图交汇
    = 1 \* GB3 ①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
    = 2 \* GB3 ②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.
    (3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
    = 1 \* GB3 ①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
    = 2 \* GB3 ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
    热点四 相关关系的判断
    【典例10】(江西·高考真题(理))变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 ( )
    A.B.C.D.
    【典例11】(宁夏·高考真题(理))对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断.
    A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关
    C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关
    【规律方法】
    判定两个变量正、负相关的方法
    (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
    (2)相关系数:r>0时,正相关;r<0时,负相关.
    (3)线性回归直线方程中:eq \(b,\s\up7(^))>0时,正相关;eq \(b,\s\up7(^))<0时,负相关.
    热点五 回归分析
    【典例12】(2023·全国·高考真题(文))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
    并计算得.
    (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
    (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
    附:相关系数.
    【典例13】(全国·高考真题(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
    表中,=
    (Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
    (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
    (Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
    (ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
    (ⅱ)年宣传费x为何值时,年利润的预报值最大?
    附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
    【规律方法】
    1.用最小二乘法求线性回归方程的步骤
    2.线性回归分析中,只需利用公式求出回归直线方程并利用其进行预测即可(注意回归直线过样本点的中心),利用回归方程进行预测,常把线性回归方程看作一次函数,求函数值.利用回归直线方程求出的是估算值,非准确值.
    3.对于非线性回归分析问题,应先进行变量代换,求出代换后的回归直线方程,再求非线性回归方程.
    热点六 独立性检验
    【典例14】(2023·全国·高考真题(文))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
    (1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
    (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
    附:,
    【典例15】(2023·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
    (1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
    (2)根据所给数据,完成下面的列联表:
    (3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
    附:,
    【规律方法】
    1.比较几个分类变量有关联的可能性大小的方法
    (1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.
    (2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.
    2.独立性检验的一般步骤
    (1)根据样本数据制成2×2列联表.
    (2)根据公式计算K2的观测值k.
    (3)比较观测值k与临界值的大小关系,作统计推断.
    3.独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.
    【精选精练】
    一、单选题
    1.(2023·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
    A.当,时,二氧化碳处于液态
    B.当,时,二氧化碳处于气态
    C.当,时,二氧化碳处于超临界状态
    D.当,时,二氧化碳处于超临界状态
    2.(2023·安徽·高三开学考试)下图是国家统计局年月发布的规模以上工业日均原油产量(单位:万吨)的月度走势情况,现有如下说法:
    ①年月至年月,规模以上工业原油的日均产量的极差为;
    ②从年月至年月中随机抽取个月份,月增速超过的概率为;
    ③年月份,规模以上工业原油总产量约为万吨;
    则说法错误的个数为( )
    A.B.C.D.
    3.(2023·浙江·高三开学考试)某学校食堂为了解学生对食堂的满意度,从高一、高二两个年级分别随机调查了100名学生,根据学生对食堂的满意度评分,分别得到高一和高二学生满意度评分的频率分布直方图.
    若高一和高二学生的满意度评分中位数分别为,平均数分别为,则( )
    A.B.
    C.D.
    4.(2023·河南·上蔡县衡水实验中学高三阶段练习(理))若由一个列联表中的数据计算得,则有( )把握认为两个变量有关系.
    A.95%B.97.5%C.99%D.99.9%
    5.(2023·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关指数,则线性相关程度最高的是( )
    A.甲B.乙C.丙D.丁
    6.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
    则该单位党员一周学习党史时间的众数及第50百分位数分别是( )A.8,8.5B.8,8C.9,8D.8,9
    7.(2023·江西·二模(文))千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
    并计算得到,下列小明对地区天气判断正确的是( )A.夜晚下雨的概率约为
    B.未出现“日落云里走”,但夜晚下雨的概率约为
    C.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
    D.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
    8.(2023·河南·商丘市第一高级中学高三开学考试(文))已知具有线性相关关系的变量x,y,设其样本点为,回归直线方程为,若,,则( )
    A.40B.-17C.-170D.4
    二、多选题
    9.(2023·全国·高考真题)下列统计量中,能度量样本的离散程度的是( )
    A.样本的标准差B.样本的中位数
    C.样本的极差D.样本的平均数
    10.(2023·全国·高三专题练习)某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
    A.这组数据的平均数为6B.这组数据的众数为7
    C.这组数据的极差为6D.这组数据的75%分位数为9
    11.(2023·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
    A.这11天复工指数和复产指数均逐日增加;
    B.这11天期间,复产指数增量大于复工指数的增量;
    C.第3天至第11天复工复产指数均超过80%;
    D.第9天至第11天复产指数增量大于复工指数的增量;
    12.(2023·福建·厦门一中模拟预测)某市为了研究该市空气中的PM2.5浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和浓度(单位:),得到如下所示的2×2列联表:
    经计算,则可以推断出( )
    附:
    A.该市一天空气中PM2.5浓度不超过,且浓度不超过的概率估计值是0.64
    B.若2×2列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
    C.有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关
    D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与浓度有关
    三、填空题
    13.(2023·全国·高考真题(文))我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
    14.(2023·湖南湘潭·高三开学考试)某灯泡厂对编号为 的十五个灯泡进行使用寿命试验, 得到奇数号灯泡的平均使用寿命 (单位: 小时)为 1580 , 方差为 15000 , 偶数号灯泡的平均使用寿命为 1580 , 方差为 12000 ,则这十五个灯泡的使用寿命的方差为_______.
    15.(2023·湖南湘潭·高三开学考试)某灯泡厂对编号为 的十五个灯泡进行使用寿命试验, 得到奇数号灯泡的平均使用寿命 (单位: 小时)为 1580 , 方差为 15000 , 偶数号灯泡的平均使用寿命为 1580 , 方差为 12000 ,则这十五个灯泡的使用寿命的方差为_______.
    16.(2023·全国·高三专题练习)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
    根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则;③可以利用回归直线方程,准确地得到当羊只数量为万只时的草地植被指数.以上判断中正确的个数是________.
    四、解答题
    17.(2023·全国·高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
    记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
    (1)求乙离子残留百分比直方图中的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    18.(2023·全国·高考真题(文))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
    并计算得.
    (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
    (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
    附:相关系数.
    19.(2023·四川省仁寿县文宫中学高三开学考试(理))为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:
    现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为.
    (1)求列联表中的数据,,,的值;
    (2)能够有多大把握认为疫苗有效?
    附:
    20.(2023·江西·高三开学考试(文))2022年6月17日,我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,这是我国完全自主设计建造的首艘弹射型航空母舰,采用平直通长飞行甲板,配置电磁弹射和阻拦装置,满载排水量8万余吨.“福建舰”的建成,下水及试航,是新时代中国强军建设的重要成果.某校为纪念“福建舰”下水试航,增强学生的国防意识,组织了一次国防知识竞赛,共有100名学生参赛,成绩均在区间上,现将成绩制成如图所示频率分布直方图(每组均包括左端点,最后一组包括右端点).
    (1)学校计划对成绩不低于平均分的参赛学生进行奖励,若同一组中的数据用该组区间的中点值为代表,试求受奖励的分数线的估计值;
    (2)对这100名参赛学生的成绩按参赛者的性别统计,成绩不低于80分的为“良好”,低于80分的为“不良好”得到如下未填写完整的列联表.
    (ⅰ)将列联表填写完整;
    (ⅱ)是否有95%以上的把握认为参赛学生的成绩是否良好与性别有关?
    附:.
    y1
    y2
    总计
    x1
    a
    b
    a+b
    x2
    c
    d
    c+d
    总计
    a+c
    b+d
    a+b+c+d
    41792
    71635
    86089
    32157
    95620
    92109
    29145
    74955
    82835
    98378
    83513
    47870
    20799
    32122
    员工项目
    A
    B
    C
    D
    E
    F
    子女教育


    ×

    ×

    继续教育
    ×
    ×

    ×


    大病医疗
    ×
    ×
    ×

    ×
    ×
    住房贷款利息


    ×
    ×


    住房租金
    ×
    ×

    ×
    ×
    ×
    赡养老人


    ×
    ×
    ×

    旧设备
    9.8
    10.3
    10.0
    10.2
    9.9
    9.8
    10.0
    10.1
    10.2
    9.7
    新设备
    10.1
    10.4
    10.1
    10.0
    10.1
    10.3
    10.6
    10.5
    10.4
    10.5
    样本号i
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    总和
    根部横截面积
    0.04
    0.06
    0.04
    0.08
    0.08
    0.05
    0.05
    0.07
    0.07
    0.06
    0.6
    材积量
    0.25
    0.40
    0.22
    0.54
    0.51
    0.34
    0.36
    0.46
    0.42
    0.40
    3.9
    46.6
    563
    6.8
    289.8
    1.6
    1469
    108.8
    准点班次数
    未准点班次数
    A
    240
    20
    B
    210
    30
    0.100
    0.050
    0.010
    2.706
    3.841
    6.635

    32
    18
    4
    6
    8
    12
    3
    7
    10

    0.050
    0.010
    0.001
    3.841
    6.635
    10.828
    0.25
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    1.323
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828




    0.87
    0.91
    0.58
    0.83
    党史学习时间(小时)
    7
    8
    9
    10
    11
    党员人数
    6
    10
    9
    7
    8
    夜晚天气
    日落云里走
    下雨
    不下雨
    出现
    25
    5
    不出现
    25
    45
    临界值表
    0.10
    0.05
    0.010
    0.001
    2.706
    3.841
    6.635
    10.828
    7
    8
    9
    7
    5
    4
    10
    9
    4
    7
    PM2.5
    64
    16
    10
    10
    0.050
    0.010
    0.001
    3.841
    6.635
    10.828
    年份
    1
    2
    3
    4
    5
    羊只数量/万只
    1.4
    0.9
    0.75
    0.6
    0.3
    草地植被指数
    1.1
    4.3
    15.6
    31.3
    49.7
    样本号i
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    总和
    根部横截面积
    0.04
    0.06
    0.04
    0.08
    0.08
    0.05
    0.05
    0.07
    0.07
    0.06
    0.6
    材积量
    0.25
    0.40
    0.22
    0.54
    0.51
    0.34
    0.36
    0.46
    0.42
    0.40
    3.9
    未发病
    发病
    合计
    未注射疫苗
    注射疫苗
    合计
    良好
    不良好
    合计

    48

    16
    合计
    0.050
    0.010
    0.001
    k
    3.841
    6.635
    10.828
    专题40 统计、统计案例
    【热点聚焦】
    主要以生活中的实际问题为背景,考查随机抽样与样本估计总体、线性回归方程的求解与运用、独立性检验问题.统计与统计案例的命题,一般以一道小题、一道大题的形式考查,难度中等.
    【重点知识回眸】
    (一)随机抽样
    1.简单随机抽样的特点
    (1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
    2.抽签法与随机数法的适用情况
    (1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
    (2)一个抽样试验能否用抽签法,关键看两点:
    一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
    3.分层抽样问题类型及解题思路
    (1)求某层应抽个体数量:按该层所占总体的比例计算.
    (2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
    (3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”.
    提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·eq \f(Ni,N)(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
    (二)用样本估计总体
    1.频率、频数、样本容量的计算方法
    (1)eq \f(频率,组距)×组距=频率.
    (2)eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,
    样本容量×频率=频数.
    (3)各个小方形的面积总和等于1 .
    2.频率分布表的画法
    第一步:求极差,决定组数和组距,组距=极差/组数;
    第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
    第三步:登记频数,计算频率,列出频率分布表.
    3.频率分布直方图中数字特征的计算
    (1)最高的小长方形底边中点的横坐标即是众数.
    (2)中位数左边和右边的小长方形的面积和是相等的.
    (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
    (4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.
    4.茎叶图
    茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
    ①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
    ②茎叶图上重复出现的数据要重复记录,不能遗漏.
    (三)中位数、众数、平均数、方差、标准差、百分位
    1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
    2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
    平均数:反应一组数据的平均水平;
    3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差的简化计算公式:s2=eq \f(1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-n eq \x\t(x)2]或写成s2=eq \f(1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \x\t(x)2,即方差等于原数据平方的平均数减去平均数的平方.
    4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
    5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
    (四)回归分析
    1.两个变量的线性相关
    (1)正相关
    在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
    (2)负相关
    在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
    (3)线性相关关系、回归直线
    如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
    2.回归方程
    (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
    (2)回归方程:方程eq \(y,\s\up7(^))=eq \(b,\s\up7(^))x+eq \(a,\s\up7(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq \(a,\s\up7(^)),eq \(b,\s\up7(^))是待定参数.
    3.回归分析
    (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
    (2)样本点的中心
    对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中称为样本点的中心,即回归直线经过点.
    (3)相关系数
    当r>0时,表明两个变量正相关;
    当r<0时,表明两个变量负相关.
    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
    (4)常用结论
    = 1 \* GB3 ①回归直线必过样本点的中心.
    = 2 \* GB3 ②当两个变量的相关系数|r|=1时,两个变量呈函数关系.
    (五)独立性检验
    1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
    2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
    2×2列联表
    构造一个随机变量,其中为样本容量.
    【典型考题解析】
    热点一 随机抽样
    【典例1】(2023·全国高一课时练习)某班有30位同学,他们依次编号为01,02,,29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第7列和第8列数字开始,由左到右依次选取两个数字,则选出来的第5位同学的编号为( )
    A.08B.21C.09D.29
    答案:D
    分析:
    利用随机数表的选取方法选出有效的编号,即可得解.
    【详解】
    依次从数表中读出的有效编号为:16,08,21,09,21,09,29,去掉重复的,得到选出来的第5位同学的编号为29.
    故选:D.
    【典例2】(2023·天津·高考真题(文))2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.
    (Ⅰ)应从老、中、青员工中分别抽取多少人?
    (Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
    (i)试用所给字母列举出所有可能的抽取结果;
    (ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.
    答案:(I)6人,9人,10人;
    (II)(i)见解析;(ii).
    分析:(I)根据题中所给的老、中、青员工人数,求得人数比,利用分层抽样要求每个个体被抽到的概率是相等的,结合样本容量求得结果;
    (II)(I)根据6人中随机抽取2人,将所有的结果一一列出;
    (ii)根据题意,找出满足条件的基本事件,利用公式求得概率.
    【详解】(I)由已知,老、中、青员工人数之比为,
    由于采取分层抽样的方法从中抽取25位员工,
    因此应从老、中、青员工中分别抽取6人,9人,10人.
    (II)(i)从已知的6人中随机抽取2人的所有可能结果为
    ,,,,共15种;
    (ii)由表格知,符合题意的所有可能结果为,,,,共11种,
    所以,事件M发生的概率.
    【总结提升】
    1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
    2. 分层抽样的前提和遵循的两条原则
    (1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
    (2)遵循的两条原则:
    ①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
    ②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
    热点二 频率分布直方图
    【典例3】(2023·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
    A.8B.12C.16D.18
    答案:B
    分析:结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结果.
    【详解】志愿者的总人数为=50,
    所以第三组人数为50×0.36=18,
    有疗效的人数为18-6=12.
    故选:B.
    【典例4】(2023·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中不正确的是( )
    A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
    B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
    C.估计该地农户家庭年收入的平均值不超过6.5万元
    D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    答案:C
    分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
    【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
    该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
    该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
    该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
    该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
    综上,给出结论中不正确的是C.
    故选:C.
    【典例5】(2023·全国高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
    记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
    (1)求乙离子残留百分比直方图中的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    答案:(1) ,;(2) ,.
    分析:
    (1)由及频率和为1可解得和的值;(2)根据公式求平均数.
    【详解】
    (1)由题得,解得,由,解得.
    (2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
    乙离子残留百分比的平均值为
    【总结提升】
    1.两个主要考查角度:
    (1)利用频率分布直方图求频率、频数.
    (2)利用频率分布直方图估计总体
    2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
    (2) eq \f(频率,组距)×组距=频率;
    (3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数
    3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率
    热点三 样本的数字特征
    【典例6】(2023·全国·高考真题(理))某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
    则( )
    A.讲座前问卷答题的正确率的中位数小于
    B.讲座后问卷答题的正确率的平均数大于
    C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
    D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
    答案:B
    分析:由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
    【详解】讲座前中位数为,所以错;
    讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;
    讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
    讲座后问卷答题的正确率的极差为,
    讲座前问卷答题的正确率的极差为,所以错.
    故选:B.
    【典例7】(2023·全国·高考真题(文))分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
    则下列结论中错误的是( )
    A.甲同学周课外体育运动时长的样本中位数为7.4
    B.乙同学周课外体育运动时长的样本平均数大于8
    C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
    D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
    答案:C
    分析:结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.
    【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为,A选项结论正确.
    对于B选项,乙同学课外体育运动时长的样本平均数为:

    B选项结论正确.
    对于C选项,甲同学周课外体育运动时长大于的概率的估计值,
    C选项结论错误.
    对于D选项,乙同学周课外体育运动时长大于的概率的估计值,
    D选项结论正确.
    故选:C
    【典例8】【多选题】(2023·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
    A.两组样本数据的样本平均数相同
    B.两组样本数据的样本中位数相同
    C.两组样本数据的样本标准差相同
    D.两组样本数据的样本极差相同
    答案:CD
    分析:A、C利用两组数据的线性关系有、,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.
    【详解】A:且,故平均数不相同,错误;
    B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;
    C:,故方差相同,正确;
    D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;
    故选:CD
    【典例9】(2023·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
    旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
    (1)求,,,;
    (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
    答案:(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
    分析:(1)根据平均数和方差的计算方法,计算出平均数和方差.
    (2)根据题目所给判断依据,结合(1)的结论进行判断.
    【详解】(1),


    .
    (2)依题意,,,
    ,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
    【总结提升】
    主要命题角度有三个:
    (1)样本的数字特征与频率分布直方图交汇
    (2)样本的数字特征与茎叶图交汇
    = 1 \* GB3 ①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
    = 2 \* GB3 ②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.
    (3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
    = 1 \* GB3 ①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
    = 2 \* GB3 ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
    热点四 相关关系的判断
    【典例10】(江西·高考真题(理))变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 ( )
    A.B.C.D.
    答案:C
    【详解】
    第一组变量正相关,第二组变量负相关.
    【典例11】(宁夏·高考真题(理))对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断.
    A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关
    C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关
    答案:C
    【详解】变量x 与中y随x增大而减小,为负相关;u 与v中,u 随v的增大而增大,为正相关.
    【规律方法】
    判定两个变量正、负相关的方法
    (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
    (2)相关系数:r>0时,正相关;r<0时,负相关.
    (3)线性回归直线方程中:eq \(b,\s\up7(^))>0时,正相关;eq \(b,\s\up7(^))<0时,负相关.
    热点五 回归分析
    【典例12】(2023·全国·高考真题(文))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
    并计算得.
    (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
    (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
    附:相关系数.
    答案:(1);
    (2)
    (3)
    分析:(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)代入题给相关系数公式去计算即可求得样本的相关系数值;
    (3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.
    (1)
    样本中10棵这种树木的根部横截面积的平均值
    样本中10棵这种树木的材积量的平均值
    据此可估计该林区这种树木平均一棵的根部横截面积为,
    平均一棵的材积量为
    (2)

    (3)
    设该林区这种树木的总材积量的估计值为,
    又已知树木的材积量与其根部横截面积近似成正比,
    可得,解之得.
    则该林区这种树木的总材积量估计为
    【典例13】(全国·高考真题(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
    表中,=
    (Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
    (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
    (Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
    (ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
    (ⅱ)年宣传费x为何值时,年利润的预报值最大?
    附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
    答案:(Ⅰ);(Ⅱ);(Ⅲ)(ⅰ);(ⅱ)46.24
    【详解】(Ⅰ)由散点图可以判断,适合作为年销售关于年宣传费用的回归方程类型.
    (Ⅱ)令,先建立关于的线性回归方程,由于=,
    ∴=563-68×6.8=100.6.
    ∴关于的线性回归方程为,
    ∴关于的回归方程为.
    (Ⅲ)(ⅰ)由(Ⅱ)知,当=49时,年销售量的预报值
    =576.6,
    年利润的预报值.
    (ⅱ)根据(Ⅱ)的结果知,年利润z的预报值

    ∴当=,即时,取得最大值.
    故宣传费用为46.24千元时,年利润的预报值最大.
    【规律方法】
    1.用最小二乘法求线性回归方程的步骤
    2.线性回归分析中,只需利用公式求出回归直线方程并利用其进行预测即可(注意回归直线过样本点的中心),利用回归方程进行预测,常把线性回归方程看作一次函数,求函数值.利用回归直线方程求出的是估算值,非准确值.
    3.对于非线性回归分析问题,应先进行变量代换,求出代换后的回归直线方程,再求非线性回归方程.
    热点六 独立性检验
    【典例14】(2023·全国·高考真题(文))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
    (1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
    (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
    附:,
    答案:(1)A,B两家公司长途客车准点的概率分别为,
    (2)有
    分析:(1)根据表格中数据以及古典概型的概率公式可求得结果;
    (2)根据表格中数据及公式计算,再利用临界值表比较即可得结论.
    (1)
    根据表中数据,A共有班次260次,准点班次有240次,
    设A家公司长途客车准点事件为M,
    则;
    B共有班次240次,准点班次有210次,
    设B家公司长途客车准点事件为N,
    则.
    A家公司长途客车准点的概率为;
    B家公司长途客车准点的概率为.
    (2)
    列联表
    =,
    根据临界值表可知,有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
    【典例15】(2023·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
    (1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
    (2)根据所给数据,完成下面的列联表:
    (3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
    附:,
    答案:(1);(2)答案见解析;(3)有.
    分析:(1)根据表格中数据以及古典概型的概率公式可求得结果;
    (2)根据表格中数据可得列联表;
    (3)计算出,结合临界值表可得结论.
    【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
    所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
    (2)由所给数据,可得列联表为:
    (3)根据列联表中的数据可得

    因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
    【规律方法】
    1.比较几个分类变量有关联的可能性大小的方法
    (1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.
    (2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.
    2.独立性检验的一般步骤
    (1)根据样本数据制成2×2列联表.
    (2)根据公式计算K2的观测值k.
    (3)比较观测值k与临界值的大小关系,作统计推断.
    3.独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.
    【精选精练】
    一、单选题
    1.(2023·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
    A.当,时,二氧化碳处于液态
    B.当,时,二氧化碳处于气态
    C.当,时,二氧化碳处于超临界状态
    D.当,时,二氧化碳处于超临界状态
    答案:D
    分析:根据与的关系图可得正确的选项.
    【详解】当,时,,此时二氧化碳处于固态,故A错误.
    当,时,,此时二氧化碳处于液态,故B错误.
    当,时,与4非常接近,故此时二氧化碳处于固态,对应的是非超临界状态,故C错误.
    当,时,因, 故此时二氧化碳处于超临界状态,故D正确.
    故选:D
    2.(2023·安徽·高三开学考试)下图是国家统计局年月发布的规模以上工业日均原油产量(单位:万吨)的月度走势情况,现有如下说法:
    ①年月至年月,规模以上工业原油的日均产量的极差为;
    ②从年月至年月中随机抽取个月份,月增速超过的概率为;
    ③年月份,规模以上工业原油总产量约为万吨;
    则说法错误的个数为( )
    A.B.C.D.
    答案:B
    分析:根据统计图表,由极差定义可知①正确;根据年月至年月中,月增速超过的月份的个数,结合古典概型概率公式可知②错误;由日均产量估计月产量即可知③正确.
    【详解】对于①,年月至年月,规模以上工业原油的日均产量的极差为,①正确;
    对于②,年月至年月中,月增速超过超过的月份有月、月和月,
    随机抽取个月,月增速超过超过的概率为,②错误;
    对于③,年月份,规模以上工业原油总产量约为万吨,③正确.
    故选:B.
    3.(2023·浙江·高三开学考试)某学校食堂为了解学生对食堂的满意度,从高一、高二两个年级分别随机调查了100名学生,根据学生对食堂的满意度评分,分别得到高一和高二学生满意度评分的频率分布直方图.
    若高一和高二学生的满意度评分中位数分别为,平均数分别为,则( )
    A.B.
    C.D.
    答案:C
    分析:分别求出满意度评分中位数分别为,平均数分别为,即可比较大小.
    【详解】由频率分布直方图,进行数据分析可得:
    .
    .
    所以满意度评分中位数.
    .
    所以满意度评分平均数.
    故选:C
    4.(2023·河南·上蔡县衡水实验中学高三阶段练习(理))若由一个列联表中的数据计算得,则有( )把握认为两个变量有关系.
    A.95%B.97.5%C.99%D.99.9%
    答案:C
    分析:利用独立性检验的观测值对应临界表可得答案.
    【详解】解:由于,
    因为,
    则,
    那么有的把握认为两个变量有关系.
    故选:C.
    5.(2023·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关指数,则线性相关程度最高的是( )
    A.甲B.乙C.丙D.丁
    答案:B
    分析:利用相关指数的性质,通过比较四位同学的,即可得到线性相关程度最高的同学
    【详解】越接近于1,两个变量的线性相关程度越高.
    ,则线性相关程度最高的是乙
    故选:B.
    6.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
    则该单位党员一周学习党史时间的众数及第50百分位数分别是( )A.8,8.5B.8,8C.9,8D.8,9
    答案:D
    分析:众数是出现次数最多的,百分位数根据从小到大排列后,根据计算即可求解
    【详解】解:党员人数一共有,学习党史事件为8小时的人数最多,故学习党史时间的众数为8,
    ,那么第50百分位数是第20和21个数的平均数,第20,21个数分别为9,9,所以第50百分位数是,
    故选:D
    7.(2023·江西·二模(文))千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
    并计算得到,下列小明对地区天气判断正确的是( )A.夜晚下雨的概率约为
    B.未出现“日落云里走”,但夜晚下雨的概率约为
    C.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
    D.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
    答案:D
    分析:根据表中数据,即可对A,B选项判断,根据对立性检验即可判断C,D.
    【详解】根据表中数据可知,夜晚下雨的概率约为,所以A错.
    未出现“日落云里走”,但夜晚下雨的概率约为,故B错.
    ,对照临界值表可知,有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,但不能说有99.9%的把握认为夜晚会下雨,故C错,D对.
    故选:D
    8.(2023·河南·商丘市第一高级中学高三开学考试(文))已知具有线性相关关系的变量x,y,设其样本点为,回归直线方程为,若,,则( )
    A.40B.-17C.-170D.4
    答案:D
    分析:求出样本中心点,代入求解出.
    【详解】由于,
    ∴,.
    将(3,10)代入,
    ∴,解得:.
    故选:D.
    二、多选题
    9.(2023·全国·高考真题)下列统计量中,能度量样本的离散程度的是( )
    A.样本的标准差B.样本的中位数
    C.样本的极差D.样本的平均数
    答案:AC
    分析:考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
    【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
    由中位数的定义可知,中位数考查的是数据的集中趋势;
    由极差的定义可知,极差考查的是数据的离散程度;
    由平均数的定义可知,平均数考查的是数据的集中趋势;
    故选:AC.
    10.(2023·全国·高三专题练习)某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
    A.这组数据的平均数为6B.这组数据的众数为7
    C.这组数据的极差为6D.这组数据的75%分位数为9
    答案:BCD
    分析:由平均数、众数、极差、百分位数的定义即可得出答案.
    【详解】这组数从小到大排列为:4,4,5,7,7,7,8,9,9,10,
    计算这组数据的平均数为,选项A错误;
    这组数据的众数是7,选项B正确;
    这组数据的极差是,选项C正确;
    因为10×75%=7.5,且第8个数是9,所以这组数据的75%分位数为9,选项D正确.
    故选:BCD.
    11.(2023·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
    A.这11天复工指数和复产指数均逐日增加;
    B.这11天期间,复产指数增量大于复工指数的增量;
    C.第3天至第11天复工复产指数均超过80%;
    D.第9天至第11天复产指数增量大于复工指数的增量;
    答案:CD
    分析:注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确.
    【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;
    由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;
    由图可知,第3天至第11天复工复产指数均超过80%,故C正确;
    由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;
    12.(2023·福建·厦门一中模拟预测)某市为了研究该市空气中的PM2.5浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和浓度(单位:),得到如下所示的2×2列联表:
    经计算,则可以推断出( )
    附:
    A.该市一天空气中PM2.5浓度不超过,且浓度不超过的概率估计值是0.64
    B.若2×2列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
    C.有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关
    D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与浓度有关
    答案:ACD
    分析:对于A选项,根据表格,进行数据分析,直接求概率;
    对于B,C,D选项,进行独立性检验,计算后对照参数下结论.
    【详解】补充完整列联表如下:
    对于A选项,该市一天中,空气中PM2.5浓度不超过,且浓度不超过的概率估计值为,故A正确;
    对于B选项,,故B不正确;
    因为7.4844>6.635,根据临界值表可知,在犯错的概率不超过1%的条件下,即有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关,故C,D均正确.
    故选:ACD.
    三、填空题
    13.(2023·全国·高考真题(文))我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
    答案:0.98.
    分析:本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.
    【详解】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为.
    【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.
    14.(2023·湖南湘潭·高三开学考试)某灯泡厂对编号为 的十五个灯泡进行使用寿命试验, 得到奇数号灯泡的平均使用寿命 (单位: 小时)为 1580 , 方差为 15000 , 偶数号灯泡的平均使用寿命为 1580 , 方差为 12000 ,则这十五个灯泡的使用寿命的方差为_______.
    答案:
    分析:根据题意求得平均使用寿命为,结合方差的公式,即可求解.
    【详解】由题意,十五个灯泡的平均使用寿命为,
    所以方差.
    故答案为:.
    15.(2023·湖南湘潭·高三开学考试)某灯泡厂对编号为 的十五个灯泡进行使用寿命试验, 得到奇数号灯泡的平均使用寿命 (单位: 小时)为 1580 , 方差为 15000 , 偶数号灯泡的平均使用寿命为 1580 , 方差为 12000 ,则这十五个灯泡的使用寿命的方差为_______.
    答案:
    分析:根据题意求得平均使用寿命为,结合方差的公式,即可求解.
    【详解】由题意,十五个灯泡的平均使用寿命为,
    所以方差.
    故答案为:.
    16.(2023·全国·高三专题练习)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
    根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则;③可以利用回归直线方程,准确地得到当羊只数量为万只时的草地植被指数.以上判断中正确的个数是________.
    答案:
    分析:羊只数量与草地植被指数是相关关系可判断①;因为是离群值,去掉后相关性更强可判断②;由回归直线可得预测值可判断③;进而可得正确答案.
    【详解】对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;
    对于②,用这五组数据得到的两变量间的相关系数为,因为第一年数据是离群值,去掉后得到的相关系数为,其相关性更强,所以,故②正确;
    对于③,利用回归直线方程,不能准确得到当羊只数量为万只时的草地植被指数,得到的只是预测值,故③错误.
    综上所述,正确的判断序号是②,共个,
    故答案为:.
    四、解答题
    17.(2023·全国·高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
    记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
    (1)求乙离子残留百分比直方图中的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    答案:(1) ,;(2) ,.
    分析:(1)由及频率和为1可解得和的值;(2)根据公式求平均数.
    【详解】(1)由题得,解得,由,解得.
    (2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
    乙离子残留百分比的平均值为
    18.(2023·全国·高考真题(文))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
    并计算得.
    (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
    (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
    附:相关系数.
    答案:(1);
    (2)
    (3)
    分析:(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)代入题给相关系数公式去计算即可求得样本的相关系数值;
    (3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.
    (1)
    样本中10棵这种树木的根部横截面积的平均值
    样本中10棵这种树木的材积量的平均值
    据此可估计该林区这种树木平均一棵的根部横截面积为,
    平均一棵的材积量为
    (2)

    (3)
    设该林区这种树木的总材积量的估计值为,
    又已知树木的材积量与其根部横截面积近似成正比,
    可得,解之得.
    则该林区这种树木的总材积量估计为
    19.(2023·四川省仁寿县文宫中学高三开学考试(理))为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:
    现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为.
    (1)求列联表中的数据,,,的值;
    (2)能够有多大把握认为疫苗有效?
    附:
    答案:(1),,,
    (2)有%的把握认为疫苗有效
    分析:(1)根据古典概型的方法可得,在代入列联表计算即可;
    (2)计算卡方对比表中数据判断即可.
    (1)
    设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件,由已知得,所以,代入可得,,.
    (2)

    所以有%的把握认为疫苗有效.
    20.(2023·江西·高三开学考试(文))2022年6月17日,我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,这是我国完全自主设计建造的首艘弹射型航空母舰,采用平直通长飞行甲板,配置电磁弹射和阻拦装置,满载排水量8万余吨.“福建舰”的建成,下水及试航,是新时代中国强军建设的重要成果.某校为纪念“福建舰”下水试航,增强学生的国防意识,组织了一次国防知识竞赛,共有100名学生参赛,成绩均在区间上,现将成绩制成如图所示频率分布直方图(每组均包括左端点,最后一组包括右端点).
    (1)学校计划对成绩不低于平均分的参赛学生进行奖励,若同一组中的数据用该组区间的中点值为代表,试求受奖励的分数线的估计值;
    (2)对这100名参赛学生的成绩按参赛者的性别统计,成绩不低于80分的为“良好”,低于80分的为“不良好”得到如下未填写完整的列联表.
    (ⅰ)将列联表填写完整;
    (ⅱ)是否有95%以上的把握认为参赛学生的成绩是否良好与性别有关?
    附:.
    答案:(1)73.8
    (2)(ⅰ)表格见解析;(ⅱ)没有,理由见解析.
    分析:(1)利用频率之和为1列出方程,求出,进而利用中间值求出平均值,得到受奖励的分数线的估计值为73.8;
    (2)完善列联表,计算出卡方,与3.841比较得到结论.
    (1)
    由频率分布直方图可知:,
    解得.
    所以平均分的估计值为,
    故受奖励的分数线的估计值为73.8.
    (2)
    (ⅰ)列联表如下表所示.
    (ⅱ)由列联表得,
    所以没有95%以上的把握认为参赛学生的成绩是否良好与性别有关.
    y1
    y2
    总计
    x1
    a
    b
    a+b
    x2
    c
    d
    c+d
    总计
    a+c
    b+d
    a+b+c+d
    41792
    71635
    86089
    32157
    95620
    92109
    29145
    74955
    82835
    98378
    83513
    47870
    20799
    32122
    员工项目
    A
    B
    C
    D
    E
    F
    子女教育


    ×

    ×

    继续教育
    ×
    ×

    ×


    大病医疗
    ×
    ×
    ×

    ×
    ×
    住房贷款利息


    ×
    ×


    住房租金
    ×
    ×

    ×
    ×
    ×
    赡养老人


    ×
    ×
    ×

    旧设备
    9.8
    10.3
    10.0
    10.2
    9.9
    9.8
    10.0
    10.1
    10.2
    9.7
    新设备
    10.1
    10.4
    10.1
    10.0
    10.1
    10.3
    10.6
    10.5
    10.4
    10.5
    样本号i
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    总和
    根部横截面积
    0.04
    0.06
    0.04
    0.08
    0.08
    0.05
    0.05
    0.07
    0.07
    0.06
    0.6
    材积量
    0.25
    0.40
    0.22
    0.54
    0.51
    0.34
    0.36
    0.46
    0.42
    0.40
    3.9
    46.6
    563
    6.8
    289.8
    1.6
    1469
    108.8
    准点班次数
    未准点班次数
    A
    240
    20
    B
    210
    30
    0.100
    0.050
    0.010
    2.706
    3.841
    6.635
    准点班次数
    未准点班次数
    合计
    A
    240
    20
    260
    B
    210
    30
    240
    合计
    450
    50
    500

    32
    18
    4
    6
    8
    12
    3
    7
    10

    0.050
    0.010
    0.001
    3.841
    6.635
    10.828
    合计
    64
    16
    80
    10
    10
    20
    合计
    74
    26
    100
    0.25
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    1.323
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828




    0.87
    0.91
    0.58
    0.83
    党史学习时间(小时)
    7
    8
    9
    10
    11
    党员人数
    6
    10
    9
    7
    8
    夜晚天气
    日落云里走
    下雨
    不下雨
    出现
    25
    5
    不出现
    25
    45
    临界值表
    0.10
    0.05
    0.010
    0.001
    2.706
    3.841
    6.635
    10.828
    7
    8
    9
    7
    5
    4
    10
    9
    4
    7
    PM2.5
    64
    16
    10
    10
    0.050
    0.010
    0.001
    3.841
    6.635
    10.828
    PM2.5
    合计
    64
    16
    80
    10
    10
    20
    合计
    74
    26
    100
    年份
    1
    2
    3
    4
    5
    羊只数量/万只
    1.4
    0.9
    0.75
    0.6
    0.3
    草地植被指数
    1.1
    4.3
    15.6
    31.3
    49.7
    样本号i
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    总和
    根部横截面积
    0.04
    0.06
    0.04
    0.08
    0.08
    0.05
    0.05
    0.07
    0.07
    0.06
    0.6
    材积量
    0.25
    0.40
    0.22
    0.54
    0.51
    0.34
    0.36
    0.46
    0.42
    0.40
    3.9
    未发病
    发病
    合计
    未注射疫苗
    注射疫苗
    合计
    良好
    不良好
    合计

    48

    16
    合计
    0.050
    0.010
    0.001
    k
    3.841
    6.635
    10.828
    良好
    不良好
    合计

    8
    40
    48

    16
    36
    52
    合计
    24
    76
    100
    相关试卷

    高考数学命题热点聚焦与扩展(通用版)专题32待定系数法【原卷版+解析】: 这是一份高考数学命题热点聚焦与扩展(通用版)专题32待定系数法【原卷版+解析】,共31页。

    高考数学命题热点聚焦与扩展(通用版)专题28an与Sn关系问题【原卷版+解析】: 这是一份高考数学命题热点聚焦与扩展(通用版)专题28an与Sn关系问题【原卷版+解析】,共37页。

    高考数学命题热点聚焦与扩展(通用版)专题16破解恒成立问题【原卷版+解析】: 这是一份高考数学命题热点聚焦与扩展(通用版)专题16破解恒成立问题【原卷版+解析】,共37页。

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        高考数学命题热点聚焦与扩展(通用版)专题40统计、统计案例【原卷版+解析】
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map