所属成套资源:2024年高考数学必备PPT大全(6大专题秘籍大招)
专题五 第3讲 统计与成对数据的分析--高三高考数学复习-PPT
展开
这是一份专题五 第3讲 统计与成对数据的分析--高三高考数学复习-PPT,共60页。PPT课件主要包含了考点一,考点二,考点三,数字特征,回归分析,独立性检验,专题强化练,核心提炼,所以X的分布列为,多项选择题等内容,欢迎下载使用。
高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
1.频率分布直方图中相邻两横坐标
2.在频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数.(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(1)(多选)(2023·海南模拟)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的培养.中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成5组:[95,97),[97,99),[99,101),[101,103),[103,105].根据所得数据制成如图所示的频率分布直方图,其中质量在[99,101)内的为优等品.对于这100件产品,下列说法正确的是A.质量的平均数为99.7克(同一区间的平均数用 区间中点值代替)B.优等品有45件C.质量的众数在区间[98,100)内D.质量的中位数在区间[99,101)内
对于选项A,质量的平均数为(96×0.025+98×0.15+100×0.225+102×0.075+104×0.025)×2=99.7(克),选项A正确;对于选项B,优等品有0.225×2×100=45(件),选项B正确;
对于选项C,质量的众数不一定落在区间[98,100)内,所以选项C错误;对于选项D,质量在[99,101)内的有45件,质量在[101,103)内的有15件,质量在[103,105]内的有5件,所以质量的中位数一定落在区间[99,101)内,所以选项D正确.
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,
根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.
(1)对于给出的统计图表,一定要结合问题背景理解图表意义.(2)频率分布直方图中纵坐标不要误以为是频率.
(1)(多选)(2023·盐城模拟)随机抽取6位影迷对某电影的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有A.平均数为95 B.极差为6C.方差为26 D.第80百分位数为97
极差为98-92=6,B正确;
由于80%×6=4.8,故第80百分位数为第5个数,即97,D正确.
(2)(2023·葫芦岛模拟)游戏对青少年的影响巨大.某市青少年健康管理委员会对该市下学年度青少年上网打游戏的情况进行统计,作出如图所示的人数变化走势图.根据该走势图,下列结论正确的是A.这半年中,青少年上网打游戏的人数呈周期性变化B.这半年中,青少年上网打游戏的人数不断减少C.从青少年上网打游戏的人数来看,10月份的方差小于11月份的方差D.从青少年上网打游戏的人数来看,12月份的平均数大于1月份的平均数
对于A,由走势图可得,青少年上网打游戏的人数没有周期性变换,故A错误;对于B,由走势图可知B错误;
对于C,10月份波动较大,方差大,11月波动较小,方差小,故10月份的方差大于11月份的方差,故C错误;对于D,由走势图可得,12月份的平均数大于1月份的平均数,故D正确.
求经验回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2023·唐山模拟)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:
依据表格数据,得到下面一些统计量的值.
(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?
根据样本相关系数r≈0.95,可以推断y与x的线性相关程度很强.
(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);
(3)根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析, 的值将变大还是变小?(不必说明理由,直接判断即可).
第一个样本点(32.2,25.0)的残差为25.0-(1.44×32.2-15.64)=-5.728≈-5.73,由于该点在经验回归直线的左下方,故将其剔除后, 的值将变小.
(1)样本点不一定在经验回归直线上,但点 一定在经验回归直线上.(2)求 时,灵活选择公式,注意公式的推导和记忆.(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值.
(2023·雅安模拟)2023年5月17日,318·川藏线零公里自驾游大本营旅游推介暨“5·17我要骑”雅安站活动在雨城区拉开帷幕,318·川藏线零公里自驾游大本营再次成为关注焦点.318·川藏线零公里自驾游大本营项目以“此生必驾318,首站打卡在雅安”,“世界第三极,雅安零公里”的交旅IP为文化指引,利用雅安交通区位和品牌资源优势,创新打造吸引力体验项目,提高雅安川藏游的话语权和影响力.近段时间某骑行爱好者在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分x与对应用时y(单位:小时)如表:
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;
样本相关系数近似为-1,说明y与x负相关,且相关程度相当高,从而可用线性回归模型拟合y与x的关系.
(2)建立y关于x的经验回归方程.
独立性检验的一般步骤(1)根据样本数据列2×2列联表.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
我国综合性太阳探测专用卫星“夸父一号”是中国科学院空间科学二期先导专项研制的一颗空间科学卫星,卫星以“一磁两暴”为科学目标,即同时观测太阳磁场和太阳.上两类最剧烈的爆发现象——耀斑和日冕物质抛射.某学校为了解该校某兴趣小组对“夸父一号”探测卫星相关知识是否感兴趣,对该兴趣小组的100位学生进行了问卷调查,已知被调查学生中男生占调查人数的55%,其中感兴趣的有45人,余下的不感兴趣,在被调查的女生中,感兴趣的有20人,其余人不感兴趣.
(1)请补充完整2×2列联表,并依据小概率值α=0.005的独立性检验,能否认为对“夸父一号”探测卫星相关知识感兴趣与学生的性别有关联?
补充2×2列联表如下:
零假设H0:对“夸父一号”探测卫星相关知识感兴趣与学生的性别无关联,
根据小概率值α=0.005的独立性检验,推断H0不成立,即对“夸父一号”探测卫星相关知识感兴趣与学生的性别有关,此推断犯错误的概率不大于0.005.
(2)从兴趣小组100人中任选1人,A表示事件“选到的人是男生”,B表示事件“选到的人对‘夸父一号’探测卫星相关知识不感兴趣”,求P(B|A);
(3)按随机抽样的方法从感兴趣的学生中抽取4名男生和3名女生,组成一个容量为7的样本,再从抽取的7人中随机抽取3人,随机变量X表示3人中女生的人数,求X的分布列和均值.
由题意可知,X的可能取值为0,1,2,3.
(1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
(2023·湖南四大名校联考)某学校有A,B两家餐厅,王同学第1天午餐时随机选择一家餐厅用餐.如果第1天去A餐厅,那么第2天去A餐厅的概率为0.6;如果第1天去B餐厅,那么第2天去A餐厅的概率为0.8.(1)①求王同学第2天去A餐厅用餐的概率;
设事件Ai:第i天去A餐厅用餐,事件Bi:第i天去B餐厅用餐,其中i=1,2.王同学第2天去A餐厅用餐的概率为P(A2)=P(A1)P(A2|A1)+P(B1)P(A2|B1)=0.5×0.6+0.5×0.8=0.7.
②如果王同学第2天去A餐厅用餐,求他第1天在A餐厅用餐的概率;
如果王同学第2天去A餐厅用餐,那么他第1天在A餐厅用餐的概率为
(2)A餐厅对就餐环境、菜品种类与品质等方面进行了改造与提升,改造提升后,A餐厅对就餐满意程度进行了调查,统计了100名学生的数据,如表(单位:人).
依据小概率值α=0.005的独立性检验,能否认为学生对于A餐厅的满意程度与餐厅的改造提升有关联?
零假设H0:学生对于A餐厅的满意程度与餐厅的改造提升没有关联.
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为学生对于A餐厅的满意程度与餐厅的改造提升有关联.
一、单项选择题1.某班有男生25人,女生20人,采用比例分配的分层随机抽样的方法从这45名学生中抽取一个容量为9的样本,则应抽取的女生人数为A.2 B.3 C.4 D.5
2.第七次全国人口普查数据显示,德州市各区县常住人口数据如图所示,则这些区县的人口数据的75%分位数为 B.48.8
把德州市各区县常住人口数据从小到大排列:22.33,31.81,35.37,41.91,45.81,46.68,47.33,47.34,48.8,55.92,57.64,69.53,因为12×75%=9,所以75%分位数为数据从小到大排列的第9,10两个数的平均数,
3.(2023·遵义模拟)2023年4月,国内鲜菜、食用油、粮食、禽肉、鲜果、鸡蛋、猪肉价格同比(与去年同期相比)的变化情况如图所示,则下列说法正确的是A.食用油、粮食、禽肉、鲜果、鸡蛋、 猪肉这6种食品中,食用油价格同比 涨幅最小B.猪肉价格同比涨幅超过禽肉价格同比 涨幅的5倍C.2022年4月鲜菜价格要比2023年4月高D.这7种食品价格同比涨幅的平均数超过10%
由图可知,粮食价格同比涨幅比食用油价格同比涨幅小,故A错误;猪肉价格同比涨幅为34.4%,禽肉价格同比涨幅为8.5%,34.4%-5×8.5%3.841=x0.05,所以认为文化程度与月收入有关系,那么犯错误的概率不会超过0.05.
5.(2023·晋中模拟)人工智能聊天机器人,不仅能流畅对话,还能写诗、撰文、编码等.一经推出,便受到广泛关注,并产生了丰富的社会应用.某调查机构为了解大学生使用聊天机器人的情况,对8所高校进行了调查,其中6所学校给出了使用的学生占比,将数据从小到大依次排列为71%,75%,77%,80%,82%,85%,另外两所学校未给出调查数据,那么这8所学校使用的学生比例的中位数不可能是A.76% B.77.5% C.80% D.81.5%
6.(2023·孝感模拟)已知一组样本数据共有8个数,其平均数为8,方差为12,将这组样本数据增加两个未知的数据构成一组新的样本数据,已知新的样本数据的平均数为9,则新的样本数据的方差最小值为A.10 B.10.6 C.12.6 D.13.6
设增加的数为x,y,原来的8个数分别为a1,a2,…,a8,则a1+a2+…+a8=64,a1+a2+…+a8+x+y=90,所以x+y=26,
所以方差的最小值为13.6(当且仅当x=y=13时取到最小值).
所以s2>s′2,C错误,D正确.
8.(2023·湛江模拟)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如表所示:
由表中数据制作成如图所示的散点图:
三、填空题9.(2023·大庆模拟)某校学生参与“保护地球”知识问答活动,满分20分,根据学生的作答成绩绘制成如图所示的频率分布直方图,请据此估计学生成绩的第60百分位数为______.
由图可知第一组的频率为0.04×5=0.20.6,所以第60百分位数在[10,15)内,设为x,则0.1×(x-10)=0.6-0.2,解得x=14.
10.(2023·南京模拟)某工厂月产品的总成本y(单位:万元)与月产量x(单位:万件)有如下一组数据,从散点图分析可知y与x线性相关.如果经验回归方程是 =x+3.5,那么表格中数据a的值为________.
11.(2023·佛山模拟)足球是一项大众喜爱的运动,某校足球社通过调查并进行科学的统计分析,对学校学生喜爱足球是否与性别有关的问题,得出了结论:喜爱足球与性别有关,此推断犯错误的概率不大于0.005.据足球社透露,他们随机抽取了若干人进行调查,抽取女生人数是男生人数的2倍,男生喜爱足球的人数占男生人数的 ,女生喜爱足球的人数占女生人数的 .通过以上信息,可以确定本次足球社所调查的男生至少有____人.
设被调查的男生为x人,则女生为2x人,依题意可得列联表如下:
因为本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,所以有χ2≥7.879,
又因为上述列联表中的所有数字均为整数,故x的最小值为12.
则估计该校高一年级的全体学生的身高的平均数为_____,方差为____.
12.某校采用比例分配的分层随机抽样采集了高一年级学生的身高情况,部分统计数据如下:
四、解答题13.(2023·新高考全国Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
依题可知,患病者该指标的频率分布直方图中第一个小矩形的面积为5×0.002=0.01=1%>0.5%,所以95
相关课件
这是一份专题五 规范答题5 概率与统计--高三高考数学复习-PPT,共7页。PPT课件主要包含了思路分析,❷5分,❹7分,④处构造出等比数列,❺9分,⑤处计算出pi等内容,欢迎下载使用。
这是一份新教材适用2024版高考数学二轮总复习第1篇核心专题提升多维突破专题6概率与统计第3讲统计与成对数据的分析课件,共60页。PPT课件主要包含了专题六概率与统计,分析考情·明方向,真题研究·悟高考,考点突破·提能力,核心考点1抽样方法等内容,欢迎下载使用。
这是一份新高考数学二轮复习考点突破课件 第1部分 专题突破 专题5 第3讲 统计与成对数据的分析(含解析),共60页。PPT课件主要包含了考情分析,统计图表,考点一,核心提炼,易错提醒,回归分析,考点二,独立性检验,考点三,补充列联表如下等内容,欢迎下载使用。