专题63 统计、统计案例(原卷版)学案
展开
这是一份专题63 统计、统计案例(原卷版)学案,共9页。学案主要包含了热点聚焦与扩展,经典例题,精选精练等内容,欢迎下载使用。
专题63 统计、统计案例【热点聚焦与扩展】纵观近几年的高考试题,统计是高考热点之一,往往以实际问题为背景,考查统计相关概念的计算,考查识图用图能力、数据处理能力以及分析问题解决问题的能力.小题、大题均有独立考查,大题也易于和概率一同考查.难度控制在中等以下.本专题在分析研究近几年高考题及各地模拟题的基础上,举例说明.(一)随机抽样:1、抽签法:把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到容量为的样本2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:(1)先将总体的个个体编号(2)确定分段间隔,设样本容量为,若为整数,则(3)在第一段中用简单随机抽样确定第一个个体编号,则后面每段所确定的个体编号与前一段确定的个体编号差距为,例如:第2段所确定的个体编号为,第段所确定的个体编号为,直至完成样本注:(1)若不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被整除,再进行系统抽样.例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的个个体参加系统抽样(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本.分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到(二)频率分布直方图:1、频数与频率(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数(3)各试验结果的频率之和等于12、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出(1)极差:一组数据中最大值与最小值的差(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”(5)频率分布直方图的特点:① 频率=,即分布图中每个小矩形的面积② 因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1(三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数.并按末位数之前的数位进行分类排列,相同的数据需在茎叶图中体现多次(四)统计数据中的数字特征:1、众数:一组数据中出现次数最多的数值,叫做众数2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均值.3、平均数:代表一组数据的平均水平,记为,设一组数据为:,则有:4、方差:代表数据分布的分散程度,记为,设一组数据为:,其平均数为,则有:,其中越小,说明数据越集中5、标准差:也代表数据分布的分散程度,为方差的算术平方根【经典例题】例1.【2020年高考全国Ⅲ卷文数3】设一组样本数据的方差为,则数据的方差为 ( ) A. B. C. D.例2.【2020年高考全国Ⅲ卷理数3】在一组样本数据中,出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是 ( ) A. B.C. D.例3.【2020年高考天津卷4】从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36例4.【2020年高考江苏卷3】已知一组数据的平均数为,则的值是 .例5.【2020年高考上海卷8】已知有四个数,这四个数的中位数为3,平均数为4,则 .例6.(2020·甘肃高三三模)如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长例7.(2020·山东德州·高三三模)某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理( )附:,其中.0.100.050.010.0052.7063.8416.6357.879A.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B.有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”例8.(2020·辽宁沈阳·高三三模)为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为,第2小组的频数为12,则抽取的学生总人数是( )A.24 B.48 C.56 D.64【精选精练】1.(2020·徐州市铜山区大许中学高三三模)某产品的宣传费用x( 万元)与销售额(万元)的统计数据如表所示:宣传费用 x (万元)2345销售额y (万元)24304250根据上表可得回归方程,则宣传费用为6 万元时,销售额最接近( )A.55 万元 B.60 月元 C.62万元 D.65 万元2.(2020·徐州市铜山区大许中学高三三模)惠州市某工厂 10 名工人某天生产同一类型零件,生产的件数分别是10、12、14 、14、15 、15 、16 、17 、17 、17,记这组数据的平均数为a,中位数为b,众数为c,则( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.(2020·定远县育才学校高三三模)某工厂一年中各月份的收入、支出情况的统计图如图所示,则下列说法中错误的是( ).A.收入最高值与收入最低值的比是B.结余最高的月份是7月C.1至2月份的收入的变化率与4至5月份的收入的变化率相同D.前6个月的平均收入为40万元4.(2020·榆树市第一高级中学校高三三模)某校200名学生数学竞赛成绩的频率分布直方图如图所示,成绩分组区间是:,,,,,则该次数学成绩在内的人数为( )A.20 B.15 C.10 D.55.(2020·云南师范大学附属中学呈贡校区高三三模)设两组数据分别为和,且,则这两组数据相比,不变的数字特征是( )A.中位数 B.极差 C.方差 D.平均数6.(2020·云南昆明一中高三三模)设样本数据,,,…,,的均值和方差分别为和,若 (为非零常数,),则,,,…,,的均值和标准差为( )A., B., C., D.,7.(2020·甘肃兰州一中高三三模)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是A.8号学生 B.200号学生 C.616号学生 D.815号学生8.(2020·安徽六安一中高三三模)已知x与y之间的几组数据如下表:x1234y1mn4参考公式:线性回归方程,其中,;相关系数.上表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为,,,对应的相关系数分别为,,,下列结论中错误的是( )A.三条回归直线有共同交点 B.相关系数中,最大C. D.9.(2020·四川高三三模)给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;②两个变量相关性越强,则相关系数就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.其中说法正确的是( )A.①②④ B.②③④ C.①③④ D.②④10.(2020·广东深圳·高三三模)2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附: 男性运动员女性运动员对主办方表示满意200220对主办方表示不满意50300.1000.0500.0100.001k2.7063.8416.63510.828A.0 B.1 C.2 D.311.(2020·上海市杨浦高级中学高三三模)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数 B.平均数C.方差 D.极差12.(2020·黑龙江哈师大附中高三三模)为贯彻落实健康第一的指导思想,切实加强学校体育工作,促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平.某市抽调三所中学进行中学生体育达标测试,现简称为校、校、校.现对本次测试进行调查统计,得到测试成绩排在前200名学生层次分布的饼状图、校前200名学生的分布条形图,则下列结论不一定正确的是( )A.测试成绩前200名学生中校人数超过校人数的2倍B.测试成绩前100名学生中校人数超过一半以上C.测试成绩前151—200名学生中校人数最多33人D.测试成绩前51—100名学生中校人数多于校人数
相关学案
这是一份【备考2023】高考数学重难点专题特训学案(全国通用)——33 变量间的相关关系、统计案例 (原卷版 解析版),文件包含备考2023高考数学重难点专题特训学案全国通用33变量间的相关关系统计案例解析版docx、备考2023高考数学重难点专题特训学案全国通用33变量间的相关关系统计案例学生版docx等2份学案配套教学资源,其中学案共26页, 欢迎下载使用。
这是一份2023届高考数学二轮复习专题四第1讲统计与统计案例学案,共16页。学案主要包含了易错提醒,素养提升等内容,欢迎下载使用。
这是一份【最新】2023版高中高考数学二轮专题复习微专题43 统计与统计案例,共27页。