终身会员
搜索
    上传资料 赚现金

    2019届二轮复习解题技巧 统计与统计案例学案(全国通用)

    立即下载
    加入资料篮
    2019届二轮复习解题技巧 统计与统计案例学案(全国通用)第1页
    2019届二轮复习解题技巧 统计与统计案例学案(全国通用)第2页
    2019届二轮复习解题技巧 统计与统计案例学案(全国通用)第3页
    还剩16页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2019届二轮复习解题技巧 统计与统计案例学案(全国通用)

    展开

    第2讲 统计与统计案例
    [考情考向分析] 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.

    热点一 抽样方法
    1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.
    2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
    3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
    例1 (1)(2018·绵阳诊断)为了解某高校高中学生的数学运算能力,从编号为0001,0002,…,2000的2 000名学生中采用系统抽样的方法抽取一个容量为50的样本,并把样本编号从小到大排列,已知抽取的第一个样本编号为0003,则最后一个样本编号是(  )
    A.0047 B.1663 C.1960 D.1963
    答案 D
    解析 2 000÷50=40,故最后一个样本编号为3+49×40=1963.
    (2)(2018·东莞统考)某机构对某镇的学生的身体素质状况按年级段进行分层抽样调查,得到了如下表所示的数据,则=________.
    年级段
    小学
    初中
    高中
    总人数
    800
    x
    y
    样本中人数
    16
    15
    z

    答案 37 500
    解析 由分层抽样的特点,得==,即x=750,=50,则=37 500.
    思维升华 (1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
    (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
    (3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
    跟踪演练1 (1)(2018·福州检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是(  )
    A.简单随机抽样 B.按性别分层抽样
    C.按年龄段分层抽样 D.系统抽样
    答案 C
    解析 我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.了解某地区的“微信健步走”活动情况,按年龄段分层抽样,这种方式具有代表性,比较合理.
    (2)(2018·江西省重点中学盟校联考)要从已编号(1~70)的70枚最新研制的某型导弹中随机抽取7枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的7枚导弹的编号可能是(  )
    A.5,10,15,20,25,30,35 B.3,13,23,33,43,53,63
    C.1,2,3,4,5,6,7 D.1,8,15,22,29,36,43
    答案 B
    解析 根据系统抽样的定义可知,编号间距为70÷7=10,
    则满足条件的可能是3,13,23,33,43,53,63.
    热点二 用样本估计总体
    1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
    2.频率分布直方图中各小长方形的面积之和为1.
    3.利用频率分布直方图求众数、中位数与平均数
    利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:
    (1)最高的小长方形底边中点的横坐标即众数.
    (2)中位数左边和右边的小长方形的面积和相等.
    (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
    例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为(  )
    A.-11 B.3 C.9 D.17
    答案 C
    解析 设没记清的数为x,若x≤2,则这列数为x,2,2,2,4,5,10,平均数为,中位数为2,众数为2,所以2×2=+2,得x=-11;若26.635,
    因此在犯错误的概率不超过0.01的前提下,可以认为数学优秀与物理优秀有关.
    思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(,),应引起关注.
    (2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K2即可.
    跟踪演练3 (2018·河南省中原名校质检)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x=年份-2013.
    年份代码x
    1
    2
    3
    4
    线下销售额y
    95
    165
    230
    310

    (1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2019年该百货零售企业的线下销售额;
    (2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?
    参考公式及数据:=,=-,
    K2=,n=a+b+c+d.
    P(K2≥k0)
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    k0
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879

    解 (1)由题意得=2.5,=200,x=30,
    xiyi=2 355,
    所以==
    ==71,
    所以=-=200-71×2.5=22.5,
    所以y关于x的线性回归方程为=71x+22.5.
    由于2 019-2 013=6,
    所以当x=6时,=71×6+22.5=448.5,
    所以预测2019年该百货零售企业的线下销售额为448.5万元.
    (2)由题意可得2×2列联表如下:

    持乐观态度
    持不乐观态度
    总计
    男顾客
    10
    45
    55
    女顾客
    20
    30
    50
    总计
    30
    75
    105

    故K2的观测值k=≈6.109,
    由于6.109>5.024,所以可以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.

    真题体验
    1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为________.

    答案 3,5
    解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.
    又甲、乙两组数据的平均值相等,
    ∴×(56+65+62+74+70+x)=×(59+61+67+65+78),∴x=3.
    2.(2017·山东改编)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为________.
    答案 166
    解析 ∵xi=225,∴=xi=22.5.
    ∵yi=1 600,∴=yi=160.
    又 =4,∴ =- =160-4×22.5=70.
    ∴线性回归方程为 =4x+70.
    将x=24代入上式,得 =4×24+70=166.
    3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下列叙述不正确的是________.(填序号)

    ①各月的平均最低气温都在0 ℃以上;
    ②七月的平均温差比一月的平均温差大;
    ③三月和十一月的平均最高气温基本相同;
    ④平均最高气温高于20 ℃的月份有5个.
    答案 ④
    解析 由题意知,平均最高气温高于20 ℃的有七月,八月,故④不正确.
    4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
    答案 18
    解析 ∵==,
    ∴应从丙种型号的产品中抽取×300=18(件).
    押题预测
    1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图,如图所示.设甲、乙两地的满意度分数的平均数分别为甲,乙,中位数分别为m甲,m乙,则(  )

    A.甲m乙
    B.甲>乙,m甲>m乙
    C.甲>乙,m甲6.635,所以有99%的把握认为两种生产方式的效率有差异.
    B组 能力提高
    10.某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是(  )
    A.这种抽样方法是分层抽样
    B.这种抽样方法是系统抽样
    C.这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差
    D.该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数
    答案 C
    解析 根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A,B是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s=8,5名女职员的测试成绩的方差为s=6,所以C正确.故选C.
    11.某青少年成长关爱机构为了调查所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是(  )

    A.据样本数据估计,该地区青少年身高与年龄成正相关
    B.所抽取数据中,5 000名青少年平均身高约为145 cm
    C.直线l的斜率的值近似等于样本中青少年平均身高每年的增量
    D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上
    答案 D
    解析 在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均数大约是145 cm,故B正确;根据直线斜率的意义可知,斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误.
    12.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为=0.85x-0.25.由以上信息,可得表中c的值为________.
    天数x
    3
    4
    5
    6
    7
    繁殖数量y(千个)
    2.5
    3
    4
    4.5
    c

    答案 6
    解析 ==5,==,代入线性回归方程,得=0.85×5-0.25,
    解得c=6.
    13.(2018·咸阳模拟)某校为调查高一、高二学生周日在家学习用时情况,随机抽取了高一、高二各20人,对他们的学习时间进行了统计,分别得到了高一学生学习时间(单位:小时)的频数分布表和高二学生学习时间的频率分布直方图.
    高一学生学习时间的频数分布表(学习时间均在区间内):
    学习时间






    频数
    3
    1
    8
    4
    2
    2

    高二学生学习时间的频率分布直方图:

    (1)求高二学生学习时间在内的人数;
    (2)利用分层抽样的方法,从高一学生学习时间在,的两组里抽取6人,再从这6人中随机抽取2人,求学习时间在这一组中恰有1人被抽中的概率;
    (3)若周日学习时间不少于4小时为学习投入时间较多,否则为学习投入时间较少,依据上述样本研究学习投入时间与学生所在年级是否有关,完成下列2×2列联表,并判断是否有99%的把握认为学习投入时间多少与学生所在年级有关.
    年级
    学习投入时间较多
    学习投入时间较少
    总计
    高一



    高二



    总计




    K2=,其中n=a+b+c+d.
    P(K2≥k0)
    0.025
    0.010
    0.005
    k0
    5.024
    6.635
    7.879

    解 (1)高二学生学习时间在内的人数为20×(0.25+0.30)=11.
    (2)根据分层抽样,从高一学生学习时间在中抽取4人,从高一学生学习时间在中抽取2人.
    设从高一学生学习时间在中抽的4人分别为A,B,C,D,在中抽的2人分别为a,b,则在6人中任抽2人的所有情况有(A,B),(A,C),(A,D),(A,a),(A,b),(B,C),(B,D),(B,a),(B,b),(C,D),(C,a),(C,b),(D,a),(D,b),(a,b),共有15种,
    其中这一组中恰有1人被抽中的情况包含(A,a),(A,b),(B,a),(B,b),(C,a),(C,b),(D,a),(D,b),共有8种,因此学习时间在[3,4)这一组中恰有1人被抽中的概率为.
    (3)2×2列联表如下:
    年级
    学习投入时间较多
    学习投入时间较少
    总计
    高一
    4
    16
    20
    高二
    9
    11
    20
    总计
    13
    27
    40

    K2=≈2.849

    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map