2020江苏高考理科数学二轮讲义:专题六第2讲 统 计
展开第2讲 统 计
[2019考向导航]
考点扫描 | 三年考情 | 考向预测 | ||
2019 | 2018 | 2017 | ||
1.抽样方法 |
|
| 第3题 | 统计这一讲的内容在江苏高考中以填空题的形式来考查,主要考查抽样方法、总体分布的估计、总体特征数的估计.对抽样方法、频率分布直方图的识图与运用和总体估计的考查是重点. |
2.统计与数据处理 | 第5题 | 第3题 |
|
1.随机抽样
(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少.
(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.
2.常用的统计图表
(1)频率分布直方图
①小矩形的面积=组距×=频率;
②各小矩形的面积之和等于1;
③小矩形的高=,所有小矩形的高的和为.
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好.
3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
数字特征 | 样本数据 | 频率分布直方图 |
众数 | 出现次数最多的数据 | 取最高的小矩形底边中点的横坐标 |
中位数 | 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) | 把频率分布直方图划分成左右两边面积相等的分界线与x轴交点的横坐标 |
平均数 | 样本数据的算术平均数 | 每个小矩形的面积乘以小矩形底边中点的横坐标之和 |
(2)方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2].
标准差:
s=.
抽样方法
[典型例题]
(1)(2019·南通市高三调研)为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本,其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3 000人,则该校学生总人数是________.
(2)(2019·江苏名校高三入学摸底)某班有学生45人,现将所有学生按1,2,3,…,45随机编号,并采用系统抽样的方法从中抽取5名学生参加学习情况问卷调查,已知抽取的学生的编号分别为3,a,21,b,39,则a+b=________.
【解析】 (1)设该校学生总人数为n,则=,解得n=7 500.
(2)由系统抽样的知识得,抽取的5个编号依次为3,12,21,30,39,所以a+b=12+30=42.
【答案】 (1)7 500 (2)42
分层抽样
(1)要点:总体分层,按照比例,独立抽取;
(2)适合范围:总体可以分层,层与层之间有明显差异,而层内个体差异较小,每层中所抽取的个体数可按各层在总体中所占比例抽取.
系统抽样
(1)要点:个体编号,确定间隔,随机选一,等距抽取.
(2)当(N为总体中个体数目,n为样本容量)不是整数时,先从总体中随机剔除一些个体;在每一个间隔中,采用简单随机抽样抽取第一个个体.
[对点训练]
1.一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是________.
[解析] 依题意,女运动员有98-56=42(人).设应抽取女运动员x人,根据分层抽样特点,得=,解得x=12.
[答案] 12
2.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体;如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,则n=________.
[解析] 总体容量为6+12+18=36.
当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,所以n应是6的倍数,36的约数,即n=6,12,18.
当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.即样本容量n=6.
[答案] 6
统计与数据处理
[典型例题]
(1)(2019·高考江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.
(2)(2019·江苏省高考命题研究专家原创卷(一))某电商联盟在“双11”狂欢节促销活动中,对11月11日9时到14时的销售额进行统计,得到如图所示的频率分布直方图.已知13时到14时的销售额为4.5万元,则10时到13时的销售额为________万元.
【解析】 (1)数据6,7,8,8,9,10的平均数是=8,则方差是=.
(2)设10时到13时的销售额为x万元,由题图可知13时到14时的销售额与10时到13时的销售额的比值为=,又13时到14时的销售额为4.5万元,所以=,解得x=36,所以10时到13时的销售额为36万元.
【答案】 (1)0.1 (2)36
注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距.
描述数据的数字特征有平均数、众数、中位数、方差等,其中平均数、众数、中位数描述其集中趋势,方差反映各个数据与其平均数的离散程度.解题时重在理解概念、公式并正确进行计算.
[对点训练]
3.(2018·高考江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
[解析] 由茎叶图可得分数的平均数为
=90.
[答案] 90
4.(2019·江苏省高考名校联考(二))江苏省某市阜宁县遭遇强冰雹和龙卷风双重灾害,多个乡镇受灾严重.小明随机调查了受灾地某小区的50户居民的经济损失,将收集的数据分成五组,作出如图所示的频率分布直方图,估计该小区的经济损失的平均数为________元(同一组中的数据用该组区间的中点值作代表).
[解析] 由频率分布直方图可得该小区的50户居民的经济损失的平均数为1 000×(0.000 15×2 000)+3 000×(0.000 20×2 000)+5 000×(0.000 09×2 000)+7 000×(0.000 03×2 000)+9 000×(0.000 03×2 000)=3 360(元),由样本估计总体知该小区的经济损失的平均数为3 360元.
[答案] 3 360
1.(2019·江苏省名校高三入学摸底卷)已知一组数据1,2,3,4,5m的方差为2,那么相对应的另一组数据2,4,6,8,10m的方差为________.
[解析] 1,2,3,4,5m的平均数=2+m,方差s2==2,而2,4,6,8,10m的平均数1=4+2m,方差s=4×=4×2=8.
[答案] 8
2.(2019·扬州期末)已知样本6,7,8,9,m的平均数是8,则标准差是________.
[解析] 因为==8,所以m=10,故s==.
[答案]
3.(2019·高三第二次调研测试)某单位普通职工和行政人员共280人.为了解他们在“学习强国”APP平台上的学习情况,现用分层抽样的方法从所有职员中抽取容量为56的样本.已知从普通职工中抽取的人数为49,则该单位行政人员的人数为______.
[解析] 根据题意知,从该单位行政人员中抽取了7人,设该单位行政人员的人数为n,则n=7,解得n=35.
[答案] 35
4.(2019·苏北四市模拟)如图,茎叶图记录了甲、乙两组各3名同学在期末考试中的数学成绩,则方差较小的那组同学成绩的方差为________.
[解析] 由题意得:甲==92,乙==92,故s=(16+0+16)=,s=(4+1+9)=,故方差较小的那组同学成绩的方差为.
[答案]
5.(2019·江苏省名校高三入学摸底卷)某中学举办了以“美丽中国,我是行动者”为主题的环保知识竞赛,赛后从参赛者中随机抽取了100人,将他们的竞赛成绩(单位:分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].并得到如图所示的频率分布直方图,其中“竞赛成绩不低于70分”的人数为______.
[解析] 由题意知a=(1-0.05-0.1-0.2-0.25-0.1)÷10=0.030,所以“竞赛成绩不低于70分”的频率为0.3+0.25+0.1=0.65,所以“竞赛成绩不低于70分”的人数为100×0.65=65.
[答案] 65
6.(2019·江苏省名校高三入学摸底卷)《幸福账单》在南通地区的选拔规则如下:每位参赛选手的才艺展示由7位评委打分(总分100分),去掉一个最低分和一个最高分,取其余5位评委打分的平均数作为该选手的成绩.已知某选手的得分情况如茎叶图所示,则该选手的成绩为________.
[解析] 由题意可知该选手的成绩是80、83、85、87、90这5个数的平均数,即=85.
[答案] 85
7.根据某固定测速点测得的某时段内过往的100辆机动车的行驶速度(单位:km/h)绘制的频率分布直方图如图所示.该路段限速标志牌提示机动车辆正常行驶速度为60 km/h~120 km/h,则该时段内非正常行驶的机动车辆数为______________________________________.
[解析] 从频率分布直方图可知,非正常行驶的机动车辆频率为(0.002 5+0.005 0)×20=0.150,故所求车辆数为0.150×100=15.
[答案] 15
8.某校有甲、乙、丙3个高三文科班,其中甲班有47人,乙班有51人,丙班有49人.现分析3个班的某一次数学考试成绩,计算得甲班的平均成绩是90分,乙班的平均成绩是90分,丙班的平均成绩是87分,则该校这3个高三文科班的数学平均成绩是________分.
[解析] 由题意知,3个高三文科班的数学平均成绩==89.
[答案] 89
9.如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.
①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.
[解析] 由茎叶图知,该组数据为7,8,9,9,9,10,11,12,12,13,所以众数为9,①正确;中位数是=9.5,③错;平均数是=(7+8+9+9+9+10+11+12+12+13)=10,②正确;方差是s2=[(7-10)2+(8-10)2+(9-10)2+(9-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2+(12-10)2+(13-10)2]=3.4,标准差s=,④错.
[答案] ①②
10.网络上有一种“QQ农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.
[解析] 由最小的两个编号为03,09可知,抽样间距为6,因此抽取人数的比例为,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+(10-1)×6=57.
[答案] 57
11.(2019·南京、盐城模拟)已知一组数据:a1,a2,a3,a4,a5,a6,a7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于________.
[解析] 这组数据的平均数为
==a4,又因为这组数据的方差等于1,所以[(a1-a4)2+(a2-a4)2+(a3-a4)2+(a4-a4)2+(a5-a4)2+(a6-a4)2+(a7-a4)2]
==1,
即4d2=1,解得d=±.
[答案] ±
12.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为________.
[解析] 由题图1得到小波一星期的总开支,由题图2得到小波一星期的食品开支,从而借助题图2计算出鸡蛋开支占总开支的百分比.由题图2知,小波一星期的食品开支为30+40+100+80+50=300元,由题图1知,小波一星期的总开支为=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为×100%=3%.
[答案] 3%
13.“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的.某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并进一定量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
(1)求在这40名读书者中年龄分布在[40,70)的人数;
(2)求这40名读书者的年龄的平均数和中位数.
[解] (1)由频率分布直方图知年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75,
故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.
(2)这40名读书者年龄的平均数为
25×0.05+35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.
设中位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,
解得x=55,故这40名读书者年龄的中位数为55.
14.(2018·高考全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位: m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用 水量 | [0, 0.1) | [0.1, 0.2) | [0.2, 0.3) | [0.3, 0.4) | [0.4, 0.5) | [0.5, 0.6) | [0.6, 0.7) |
频数 | 1 | 3 | 2 | 4 | 9 | 26 | 5 |
使用了节水龙头50天的日用水量频数分布表
日用 水量 | [0, 0.1) | [0.1, 0.2) | [0.2, 0.3) | [0.3, 0.4) | [0.4, 0.5) | [0.5, 0.6) |
频数 | 1 | 5 | 13 | 10 | 16 | 5 |
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
[解] (1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48.
因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).