2021_2022学年新教材高中数学第六章统计章末复习与总结学案北师大版必修第一册
展开章末复习与总结
一、数学抽象
学生能更好地理解数学概念、命题、方法和体系,能通过抽象、概括去认识、理解、把握事物的数学本质,能逐渐养成一般性思考问题的习惯.在本章中,数学抽象主要体现在随机抽样中.
随机抽样 |
[例1] 问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽样;(2)分层随机抽样.则问题与方法配对正确的是( )
A.①(1),②(2) B.①(2),②(1)
C.①(1),②(1) D.①(2),②(2)
[解析] 问题①中的总体是由差异明显的几部分组成的,故可采用分层随机抽样方法;问题②中总体的个数较少,故可采用简单随机抽样.故匹配正确的是B.
[答案] B
二、数学运算
数学运算是解决数学问题的基本手段,是计算机解决问题的基础.在本章中,数学运算主要体现在计算百分位数、平均数、中位数、方差和标准差中.
百分位数的计算 |
[例2] 已知甲、乙两组数据(从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的30%分位数、80%分位数分别相等,则等于( )
A. B. C. D.
[解析] 因为30%×6=1.8,80%×6=4.8,所以30%分位数为n=28,80%分位数为m=48,所以==.
[答案] A
平均数、中位数的计算 |
[例3] 统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层随机抽样的方法抽出100人作进一步分析,则月收入在[4 000,4 500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[解] (1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a==0.000 5.又0.000 5×500=0.25,所以月收入在[4 000,4 500)内的频率为0.25,所以100人中月收入在[4 000,4 500)内的人数为0.25×100=25.
(2)因为0.000 2×500=0.1,0.000 4×500=0.2,0.000 5×500=0.25,0.1+0.2=0.3<0.5,0.1+0.2+0.25=0.55>0.5,所以中位数在区间[3 500,4 000)内,
所以样本数据的中位数是
3 500+=3 900.
(3)样本数据的平均数为(2 750×0.000 2+3 250×0.000 4+3 750×0.000 5+4 250×0.000 5+4 750×0.000 3+5 250×0.000 1)×500=3 900.
三、数据分析
数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.
数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.在本章中,数据分析主要体现在频率分布直方图及总体集中趋势的估计中.
频率分布直方图及应用 |
[例4] 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木底部周长的50%分位数和75%分位数吗?
[解] 由题意知分别落在各区间上的频数为
在[80,90)上有60×0.15=9,
在[90,100)上有60×0.25=15,
在[100,110)上有60×0.3=18,
在[110,120)上有60×0.2=12,
在[120,130]上有60×0.1=6,
从以上数据可知50%分位数一定落在区间[100,110)上,
由100+10×=100+≈103.3(cm);
75%分位数一定落在区间[110,120)上,
由110+10×=110+=112.5(cm);
综上可知,50%分位数和75%分位数分别估计为103.3 cm,112.5 cm.
[例5] 从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在80分以下的学生比例.
[解] (1)频率分布表如下:
成绩分组 | 频数 | 频率 |
[40,50) | 2 | 0.04 |
[50,60) | 3 | 0.06 |
[60,70) | 10 | 0.20 |
[70,80) | 15 | 0.30 |
[80,90) | 12 | 0.24 |
[90,100] | 8 | 0.16 |
合计 | 50 | 1.00 |
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本中所求学生的比例为0.20+0.30+0.24=0.74=74%.由样本估计总体,成绩在[60,90)分的学生约占74%.
(4)样本所求学生的比例为1-(0.24+0.16)=1-0.4=0.6=60%.
由样本估计总体,成绩在80分以下的学生约占60%.
数据的集中趋势和离散程度的估计 |
[例6] 设有两组数据x1,x2,…,xn与y1,y2,…,yn,它们的平均数分别是和,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2xn-3yn+1的平均数是( )
A.2-3 B.2-3+1
C.4-9 D.4-9+1
[解析] 设zi=2xi-3yi+1(i=1,2,…,n),
则=(z1+z2+…+zn)=(x1+x2+…+xn)-(y1+y2+…+yn)+=2-3+1.
[答案] B
[例7] 某样本数据的频率分布直方图如图所示,则依据图形中的数据,可以估计总体的平均数与中位数分别是________,________.
[解析] 第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5,则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x,则有0.1x+0.2=0.5,解得x=3,从而中位数是13.
[答案] 13 13
[例8] 为了迎接2022年北京冬奥会,北京某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.
团体成绩 | 众数 | 极差 | 平均数 | 方差 |
高一年级 |
| 22 |
| 39.6 |
高二年级 |
|
| 85.7 | 27.8 |
(1)请把上边的表格填写完整;
(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些?
[解] (1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86;
高二年级的成绩为85,97,85,87,85,88,77,87,78,88.
由此可知高一年级成绩的众数是80,平均数=85+(-5+2+4-5+3+14-5-8+6+1)=85.7;
高二年级成绩的众数是85,极差是20.
(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.