人教A版 (2019)必修 第二册9.2 用样本估计总体精练
展开专题9.2 用样本估计总体
知识储备
1.数据的最值、平均数、中位数、百分位数、众数
| 定义 | 意义 |
百分位数 | 一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.中位数就是一个50%分位数 | 反映该组数中小于该百分位数的分布特点 |
众数 | 一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数 | 描述一组数据趋势的量,反映一组数据的集中程度 |
最值 | 一组数据的最值指的是其中的最大值与最小值 | 最值反映的是这组数最极端的情况,最大值用max表示,最小值用min表示. |
平均数 | 给定一组数是x1+x2+x3+…+xn,则这组数的平均数是 | 刻画一组数据的平均水平(或中心位置)
|
中位数 | 一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数. | 描述一组数据趋势的量,通过排序得到,不受最大、最小两个极端数值影响. |
2.极差、方差、标准差
| 不同 | 相同 |
极差 | 一组数的极差指的是这组数的最大值减去最小值所得的差. | 数据的离散程度可以用极差、方差或标准差来描述. |
方差 | 如果x1,x2,…,xn的平均数为, 则方差s2=[(x1-)2+(x2-)2+…+(xn-)2] | |
标准差 | 方差的算术平方根称为标准差 |
3.柱形图、折线图、扇形图
| 定义 | 作用 |
柱形图(也称为条形图) | 条形图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来。 | 形象地比较各种数据之间的数量关系
|
折线图 | 折线图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来。 | 折线统计图不但可以表示出数量的多少,而且能够清楚地表示出数量增减变化的情况。 |
扇形图 | 扇形图是用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分数。 | 扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况。 |
4.频数(率)分布直方图
5.用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
6.分层抽样的均值与方差
以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.则
=xi,s2=(xi-)2,=,t2=.
如果记样本均值为,样本方差为b2,则可以算出
=(xi+yi)=,
b2=
=.
7.常用结论
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.
3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
4.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
5.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
能力检测
注意事项:
本试卷满分100分,考试时间45分钟,试题共16题.答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级等信息填写在试卷规定的位置.
一、单选题
1.(2020·河北高二学业考试)为了解全年级1180名学生的数学成绩分布情况,在一次数学调研测试后,某教师随机抽取了80份试卷并对试卷得分(满分:150分)进行了整理,得到如下频率分布表:
分数段 | |||||||||
频数 | 2 | 4 | 8 | 10 | 20 | 15 | 8 | 6 | 6 |
频率 |
若同一组数据用该区间的中点值作代表,则此次数学测试全年级平均分的估计值是( ).
A.110 B. C.105 D.
【答案】B
【解析】由题意可得,此次数学测试全年级平均分的估计值是
.故选:B.
2.(2020·广东广州市·高三月考)某学校鼓励学生参加社区服务,学生甲2019年每月参加社区服务的时长(单位:小时)分别为,,…,,其均值和方差分别为和,若2020年甲每月参加社区服务的时长增加1小时,则2020年甲参加社区服务时长的均值和方差分别为( )
A., B., C., D.,
【答案】D
【解析】由题意可知,,
设2020年甲参加社区服务时长的均值和方差分别为,,则
,
故选:D
3.(2020·湖北十堰市·高二期中)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为,则的值分别为( )
A. B. C. D.
【答案】D
【解析】组数据的中位数为17,,
乙组数据的平均数为,
,
得,则,故选:D.
4.(2020·湖北高三学业考试)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了50根棉花的纤维长度(单位:mm),其频率分布直方图如图所示.根据频率分布直方图,估计事件“棉花的纤维长度大于275mm”的概率为( )
A.0.30 B.0.48 C.0.52 D.0.70
【答案】C
【解析】
“棉花的纤维长度大于275mm”的概率为.故选:C
5.(2020·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为,,,,.下面给出的指标可以用来评估该贫困户年收入的稳定程度( )
A.,,,,的平均数 B.,,,,的标准差
C.,,,,的最大值 D.,,,,的中位数
【答案】B
【解析】标准差反映了各数据对平均数的偏离,
反映了一组数据的离散程度,在本题中即稳定程度,
而其他的统计量则不能反映稳定程度,故选:B
6.(2020·全国高三专题练习)中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:
参加场数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
参加人数占调查人数的百分比 | 8% | 10% | 20% | 26% | 18% | % | 4% | 2% |
以下四个结论中正确的是( ).
A.表中的数值为10
B.估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人
C.估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人
D.若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25
【答案】C
【解析】A选项,由题意可得,,
则;故A错;
B选项,由题意可得,样本中该校高一学生参加传统文化活动次数不高于2场的学生占比为,
则该校高一学生参加传统文化活动次数不高于2场的学生约为人;故B错;
C选项,由题意,样本中该校高一学生参加传统文化活动次数不低于4场的学生占比为,
则该校高一学生参加传统文化活动次数不低于4场的学生约为360人;故C正确;
D选项,从若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为;故D错.故选:C.
7.(2020·山东临沂市·高一期末)某工厂12名工人的保底月薪如下表所示,第80百分位是( )
工人 | 保底月薪 | 工人 | 保底月薪 |
1 | 2890 | 7 | 2850 |
2 | 2860 | 8 | 3130 |
3 | 3050 | 9 | 2880 |
4 | 2940 | 10 | 3325 |
5 | 2755 | 11 | 2920 |
6 | 2710 | 12 | 2950 |
A.3050 B.2950 C.3130 D.3325
【答案】A
【解析】把这组数据从小到大排序:
2710,2755,2850,2860,2880,2890,2920,2940,2950,3050,3130,3325,
所以,所以第80百分位是3050,故选:A.
8.(2020·黑龙江大庆市·大庆实验中学高二月考(文))在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体平均值为3,中位数为4
B.乙地:总体平均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为2
【答案】D
【解析】不妨通过构造特殊值法进行判断,对于甲地:0,0,0,0,4,4,4,4,4,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于乙地:0,0,0,0,0,0,0,0,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丙地,0,0,1,1,2 ,2,3,3,3,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丁地,当总体平均数是2时,若有一个数据超过7,则方差就超过了2,符合题意,因此,一定没有发生大规模群体感染的是丁地.故选:D.
二、多选题
9.(2020·河北沧州市·高二期中)甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则( )
A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数
B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数
C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数
D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差
【答案】AD
【解析】由图可得甲运动员测试成绩中次环,次环,次环,次环,
所以甲运动员测试成绩的中位数为,众数为,
平均数为,
方差;
乙运动员测试成绩中次环,次环,次环,次环,
所以乙运动员测试成绩的中位数为,众数为,
平均数为,
方差,
故选项A正确,B不正确,C不正确,D正确,故选:AD
10.(2020·河北巨鹿中学高二月考)2020年3月6日,在新加坡举行的世界大学生辩论赛中,中国选手以总分230.51分获得冠军.辩论赛有7位评委进行评分,首先这7位评委给出某对选手的原始分数,评定该队选手的成绩时从7个原始成绩中去掉一个最高分、一个最低分,得到5个有效评分,则5个有效评分与7个原始评分相比,可能变化的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
【答案】BCD
【解析】因为5个有效评分是7个原始评分中去掉一个最高分、一个最低分,
所以中位数不变,平均数、方差、极差可能发生变化,
所以可能变化的数字特征是平均数、方差、极差.故选:BCD.
11.(2020·湖南省汨罗市第二中学高三开学考试)气象意义上从春季入夏季的标志为:“连续5天的日平均温度均不低于22℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,总体均值为24;
③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.
则肯定进入夏季的地区有( )
A.①②③ B.② C.③ D.①
【答案】CD
【解析】由统计知识,①甲地:5个数据的中位数为24,众数为22,5个数据中2个是22,有2个大于24,一个是24,可知①符合题意;而②乙地:5个数据的中位数为27,总体均值为24,有可能某一天的气温低于22℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若有某一天的气温低于22℃,则总体方差就大于10.8,所以满足题意,故选:CD.
12.(2020·南京航空航天大学附属高级中学高二开学考试)已知一组数据,,,,的平均数和方差均为2,则下列叙述正确的有( )
A.,,,,的平均数为3
B.,,,,的方差为3
C.,,,,的方差为4
D.,,,,的方差为8
【答案】AD
【解析】对选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变,
故其平均数是,方差是;故正确;错误;
对,将每个数据乘以2,故其方差变为原来的4倍,即为,故错误;
对,将每个数据乘以2再加2,故其方差也变为原来的倍,即为,故正确.
故选:.
三、填空题
13.(2020·贵溪市实验中学高三月考)甲乙两名链球运动员在比赛中各投掷5次,成绩如表(单位:米)
甲 | 78 | 80 | 77 | 81 | 84 |
乙 | 76 | 80 | 85 | 82 | 77 |
分别表示甲、乙两人比赛成绩的方差,则的大小关系是_____________.(用、、连接)
【答案】
【解析】,
,
,
,
则,故答案为:.
14.(2020·西城区·北京铁路二中高三期中)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:
① 第3天至第11天复工复产指数均超过80%;
② 这11天期间,复产指数增量大于复工指数的增量;
③ 第9天至第11天复产指数增量大于复工指数的增量;
④ 第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.
其中所有正确结论的序号是____________________.
【答案】①③
【解析】由图像可得,第3天至第11天复工复产指数均超过80%,故①正确;
由图像可得,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;
由图像可得,第9天至第11天复产指数增量大于复工指数的增量;故③正确;
由图像可得,第1天至第3天复工指数波动较小,第2天至第4天复工指数波动较大,所以第1天至第3天复工指数的方差小于第2天至第4天复工指数的方差,故④错误.
故答案为:①③
15.(2020·北京高一期末)某班数学兴趣小组组织了线上“统计”全章知识的学习心得交流:
甲同学说:“在频率分布直方图中,各小长方形的面积的总和小于1”;
乙同学说:“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”;
丙同学说:“扇形图主要用于直观描述各类数据占总数的比例”;
丁同学说:“标准差越大,数据的离散程度越小”.
以上四人中,观点正确的同学是______.
【答案】乙丙
【解析】在频率分布直方图中,各小长方形的面积的总和等于1,故甲的观点错误;
“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”,故乙的观点正确,
“扇形图主要用于直观描述各类数据占总数的比例”,故丙的观点正确;
“标准差越大,数据的离散程度越大”,故丁的观点错误.故答案为:乙丙.
四、双空题
16.(2020·滁州市第二中学高二月考)某高校在2013年的自主招生考试成绩中随机抽取50名学生的笔试成绩,绘制成频率分布直方图如图所示,由图中数据可知a=________;若要从成绩(单位:分)在[85,90),[90,95),[95,100]三组内的学生中,用分层抽样的方法选取12人参加面试,则成绩(单位:分)在[95,100]内的学生中,学生甲被选取的概率为________.
【答案】0.04 0.4
【解析】由频率分布直方图知,
,
所以.
第3组的人数为,
第4组的人数为,
第5组的人数为,
因为第3、4、5组共抽30名学生,所以利用分层抽样在30名学生中抽取12名学生.
每组抽取的人数分别为:
第3组: ,
第4组:
第5组:,所以第3、4、5组分别抽取6人、4人、2人.
则成绩在[95,100]内的5个学生中抽2个,学生甲被选取的概率为
故答案为:0.04;0.4
数学人教A版 (2019)第九章 统计9.1 随机抽样巩固练习: 这是一份数学人教A版 (2019)第九章 统计9.1 随机抽样巩固练习,共8页。试卷主要包含了统计的相关概念,随机数表法的抽样步骤等内容,欢迎下载使用。
2021学年7.2 复数的四则运算同步训练题: 这是一份2021学年7.2 复数的四则运算同步训练题,共7页。试卷主要包含了复数的运算,共轭复数,i的乘方具有周期性,复数的模与共轭复数的关系,两个注意点等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册第七章 复数7.1 复数的概念课时练习: 这是一份高中数学人教A版 (2019)必修 第二册第七章 复数7.1 复数的概念课时练习,共7页。试卷主要包含了复数的有关概念,复数的几何意义等内容,欢迎下载使用。