所属成套资源:新教材高一数学必修第二册暑假作业(2份打包,解析版+原卷版)
新教材高一数学必修第二册暑假作业第13练《统计》(2份打包,解析版+原卷版)
展开这是一份新教材高一数学必修第二册暑假作业第13练《统计》(2份打包,解析版+原卷版),文件包含新教材高一数学必修第二册暑假作业第13练《统计》解析版doc、新教材高一数学必修第二册暑假作业第13练《统计》原卷版doc等2份试卷配套教学资源,其中试卷共40页, 欢迎下载使用。
第13练 统计
【知识梳理】
知识点一 简单随机抽样
【知识点的认识】
1.定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.特点:
(1)有限性:总体个体数有限;(2)逐个性:每次只抽取一个个体;
(3)不放回:抽取样本不放回,样本无重复个体;
(4)等概率:每个个体被抽到的机会相等.(如果从个体数为N的总体中抽取一个容量为n的样本,则每个个体被抽取的概率等于)3.适用范围:总体中个数较少.
4.注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素.
知识点二 分层抽样方法
【知识点的认识】
1.定义:当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例进行抽样,这种抽样叫做分层抽样,其中所分的各部分叫“层”.
2.三种抽样方法比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率是相同的
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均匀分成几个部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
知识点三 频率分布折线图、密度曲线
【知识点的认识】
1.频率分布折线图:
如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图.
2.总体分布的密度曲线:
如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率分布折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
知识点四 众数、中位数、平均数
【知识点的认识】
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即.
2.众数、中位数、平均数的优缺点
知识点五 极差、方差与标准差
【概念】
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
知识点六 用样本的数字特征估计总体的数字特征
【知识点的知识】
1.样本的数字特征:众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即.
2、三种数字特征的优缺点::
(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.
(2)中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.
(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.
(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.(5)使用者根据自己的利益去选择使用中位数或平均数来描述数据的中心,从而产生一些误导作用.
3、如何从频率分布直方图中估计众数、中位数、平均数?
利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
4、样本平均数、标准差对总体平均数、标准差的估计
现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道(或不可求)的.如何求得总体的平均数与标准差呢?通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
如要考查一批灯泡的质量,我们可从中随机抽取一部分作为样本,要分析一批钢筋的强度,可以随机抽取一定数目的钢筋作为样本,只要样本的代表性强就可以用来对总体作出客观的判断.
但需要注意的是,同一个总体,抽取的样本可以是不同的.如一个总体包含6个个体,现在要从中抽取3个作为样本,所有可能的样本会有20种不同的结果,若总体与样本容量较大,可能性就更多,而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均数、标准差都会有差异.这就会影响到我们对总体情况的估计.
知识点七 收集数据的方法
【知识点的知识】
数据收集的基本方法:
(1)做试验:通过设计一些合适的试验,能够直接地获得样本数据,如统计一颗骰子各点出现的频率,就可做抛掷骰子试验.
(2)查阅资料:有些数据不易直接调查到,可通过查阅图书馆文献或通过搜索因特网上的相关资料等办法获得所需数据或相关数据.
(3)设计调查问卷:问卷一般由一组有目的、有系统、有顺序的题目组成.
知识点八 分布和频率分布表
【知识点的认识】
1.频数与频率
①频数:指一组数据中,某范围内的数据出现的次数.
②频率:把频数除以数据的总个数,就得到频率.
2、频率分布表
当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
知识点九 频率分布直方图
【知识点的认识】
1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
2.频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图求数据
①众数:频率分布直方图中最高矩形的底边中点的横坐标.
②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.
③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【解题方法点拨】
绘制频率分布直方图的步骤:
一.选择题
1.新冠肺炎疫情发生以来,医用口罩成为抗疫急需物资.某医用口罩生产厂家生产、、三种不同型号的口罩,、、三种型号的口罩产量之比为.为了提高这三种口罩的质量,用分层抽样的方法抽取一个容量为的样本.在样本中种口罩数量比种口罩数量多40只,比种口罩数量多80只,则
A.240 B.280 C.320 D.360
2.学校开展学生对食堂满意度的调查活动,已知该校高一年级有学生550人,高二年级有学生500人,高三年级有学生450人.现从全校学生中用分层抽样的方法抽取60人调查,则抽取的高二年级学生人数为
A.18 B.20 C.22 D.24
3.下列抽样试验中,适合用抽签法的是
A.从某厂生产的5000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5000件产品中抽取10件进行质量检验
4.已知某校高一、高二、高三的学生志愿者人数分别为180、240、160.现采用分层抽样的方法从中抽取名同学去某福利院参加慈善活动,其中高一年级被抽取的人数为9,则
A.29 B.21 C.20 D.9
5.某校羽毛球社团中,高一年级有名学生,高二年级有12名学生.现用等比例分层随机抽样的方法抽取一个样本,已知在高二年级的学生中抽取了3名,高一年级被抽取的人数是高二年级被抽取人数的3倍多1,则
A.40 B.36 C.28 D.16
6.某社区有男性居民1800名,女性居民1200名,该社区卫生室为了解该社区居民身体健康状况,对该社区所有居民按性别采用等比例分层随机抽的办法进行抽样调查,抽取了一个容量为100的样本,则样本中男性居民的人数为
A.40 B.50 C.60 D.70
7.北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为的样本进行质量检测,若“冰墩墩”抽取了4只,则为
A.3 B.2 C.5 D.9
8.北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是一次中国文化与奥林匹克精神的完美结合,现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为9的样本进行质量检测,则“雪容融”抽取了 只
A.3 B.2 C.4 D.5
9.已知,,,,,的均值为6,则
A.4 B.5 C.8 D.10
10.某厂家从一批红外测温仪中随机抽取了100个,测量一个的物体,产生的误差统计如表:
误差范围
,
,
,
,
频数
10
25
35
20
10
规定误差在,内的为合格品,若合格率为,则
A.8 B.10 C.12 D.16
11.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是
A.该市参加升学考试的全体学生是总体
B.1000名学生的数学成绩是样本
C.1000名学生是样本容量
D.1000名学生中的每一名学生是个体
12.某试验田种植甲、乙两种水稻,面积相等的两块稻田(种植环境相同)连续5次的产量如下:
甲
260
250
210
250
280
乙
220
260
230
250
290
则下列说法错误的是
A.甲种水稻产量的众数为250
B.乙种水稻产量的极差为70
C.甲种水稻产量的平均数等于乙种水稻产量的平均数
D.甲种水稻产量的方差大于乙种水稻产量的方差
13.小红同学统计了她妈妈最近6次的手机通话时间(单位:分钟),得到的数据分别为12,5,7,11,15,30,则这组数据的分位数是
A.12 B.11.5 C.11 D.7
二.多选题
14.下列说法正确的是
A.为了更好地开展创文创卫工作,需要对在校中小学生参加社会实践活动的意向进行调查,拟采用分层抽样的方法从该地区、、、四个学校中抽取一个容量为400的样本进行调查,已知、、、四校人数之比为,则应从校中抽取的样本数量为80
B.6件产品中有4件正品,2件次品,从中任取2件,则至少取到1件次品的概率为0.6
C.已知变量、线性相关,由样本数据算得线性回归方程是,且由样本数据算得,,则
D.箱子中有4个红球、2个白球共6个小球,依次不放回地抽取2个小球,记事件第一次取到红球,第二次取到白球,则、为相互独立事件
15.某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人;高三年级有13个班,每班50人.甲同学就读于高一,乙同学就读于高二.学校计划从这三个年级中共抽取300人进行视力调查,下列说法中正确的有
A.应该采用分层随机抽样法
B.高一、高二、高三年级应分别抽取100人、135人和65人
C.乙同学被抽到的可能性比甲同学大
D.该问题中的总体是高一、高二、高三年级的全体学生的视力
16.某公司为检测某型号汽车的质量问题,需对三个批次生产的该型号汽车进行检测,三个批次产量分别为100000辆、150000辆和250000辆,公司质监部门计划从中抽取500辆进行检测,则下列说法正确的是
A.样本容量为500
B.采用简单随机抽样比分层随机抽样合适
C.应采用分层随机抽样,三个批次的汽车被抽到的概率不相等
D.应采用分层随机抽样,三个批次分别抽取100辆、150辆、250辆
17.已知某地区有小学生120000人,初中生75000人,高中生55000人,当地教育部门为了了解本地区中小学生的近视率,按小学生、初中生、高中生进行分层抽样,抽取一个容量为2000的样本,得到小学生,初中生,高中生的近视率分别为,,.下列说法中正确的有
A.从高中生中抽取了440人
B.每名学生被抽到的概率为
C.估计该地区中小学生总体的平均近视率为
D.估计高中学生的近视人数约为44000
18.甲、乙两人进行飞镖游戏,甲的10次成绩分别为8,6,7,7,8,10,10,9,7,8,乙的10次成绩的平均数为8,方差为0.4,则
A.甲的10次成绩的极差为4
B.甲的10次成绩的分位数为8
C.甲和乙的20次成绩的平均数为8
D.乙比甲的成绩更稳定
19.已知数据,,,的平均数为,方差为.由这组数据得到新数据,,,,其中,2,,,则
A.新数据的平均数是 B.新数据的方差是
C.新数据的平均数是 D.新数据的标准差是
20.为庆祝中国共青团成文100周年,校团委举办了“学团史,知团情”知识竞赛,甲、乙两个组各派7名同学参加竞赛,测试成绩(单位:分,十分制)如图所示,则下列描述正确的有
A.甲、乙两组成绩的极差相等
B.甲、乙、两组成绩的平均数相等
C.甲、乙两组成绩的中位数相等
D.甲组成绩的方差大于乙组成绩的方差
21.新冠疫情严重,全国多地暂停了线下教学,实行了线上教学,经过了一段时间的学习,为了提高学生的学习积极性和检测教学成果,某校计划对疫情期间学习成绩优秀的同学进行大力表彰.对本校100名学生的成绩(满分:100分)按,,,,,,,,,,,分成6组,得到如图所示的频率分布直方图,根据此频率分布直方图,用样本估计总体,则下列结论正确的是
A.若本次测试成绩不低于80分为优秀,则这100人中成绩为优秀的学生人数为10
B.该校疫情期间学习成绩在70分到80分的人数最多
C.该校疫情期间学生成绩的平均得分超过70分(同一组中的数据用该组区间的中点值代替)
D.该校疫情期间约有的人得分低于60分或不低于90分
三.填空题(共4小题)
22.国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”,某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第12行第5列的数开始,每次从左向右选取两个数字,则选取的第4个号码为 05 (注:如下为随机数表的第12行和第13行)
16 00 11 66 14 90 84 45 11 65 73 88 05 90 52 27 41 14 86 22
12 22 08 07 52 74 95 80 35 69 68 32 50 61 28 47 39 75 34 58
23.已知某地区有小学生14000人,初中生12000人,高中生11000人,现在要了解该地区学生的身高情况,用分层随机抽样的方法抽取740人进行调查,则高中生被抽取的人数为 220 .
24.某校高一、高二、高三年级的学生人数之比为,现用分层随机抽样的方法从该校三个年级的学生中抽取容量为260的样本,则从高三年级抽取的学生人数为 100 .
25.设某总体是由编号为01,02,,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列数字开始,从左到右依次选取两个数字,则选出来的第5个个体编号为 19 .
1818 0792 4544 1716 5809 7983 8619
6206 7650 0310 5523 6405 0526 6238
26.某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是,,,,,,,,则可估计这次数学测试成绩的第40百分位数是 65 .
28.我国2021年9月至2022年3月的居民消费指数(上年同月分别为100.7,101.5,102.3,101.5,100.9,100.9,101.5,则这组数据的第20百分位数是 100.9 .
一.解答题(共3小题)
29.2021年广东省高考实行“”模式.“”模式是指:“3”为全国统考科目语文、数学、外语,所有学生必考;“1”为首选科目,考生须在高中学业水平考试的物理、历史科目中选择1科;“2”为再选科目,考生可在化学、生物、政治、地理4个科目中选择2科,共计6个考试科目.并规定:化学、生物、政治、地理4个选考科目的考生原始成绩从高到低划分为,,,,,,,八个等级.参照正态分布原则,确定各等级人数所占比例分别为,,,,,,,选考科目成绩计入考生总成绩时,将至等级内的考生原始成绩,依照等比例转换法则,分别转换到,,,,,,,,,,,,,,,八个分数区间,得到考生的等级成绩.
假设小明转换后的等级成绩为分,则,所以(四舍五入取整),小明最终成绩为63分.
某校2019级学生共1000人,以期末考试成绩为原始成绩转换了本校的等级成绩,为学生合理选科提供依据,其中化学成绩获得等级的学生原始成绩统计如下
成绩
93
91
90
88
87
86
85
84
83
82
人数
1
1
4
2
4
3
3
3
2
7
设化学成绩获得等的学生原始成绩为分,,83,84,85,86,87,88,90,91,,等级成绩为分,由题意得该分数段的转换公式为:,即.
(1)求化学获得等级的学生等级成绩的平均分(四舍五入取整数);
(2)从化学原始成绩不小于90分的学生中任取2名同学,求2名同学等级成绩不相等的概率.
30.某产业园生产的一种产品的成本为50元件.销售单价依产品的等级来确定,其中优等品、一等品、二等品、普通品的销售单价分别为80元、75元、65元、60元.为了解各等级产品的比例,检测员从流水线上随机抽取200件产品进行等级检测,检测结果如表所示.
产品等级
优等品
一等品
二等品
普通品
样本数量(件
30
50
60
60
(Ⅰ)若从流水线上随机抽取一件产品,估计该产品为优等品的概率;
(Ⅱ)从该流水线上随机抽取3件产品,记其中单件产品利润大于20元的件数为,用频率估计概率,求随机变量的分布列和数学期望;
(Ⅲ)为拓宽市场,产业园决定对抽取的200件样本产品进行让利销售,每件产品的销售价格均降低了5元.设降价前后这200件样本产品的利润的方差分别为,,比较,的大小.(请直接写出结论)
31.五常市是黑龙江省典型农业大县(市、国家重要的商品粮食基地,全国粮食生产十大先进县之一,也是全国水稻五强县之一,被誉为张广才岭下的“水稻王国”.五常大米受产区独特的地理、气候等因素影响,干物质积累多,直链淀粉含量适中,支链淀粉含量较高.由于水稻成熟期产区昼夜温差大,大米中可速溶的双链糖积累较多,对人体健康非常有益.五常大米根据颗粒、质地、色泽、香味等评分指标打分,得分在区间,,,,,,,内分别评定为四级大米、三级大米、二级大米、一级大米.某经销商从五常市农民手中收购一批大米,共400袋(每袋,并随机抽取20袋分别进行检测评级,得分数据的频率分布直方图如图所示:
(1)求的值,并用样本估计,该经销商采购的这批大米中,一级大米和二级大米的总量能否达到采购总量一半以上;
(2)该经销商计划在下面两个方案中选择一个作为销售方案:
方案1:将采购的400袋大米不经检测,统一按每袋300元直接售出;
方案2:将采购的400袋大米逐袋检测分级,并将每袋大米重新包装成5包(每包,检测分级所需费用和人工费共8000元,各等级大米每包的售价和包装材料成本如表所示:
大米等级
四级
三级
二级
一级
售价(元包)
55
68
85
98
包装材料成本(元包)
2
2
4
5
该经销商采用哪种销售方案所得毛利润更大?通过计算说明理由.
一.解答题(共3小题)
32.在对某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,抽取了一个容量为40的样本,其中男生18人,女生22人,其观测数据(单位:如下:
男生
172.0
174.5
166.0
172.0
170.0
165.0
165.0
168.0
164.0
172.5
172.0
173.0
175.0
168.0
170.0
172.0
176.0
174.0
女生
163.0
164.0
161.0
157.0
162.0
165.0
158.0
155.0
164.0
162.5
154.0
154.0
164.0
149.0
159.0
161.0
170.0
171.0
155.0
148.0
172.0
162.5
(1)从身高在,的男生中随机抽取2人,求至少有1人的身高大于的概率;
(2)利用所学过的统计知识比较样本中男生、女生的身高的整齐程度;
(3)估计该中学高一年级全体学生身高的方差(精确到.
参考数据:,,,,,,其中男生样本记为,,,,女生样本记为,,,.
33.为了解甲、乙两厂的产品质量,采用分层抽样的方法从甲、乙两厂生产的产品中分别抽取14件和5件,测量产品中的微量元素,的含量(单位:毫克),如表是乙厂的5件产品的测量数据:
编号
1
2
3
4
5
169
178
166
175
180
75
80
77
70
81
(1)已知甲厂生产的产品共有98件,求乙厂生产的产品数量;
(2)当产品中的微量元素,满足,且时,该产品为优等品.用上述样本数据估计乙厂生产的优等品的数量;
(3)从乙厂抽出的上述5件产品中,随机抽取2件,求抽取的2件产品中优等品数的分布列及方差.
34.统计局就某地居民的月收入情况调查了10000人,并根据所得数据画了样本的频率分布直方图每个分组包括左端点,不包括右端点,如第一组表示收入在,元.
(1)求月收入在,的频率;
(2)根据频率分布直方图估计样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层抽样方法抽出100人作进一步分析,则月收入在,的应抽取多少?
相关试卷
这是一份新教材高一数学必修第二册暑假作业第14练《概率》(2份打包,解析版+原卷版),文件包含新教材高一数学必修第二册暑假作业第14练《概率》解析版doc、新教材高一数学必修第二册暑假作业第14练《概率》原卷版doc等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。
这是一份新教材高一数学必修第二册暑假作业第12练《空间直线、平面的垂直》(2份打包,解析版+原卷版),文件包含新教材高一数学必修第二册暑假作业第12练《空间直线平面的垂直》解析版doc、新教材高一数学必修第二册暑假作业第12练《空间直线平面的垂直》原卷版doc等2份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。
这是一份新教材高一数学必修第二册暑假作业第11练《空间直线、平面的平行》(2份打包,解析版+原卷版),文件包含新教材高一数学必修第二册暑假作业第11练《空间直线平面的平行》解析版doc、新教材高一数学必修第二册暑假作业第11练《空间直线平面的平行》原卷版doc等2份试卷配套教学资源,其中试卷共39页, 欢迎下载使用。