粤教版 (2019)必修1 数据与计算第一章数据与信息1.2 数据编码本节综合与测试精品课件ppt

展开

这是一份粤教版 (2019)必修1 数据与计算第一章数据与信息1.2 数据编码本节综合与测试精品课件ppt，共27页。

将现实世界的事物现象符号化、数据化，需要有一个理解、抽象、推理的过程，这个过程由计算机来完成。计算机将它们处理转换成0和1组成的二进制编码，进而采用基于二进制的算术运算和逻辑运算进行处理。
1.2.1 模拟信号与数字信号
众所周知，声、光信号是人的感官所能识别和接收的信号，而计算机是一种采用电信）（号进行运作的机器。要将人的感官所能识别的信号转换为计算机能够识别的信号，实现人机交互，就必须清楚计算机是如何处理这些信号的。
1.模拟信号模拟信号是指用连续变化的物理量所表达的信息。其信号的幅度、频率或相位随时间作连续变化，如声音信号、图形信号等。模拟信号的波形可以是简单的，也可以是复杂的。例如，由单一钢琴定音器产生的声波，就是简单波形，仅仅包括一个单一频率（图1-6); 人类或管风琴的声音产生的声波，就是复杂波形，包含了许多不同频率的组合（图1-7)
模拟信号是传导能量的一种方式。例如，声波通过空气等介质来向远处传送能量，在传播的过程中，能量会不断被损耗而逐渐衰减，如图1-8所示。无论是有线相连的电话，还是无线发送的广播电视，都是通过模拟信号来传递信息的。
2.数字信号数字信号数字信号是离散时间信号的数字化表示。信号的自变量、因变量都是离散的。例如，开关电路中输出电压和电流脉冲就是离散的信号，如图1-9所示。
在计算机中,数字信号的大小常用有限位的二进制数表示。例如，字长2位的二进制数可表示00、01、10和1四种数字信号。尽管基于数字信号的数据通信才出现几十年,但因其抵抗电路本身干扰和环境干栊的能力强,且数字信号有利于存储、加密与纠错,从而具有较强的保密性和可靠性。因此在现代技术的信号处理中,数字信号发挥的作用越来越大,覆盖的范围越来越广。
探究活动分析分析、比较模拟信号与数字信号在通信应用中的优劣，用间接的文字将结论填入表1-2中。
实验在航海灯语系统中，灯语是一种通信手段，用灯光一明一暗的间歇做出长短不同的信号来传递信息。在古代，灯语对人们之间的交流起到很大的作用。随着科技的发展，灯语已经通过计算机网络实现了灯光信号的自动发送、获取和识别。1. 实验名称:用手电筒传递信息。2. 实验目的:了解灯语的使用场景，理解数据编码的必要性。3.实验步骤:(1)两人一组，一人控制手电筒开关，按照莫尔斯码发送一组字母，另一人观察手电筒发出的光信号，记录数据，并使用莫尔斯码译出这组字母。(2)双方核对信息，多次重复实验。(3)通过分析实验数据，总结该方法传递信息的利弊，提出改进方法。(4)设计一套自己的灯语，用“密码”传送信息。
1.2.2 编码的基本方式
在现代技术的信号处理中，数据基本上是通过编码经模拟信号转换为数字信号进行存储和传输，文字、图像、声音等类型的数据都可经过编码进行存储和传输。1.文字编码文字(字符）编码是效率相对较低的编码方式，有单字节码和双字节码两种。其中，ASCII码、莫尔斯码属于单字节码，国标码（GBK)、统一码(Unicde)属于双字节码。( 1 ) ASCII码。1960年，香农创立了数字计算机的基本字符编码系统，简称ASCII码(AmericanStandard Cde fr Infrmatin Interchange)，用7位二进制码为所有的英文字母(大小写52个)、阿拉伯数字（ 10个）和常用的不可见控制符（33个）以及标点符号、运算符号等(33个）建立了转换码，第一次将符号转换为“0”和“1”构成的编码。从表1-3可知，英文字母A和a的编码分别为01000001(十进制数65）和01100001(十进制数97）。
思考在计算机中，英文字母、数字、符号等都可用ASCII码来表示，如大写字母“C”的编码为8位二进制01000111，数字“9”的编码0001001等。可是，中文却难以用ASCII码来表示。如果要设计一套汉字的编码系统，可以如何进行？仿照ASCII编码系统的方法，描述大致的设计思路，并在小组内交流。仿照ASCI码，描述设计思路:
(2)国标码。由于ASCII码只包含英文、数字和一些控制符号，并不能表示汉字，因此，我国设计了用于处理汉字的简体中文的GB码和用于繁体中文的BIG5码(大五码)。1980年发布的《信息交换用汉字编码字符集》(GB 2312)一共收录了7445个字符，包括6763个汉字和682个其他符号。GB 2312主要分为两部分:编号127之前的符号跟ASCII码所表示的意义相同，属于单字节码;编号127之后的符号统一用两个字节表示，包含了几乎所有的简体中文字（中文编码高字节的最高位不为0）。1995年公布的《汉字内码扩展规范》(GBK 1.0)收录了21 886个符号，分为汉字区和图形符号区,汉字区包括21003个字符。
2.图像编码图像编码是指在满足一定保真度的条件下，对图像数据进行变换、编码和压缩，以较少比特数表示图像或图像中所包含的信息的技术。我们以位图(Bitmap）为例来说明图像的编码原理与方法，以及图像文件的大小计算方法。
（1）位图图像编码。位图,最小单位为光栅点（或称像素),因而也叫作点阵图（或像素图)。位图采用位映射存储格式，即将每一个像素映射为一个数据，存放在以字节为单位的矩阵中。例如，在如图1-10所示的黑白图像中，共有32×2个像素，如果将黑、白像素分别映射为1和0，就表示为11111111，00000110，10000110，11111111,10000001,01100011，01111100，10000001，这就是该黑白图像的二进制编码。通常图像编码采用16进制编码，因而图1-10的编码为“FF，06，86，FF,81，63，7C，81”。
(2）位图文件大小。在计算机二进制数系统中，每个0或1就是一个位( bit，数据存储的最小单位）,8个位就称为一个字节( Byte ）。黑白图像，每一个像素有2种可选颜色(黑、白），称为1位图像。因此，图1-10中所包含的图形数据为32×2÷8=8个字节。16色图像，每一个像素有16种可选颜色，称为4位图像（24=16) ; 256色图像称为8位图像( 28=256) ;24位图像的可选颜色更丰富，为224种。
实际上，一个位图文件除了包含图形数据，还包括文件头、位图信息头、颜色信息、图形数据等几部分。①文件头:包含文件的类型、大小和位图起始位置等信息，共14个字节。②位图信息头:用于说明位图的尺寸等信息,占40个字节。③颜色信息:用于说明位图中的颜色，有若干个表项，每一个表项定义一种颜色。当图像量化位数为1、4、8时，分别有2、16、256种颜色，每个颜色表项占4个字节;当图像量化位数为24时,没有颜色表项。④图形数据:记录位图的每一个像素值,其记录顺序先从左到右，再从下到上。一般情况下，位图文件所占用的空间可按以下公式计算:文件的大小=文件头+信息头+颜色表项+图像分辨率×图像量化位数÷8其中，图像分辨率=图像x方向的像素数×图像y方向的像素数。图像量化位数，也叫图像深度，是指图像中每个像素点记录颜色所用二进制数的位数，如8个字节的灰度图像和索引图像的颜色数为256种。
3.声音编码对声音进行数据编码，必须经过前期的数据采样和数据量化。（1）采样。采样就是把输入的模拟信号按适当的时间间隔得到的各个时刻的样本值，使其转换为时间上离散、幅度上连续的脉冲信号。根据奈奎斯特采样定理，若果一定时间间隔对某个信号f（t）进行采样，并且采样频率高于该信号最高频率的两倍，则采样值包含了原信号的全部信息，如下图。对于音频信号，常用的采样频率有三种：44.1kHz、22.05kHz和11.025kHz。
（2）量化。量化是把样值信号的无限多个可能的取值，近视地用有限个数值来表示。首先是将采样信号幅度划分为若干量化等级(国标声音量化等级分为256个，即2^8个)，然后将采样后的信号幅度与所划分的各个量化等级进行比较，向下取最接近的量化等级的数值，如图1-12所示。
（3）编码。编码足将量化后的采样值用二进制数码表示，并转换为由二进制编码0和1组成的数字信号。模拟信号采样后可用8位二进制数表示，最高位表示符号，正数为，负数为1。例如，采样值48的二进制编码为001 1000 - 10的二进制编码为1100100，如表1-4所示:
编码时采用的二进制位数越多，数据量越大。古用的存储空间也越大。以声音信息为例，其存储空间遵循如下公式:声音存储空间=采样频率x量化位数x声道数x时间/8例如。采样频率为44.1kHz.量化位数为16位的立体声，1秒声音所需字节数为44.1x1000x16x2x1/8=176.4 (KB ) 编码后的信号可以实现无差错的数据传输，如图1-13所示。
讨论各小组讨论如何减少声音信号还原时的失真，提高声音的保真度。提出改进方案后，继续实验探索，直到得出结论。实践1. 有一幅24位的位图图像，像素为1024X8002试确定其数据文件的大小。2若将上述图像另存为256色位图围像，则文件大小为多大?3. 试上网查询有关视频编码的知识，了解视频是如何被编码的。
实际上，不仅文字，图像。声音等类型的数据可以被编码，视频等数据也都可以被编码成数据文件。程序设计，简称编程，也属于编码，是运用程序设计语言，实现人机交互，提高计算机应用效率，为实现操作程序化要求所进行的编码。有关程序设计的内容将在后续章节中学习。总之，编码是数据存储及其表现的基础，也是人们认识世界的基础。
拓展：布尔代数与图灵机现实世界的任何事物，如果用计算系统进行识别、存储和计算，首先需要将其符号化。所谓符号化，是指将现实世界的任何事物用符号表达，进而进行基于符号的计算的一种思维方式。将事物表达为不同的符号，便可采用不同的工具（或数学方法)进行计算;将符号赋予不同事物的意义，则能计算不同的现实世界问题。所谓逻辑，是指事物因果之间所遵循的规律，是现实中普遍的思维方式。布尔在汲取亚里士多德和莱布尼茨形式逻辑符号化思想的基础上，创立了用O和1表达、处理现实中命题判断与推理(1表示真/0表示假）的基于二进制逻辑的代数系统，为电子计算机的开关电路设计提供了重要的数学方法和理论基础。二进制由0和1两个数码组成，逢2进1，借1当2，第i数位的权值为2。之所以青睐二进制，是因为:①二进制算术运算规则简单;②二进制算术运算可以与逻辑运算实现统一，或者说可以用逻辑运算实现算术运算;③能表示两种状态的元器件容易找到，如继电器开关、灯泡、二极管或三极管等。因此，计算机硬件存储和处理的是二进制数。
20世纪30年代，图灵提出了图灵机模型，直观且形象地说明了通用计算机器的工作机理，建立了指令、程序及通用机器执行程序的理论模型，奠定了计算理论的基础。图灵认为，所谓计算就是计算者(人或机器）对一条两端可无限延长的纸带上的一串0或1执行指令，一步一步地改变纸带上的0或1，经过有限步骤，最后得到一个满足预先规定的符号串的变换过程，如图1-14所示。数据被制成一串0和1的纸带送入机器中，作为输入，如0001000001000011…机器可对输入纸带执行的基本动作包括翻转O为1，或翻转1为0，前移一位，停止。机器对基本动作的执行是由指令来控制的，机器是按照指令的控制选择执行哪个动作，指令也可以用0和1来表示:01表示翻转0为1(当输入为1时不变)，10表示翻转1为0（当输入0时不变)，11表示前移一位，00表示停止。输入如何变为输出的控制可以用指令编写一个程序来完成，如011110110111011100。机器能够读取程序，按程序中的指令顺序读取指令，读一条指令执行一条指令，由此实现自动计算。因此可以说，图灵机就是一个最简单的计算机模型，图灵机将控制处理的规则用0和1表达,将待处理的信息及处理结果也用0和1表达，处理即是对0和1的变换，这样可以用机械或电子系统实现。