第8章 多媒体技术基础

发布时间 : 星期四 文章第8章 多媒体技术基础更新完毕开始阅读

②视频转换卡。用于将计算机的VGA信号与模拟电视信号相互转换。视频转换卡分为两种:VGA-TV卡,一般集成在中高端显卡中,利用此卡可将计算机与电视相连,通过电

视显示计算机中的图像;TV-VGA卡,也叫电视卡,利用此卡可以在计算机中观看电视节

目,好一点的电视卡还配有遥控器。

2.多媒体外围设备

以外围设备形式连接到计算机上的多媒体硬件设备有:CD-ROM、DVD、扫描仪、打

印机、数码相机、触摸屏、摄像机、录像机、传真机、可视电话、Modem、麦克风、多媒体音箱等。

8.2.2 多媒体计算机的软件系统

多媒体计算机的软件系统按功能划分为3个层次:多媒体核心软件、多媒体工具软件和多媒体应用软件。在这三个层次中,多媒体操作系统是整个多媒体计算机系统中用于沟通硬件系统和软件系统的接口,是应用的基础。

多媒体核心软件通常包括多媒体操作系统、音/视频支持系统,或媒体设备驱动程序等,如声音卡、CD-ROM驱动器、视频卡驱动程序等。

多媒体工具软件为开发工具,包括多媒体数据处理软件、多媒体软件工作平台、多媒体软件开发工具和多媒体数据库系统等。如Photoshop,3DMAX,Flash等软件,以及图像处理软件、图形生成软件、声音编辑软件、动画生成软件、视频处理软件和合成软件等。

多媒体应用软件是供最终用户使用的产品,如超级解霸等多媒体播放器。

8.2.3 多媒体计算机系统标准

多媒体的硬件设备和工具软件非常多,那么如何衡量一个计算机系统是否就是一个多媒体计算机系统呢?下面就来介绍几个与多媒体计算机系统相关的标准。

在交互式多媒体协会(Interactive Multimedia Association,IMA)兼容性计划的指导下,Microsoft,Philips,Tandy和NEC等14家著名厂商于1990年筹建了多媒体PC市场协会(Multimedia PC Marketing Council)。1991年10月8日该协会发表了第一代多媒体MPC规格,在该规格中CPU采用的是80386 SX/16,内存容量为2MB,如表8——1所示;在1993年5月发表了MPC2.0的技术规格,在该规格中CPU采用的是80486 SX/25,内存容量为4MB。随着计算机技术的不断发展,MPC标准也在提高,比如1996年发表了MPC4.0的技术规格,在该规格中CPU采用的是Pentium 133,内存容量为16MB。而就现在来说,普通MPC的配置已经完全超过了这一标准,并且还在迅速发展。MPC规定了多媒体PC机系统的最低要求,凡符合或超过这一规范的系统以及能在该系统上运行的软、硬件都可以用“MPC”标识。

表8——1 MPC技术规格 MPC1.0 MPC2.0 MPC3.0 MPC4.0 CPU 80386 SX/16 80486 SX/25 Pentium 75 Pentium 133 硬盘容量 80MB 160MB 850MB 1.6GB 内存容量 2MB 4MB 8MB 16MB CD-ROM 1x 2x 4x 10x 软驱 1.44MB 1.44MB 1.44MB 1.44MB 声卡 8位 16位 16位 16位 颜色 256色 65535色 16位真彩 32位彩 分辨率 640×480 640×480 800×600 1280×1024 操作系统 Windows 3.x Windows 3.x Windows 95 Windows 95 MPC的标准是根据当时PC硬件的发展水平制定的,只是提出了系统的最低要求,仅是一种参照标准。今后MPC的新特性是:支持DVD、支持通用串行总线USB、内存规格为64MB—128MB、具有TV功能、全立体声、多监视器、集成化网络接口卡等。

8.3 多媒体信息的表示

尽管多媒体信息的表现形式各不相同,但在计算机中都是采用二进制来表示和处理的,都是数字化的信息。在多媒体计算机系统中,需要对声音、文字、视频图像、静态图像、图形等多种媒体进行数字化处理,只是不同媒体信息的具体表示方法及处理方法是不一样的。

数字化处理多媒体信息的一般过程是:首先把音频和视频等媒体信号数字化,以二进制数据的形式存入到计算机存储器中,然后根据多媒体信息的各自特点进行相应的处理,最后以用户要求的形式表现出来。数字化处理的优点是能充分利用计算机的功能进行信息处理,但随之带来的一个显著问题是数字化的音频、视频数据量很大,需要大容量的存储器。另一方面,音频、视频信号的输入和输出都需要实时效果,这就要求计算机提供高速处理能力,来满足多媒体处理的实时性要求,同时,多媒体计算机系统信息获取和表现也需要有专门的外设来提供支持。

8.3.1 文字

1.英文字符编码

英文字符采用ASCII码。标准的ASCII码由7位二进制数编码,可以表示128个字符,扩展的ASCII码用8位二进制数编码,可以表示256个字符。

2.汉字编码

汉字字符编码采用GB2312-80国标码。规定用两个字节的十六位二进制表示一个汉字,

每个字节都只使用低7位,共编有常用汉字3755个,次常用汉字3008个,以及数字、字母、符号等682个,共7445个。

汉字输入编码很多,主要的有4类:数字编码、字音编码、字形编码和音形编码。区位码、电报码属于数字编码,以汉字拼音为基础的属于字音编码,五笔字型输入法是一种字形编码,二笔字型输入法是一种音形编码。

8.3.2 音频

音频(Audio)也叫音频信号或声音,其频率范围在20 Hz~20 kHz。声音主要包括波形声音、语音和音乐3种类型。从声音是振动波的角度来说,波形声音实际上已经包含了所有的声音形式,是声音的最一般形态;人的说话声(语音)不仅是一种波形声音,更重要的是它还包含丰富的语言内涵,是一种特殊的媒体;音乐与语音相比,形式更为规范一些,音乐是符号化的声音,也就是乐曲,乐谱是乐曲的规范表达形式。三类声音有共同的特性,也有它们各自的特性,使用计算机处理这些声音,既要考虑它们的共性,也要利用它们各自的特性。

1.声音信号

声音是人耳所感知的空气振动。声音信号通常用连续的随时间变化的波形来表示,是模拟信号。

(1)声音信号的基本参数频率和带宽

信号每秒钟变化的次数,单位是Hz。频率高,则音调高,频率低,则音调低。人耳可感受的声音信号频率范围为20Hz~20 kHz。一般来说,频率范围(带宽)越宽,声音质量越高。

①CD质量(Super Hi Fi)音频带宽为10~20 000Hz ②FM无线电广播的带宽为20~15 000Hz ③AM无线电广播的带宽为50~7 000Hz ④数字电话话音带宽为200~3 000Hz (2)周期

相邻声波波峰间的时间间隔。 (3)幅度

表示信号强弱的程度。幅度决定信号的音量。 (4)复合信号

音频信号由许多不同频率和幅度的信号组成。在声音中,最低频率为基音,其他频率为谐音,基音和谐音组合起来,决定了声音的音色。

2.声音信息的数字化

音频数字化就是将模拟的声音波形数字化,以便计算机处理,包括采样、量化、编码三个步骤。

(1)采样

以固定的时间间隔(采样周期)抽取模拟信号的幅度值。采样后得到的是离散的声音振幅样本序列,仍是模拟量。采样频率越高,声音的保真度越好,但采样获得的数据量也越大。在MPC中,采样频率标准定为:11.025kHz,22.05kHz,44.1kHz。

(2)量化

把采样得到的信号幅度的样本值从模拟量转换成数字量。数字量的二进制位数是量化精度。在MPC中,量化精度标准定为8位,16位。

采样和量化过程称为模/数(A/D)转换。 (3)编码

把数字化声音信息按一定数据格式表示,它的实现方法是靠各种不同的压缩方法将数据编码压缩。

3.影响数字声音质量的主要因素

(1)采样频率

采样频率是指单位时间内的采样次数。采样频率越大,采样点之间的间隔就越小,数字化后得到的声音就越逼真,但相应的数据量就越大。声音采样频率以kHz(千赫兹)衡量。

(2)量化位数(采样位数)

量化位数是模拟量转换成数字量之后的数据位数。量化位数表示的是声音的振幅,位数越多,音质越细腻,相应的数据量就越大。量化位数主要有8位和16位两种。

(3)声道数

声道数是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有单数据流,而立体声则需要左、右声道的两个数据流。显然,立体声的效果要好,但相应的数据量要比单声道的数据量加倍。

声音数据量一般都被称为海量数据。这是因为对音质要求越高,数据量就越大。

8.3.3 图形与图像

1.图形

图形是指由点、线、面以及三维空间所表示的几何图,分为标量图形和矢量图形两种。标量图形又称位图图形,实为图像的一种。矢量图形是以一组指令集合来表示的,这些命令用来描述构成一幅图所包含的直线、矩形、圆、圆弧、曲线等的形状、位置、颜色等各种属性和参数。在显示图形时,需要相应的软件读取和解释这些指令,将其转换为屏幕上所显示的颜色。因此,矢量图形易于对各个成分进行移动、缩放、旋转和变形等转换,且放大后不会失真。通常所说的图形一般是指矢量图形。

2.图像

图像是一个矩阵,其元素代表空间的一个点,称之为像素(Pixel),每个像素的颜色和亮度用二进制数来表示,这种图像也称为位图。对于黑白图用1位表示,对于灰度图常用4位(16种灰度等级)或8位(256种灰度等级)来表示某一个点的亮度,而彩色图像则有多种描述方法。位图图像适合于表现比较细致、层次和色彩比较丰富、包含大量细节的图像。

和声音一样,图像的生成也有一个采样、量化、编码的数字化过程。 图像主要有分辨率、颜色模型和颜色深度三个技术指标。 分辨率是衡量图像细节表现力的技术参数,是指图像采样矩阵的大小。分为显示分辨率、图像分辨率和输出分辨率3种。通常所说的图片大小即指其显示分辨率。

在不同的应用场合,可能需要不同的颜色表示方法,因此有多种颜色模型。图片在显示器上的显示一般采用RGB颜色模型,由红(R)、绿(G)、蓝(B)组合而成。

颜色深度是指用来存储像素的颜色和亮度所用的二进制位数。颜色深度反映了构成图像的颜色的丰富性。

一幅没有经过压缩的数字图像的数据量大小可以按照下面的公式进行计算: 图像数据量大小=图像分辨率×颜色深度/8(字节) 例如一幅800×640的真彩色图像,它保存在计算机中占用的存储空间为: 800×640×24/8=921600B≈1.46MB

3.图形和图像的区别

图形和图像的区别体现在很多方面,例如数据来源不同、处理方法不同、理论基础不同、应用场合不同等等。下面仅从两方面进行简单介绍:

①数据来源不同。图形是由外部轮廓线条构成的矢量图,即由计算机绘制的直线、圆、矩形、曲线、图表等;而图像是由扫描仪、摄像机等输入设备捕捉实际的画面产生的数字图像,是由像素点阵构成的位图。

②编辑处理方法不同。图形通常用Draw程序编辑,产生矢量图形,可对矢量图形及图元独立进行移动、缩放、旋转和扭曲等变换,主要参数是描述图元的位置、维数和形状的指令和参数;而图像是用图像处理软件(Paint、Brush、Photoshop等)对输入的图像进行编辑处理,主要是对位图文件及相应的调色板文件进行常规性的加工和编辑。但不能对某一部分控制变换。由于位图占用存储空间较大,一般要进行数据压缩。

8.3.4 视频

视频是多媒体的重要组成部分。动态视频处理技术实现了图像/图形从静态到动态的过渡。视频和动画具有直观和生动的特点,其效果不是通过语言和文字的描述所能达到的,然

联系合同范文客服:xxxxx#qq.com(#替换为@)