1、浅析因特网上的音频/ 视频服务技术摘要:随着信息技术和网络应用以几何性和爆炸性的速度急剧发展,新技术革命对整个社会生活必将产生划世纪的深刻而深远的影响。即使无视纳斯达克和网络股的涨跌,互联网络、多媒体、远程传输、宽带通讯、电子商务等等这些新生事物,也已经在不容置疑地日渐改变着我们的工作和生活方式。面对这场由信息革命发起的新的挑战,如何在新经济格局中寻找和建立新的市场定位,改造和完善价值链,提升竞争实力,确保并不断提高市场份额,成为众多行业和企业所面临的严峻课题。因特网(Internet)作为一种新的媒体和信息传播方式,目前已逐步深入到全世界的每一个角落,同广播电视、报纸、杂志等传统媒体一样,I
2、nternet 正逐步成为信息的重要来源之一。随着互联网技术的日益普及和迅猛发展,网络上的信息已不仅仅局限于文字和图形,音频和视频以及矢量动画、虚拟现实等多媒体技术为网络带来崭新的应用前景和强劲的生命力。视音频播放与平面媒体在因特网上发布的内容有本质的不同。平面媒体多以文字传播为主要方式,其媒体信息很容易转换成因特网上的发布内容,而视音频播放更强调的是人们视觉上的效果,由于视频信息存储量的巨大,使得在因特网上实现视频播放存在一定的难度。随着宽带技术的普遍应用、解压缩技术的不断提高,网上视频播放已成为可能。虽然目前网上视频播放的效果及画面大小还不如人意,但其发展势头非常迅猛,与几年前相比已有了长
3、足的进步。而自动根据网络速度传输相应图像的流技术的普及应用,更使视频播放时通时断的问题得以根除,该技术的发展和推广,使真正意义上的因特网视音频播放已成为可能。关键词:因特网、流媒体、交互式音频/视频、广播技术一、 因特网音频/视频服务的种类1、 流式( streaming)存储音频/视频 这种类型是先把已压缩的录制好的音频/视频文件(如音乐、电影等)存储在服务器上。用户通过因特网下载这样的文件。流式存储音频/视频文件下载的特点是边下载边播放,即在文件下载后不久(例如,几秒钟到几十秒钟后)就开始连续播放。2、 流式实况音频/视频 这种类型和无线电台或电视台的实况广播相似,不同之处是音频/视频节目
4、的广播是通过因特网来传送的。流式实况音频 /视频是一对多(而不是一对一)的通信。它的特点是:音频/视频节目不是事先录制好和存储在服务器中,而是在发送方边录制边发送(不是录制完后在发送) 。在接收时也是要求能够连续播放。接收方收到节目的时间和节目中的事件的发生时间可以认同是同时的(相差仅仅是电磁波的传播时间和很短的信号处理时间) 。3、交互式音频/视频 这种类型的用户是使用因特网和其他人进行实时交互式通信。现在的因特网电话和因特网电视会议就属于这种类型。- 2 -二、 因特网上音频/视频服务技术1 流媒体技术 流媒体( Streaming)技术是指在发送端和接收端之间以独立于网络负载的以给定速率
5、传输音频、视频信息的一种传输技术。1.1 流媒体技术的原理流媒体技术是一种使用流式传输连续的时基媒体的技术。流式传输方式是将视频、音频等其他媒体压缩为一个个压缩包,由视频服务器向用户计算机连续、实时传送,只需要在用户端缓存足够可播放的视频容量就可以开始播放。流式传输技术又分两种,一种是顺序流式传输,另一种是实时流式传输。顺序流式传输是顺序下载,在下载文件的同时用户可以观看,但是,用户的观看与服务器上的传输并不是同步进行的,用户是在一段延时后才能看到服务器上传出来的信息,或者说用户看到的总是服务器在若干时间以前传出来的信息。在这过程中,用户只能观看已下载的那部分,而不能要求跳到还未下载的部分。顺
6、序流式传输比较适合高质量的短片段,因为它可以较好地保证节目播放的最终质量。它适合于在网站上发布的供用户点播的音视频节目。在实时流式传输中,音视频信息可被实时观看到。在观看过程中用户可快进或后退以观看前面或后面的内容,但是在这种传输方式中,如果网络传输状况不理想,则收到的信号效果比较差。传统文件下载方法和流媒体方式下载方式的比较如下图所示:万维网服务器客户机 服务器媒体播放器 GET: 音频/视频文件 RESPONSE 音频/视频文件浏览器图 1 传统的下载文件方法- 3 -万维网服务器客户机 服务器媒体播放器 元文件浏览器 GET: 元文件 RESPONSE GET: 音频/视频文件 RESP
7、ONSE图 2 具有元文件的万维网服务器的流媒体下载方式 浏览器用户使用 HTTP 的 GET 报文接入到万维网服务器。这个超链指向一个元文件。这个元文件有实际的音频/视频文件的统一资源定位符 URL。 万维网服务器把该元文件装入 HTTP 响应报文的主体,发回给浏览器。 客户机浏览器调用相关的媒体播放器,把提取出的元文件传送给媒体播放器。媒体播放器使用元文件中的 URL ,向万维网服务器发送 HTTP 请求报文,要求下载音频/视频文件。万维网服务器发送 HTTP 响应报文,把该音频/ 视频文件发送给媒体播放器。媒体播放器边下载边解压缩边播放。 1.2 流媒体系统组成流媒体是由各种不同的互相通
8、信交互的软件系统构成的,一个最基本的流媒体系统必须包括编码器(Encoder) ,服务器(Server) 和播放器(Player) 三个模块,如图 1 所示。模块之间通过特定的协议互相通信,并按照特定格式互相交换文件数据。其中编码器用来将原始的音视频转换成合适的流格式文件,服务器向客户端发送编码后的媒体流,客户端播放器则负责解码和播放接收到的媒体数据。流媒体的结构组成如图所示:- 4 -图 3 流媒体系统基本结构1、编码工具。即用于创建、捕捉和编辑多媒体数据,形成流媒体格式。利用媒体采集设备进行流媒体的制作。它包括了一系列的工具,从独立的视频、声音、图片、文字组合到制作丰富的流媒体。这些工具产
9、生的流媒体文件可以存储为固定的格式,供发布服务器使用。2、流媒体数据。即媒体信息的载体。常用流媒体数据格式有.ASF、.RM等。3、服务器。即存放媒体数据。由于要存储大容量的影视资料,因此该系统必须配备大容量的磁盘阵列,具有高性能的数据读写能力,可以高速传输外界请求数据并具有高度的可扩展性、兼容性,支持标准的接口。这种系统配置能满足上千小时的视频数据存储,实现片源的海量存储。4、网络。即适合多媒体传输协议甚至是实时传输协议的网络。流媒体技术是随着互联网络技术的发展而发展起来,它在现有互联网络的基础上增加了多媒体服务平台。5、播放器。即供用户欣赏网上媒体的软件。流式媒体系纺支持实时音频和视频直播
10、和点播,可以嵌入到流行的浏览器中,可播放多种流行的媒体格式,支持流媒体中的多种媒体形式,如文本、图片、Web 页面、音频和视频等集成表现形式。在带宽充裕时,流式媒体播放器可以自动侦测视频服务器的连接状态,选用更适合的视频以获得更好的效果。目前应用最多的播放器有美国 Real Networks 公司的 Real Player、美国微软公司的 Media Player、美国苹果公司的Quicktime 三种产品。1.3 流式传输协议流媒体协议是流媒体技术的一个重要组成部分,也是基础组成部分。因特网工程任务组的主要工作是设计各种协议来规范与发展世界标准化组织。流媒体服务中最重要的协议是实时流式协议
11、RTSP(Real-Time Streaming Protocol) 。RTSP 协议以客户服务器方式工作,它是一个多媒体播放控制协议,用来使用户在播放从因特网下载的实时数据时能够进行控制,如:暂停/继续、后退、前进等。因此 RTSP 又称为 “因特网录像机遥控协议” 。RTSP 的语法和操作与 HTTP 协议的相似(所有的请求和响应报文都是ASCII 文本) 。但与 HTTP 不同的地方是 RTSP 是有状态的传输协议(HTTP 是- 5 -无状态的) 。RTSP 记录客户机所处于的状态(初始化状态、播放状态或暂停状态) 。RTSP 协议建立并控制一个或几个时间同步的连续流媒体,如音频和视频
12、。尽管连续媒体流与控制流交叉是可能的,但 RTSP 本身并不发送连续流,换言之,RTSP 充当多媒体服务器的网络远程控制。RTSP 提供了一个可扩展框架,实现实时数据(如音频与视频)的受控、按需传送。数据源包括实况数据与存储的剪辑。RTSP 用于控制多个数据发送会话,提供了选择发送通道(如UDP、组播 UDP 与 TCP 等)的方式,并提供了选择基于 RTP 的发送机制的方法。图 3 表示使用 PTSP 的媒体服务器的工作过程。万维网服务器客户机 服务器媒体播放器 元文件浏览器媒体服务器音频音频 /视频流视频流 GET: 元文件 RESPONSESETUP RESPONSEPLAY RESPO
13、NSE RESPONSE TEARDOWN 图 4 使用 RTSP 的媒体服务器的工作过程浏览器向万维网服务器请求音频/视频文件。万维网服务器从浏览器发送携带有元文件的响应。浏览器把收到的元文件传送给媒体播放器。媒体播放器的RTSP客户发送SETUP报文与媒体服务器的 RTSP 服务器建立连接。媒体服务器的 RTSP 服务器发送响应 RESPONSE 报文。媒体播放器的 RTSP 客户发送 PLAY 报文,开始下载音频/视频文件。 RTSP 服务器发送响应 RESPONSE 报文。- 6 - RTSP 客户发送 TEARDOWN 报文断开连接。 RTSP 服务器发送响应 RESPONSE 报文
14、。 2 交互式音频/视频交互式音频/视频服务是指用户使用因特网和其他人进行实时交互式通信,现在的因特网电话和因特网电视会议就属于这种类型。目前交互式通信最典型的代表就是 IP 电话通信。在交互式音频/视频服务的协议层如下图所示:TCP UDP信令服务质量IPv4/IPv6RTSP RTCPRSVPH.323 SIP RTP应用层协议音频/视频SDP底层网络图 5 提供实时交互式音频/视频服务所需的应用层协议1、VP(资源预留协议) 。该协议促使流数据的接收者主动请求数据流路径上的路由器,并为该数据流保留一定的资源(即带宽) ,从而保证一定的服务质量。RSVP 是一个在 IP 上承载的信令协议,
15、它允许路由器网络任何一端上终端系统或主机在彼此之间建立保留带宽路径,为网络上的数据传输预定和保证服务质量。(1)RSVP 协议中涉及到发送者和接收者的概念,这两个概念是在逻辑上进行区分的。发送者指发送路径消息的进程,而接收者是指发送预留消息的进程,同一个进程可以同时发送这两种消息,因此既可以是发送者也可以是接收者。(2)资源预留的分类。专用预留:它所要求的预留资源只用于一个发送者,即在同一会话中的不同发送者分别占用不同的预留资源。共享预留:它所要求的预留资源用于一个或多个发送者,即在同一会话中的多个发送者共享预留资源。(3)RSVP 提供两种发送者选择方式。通配符方式:默认所有发送者,并通过预
16、留消息中所携带的源端地址列表来限制通配符滤波器。显式指定方式:滤波器明确指定一个或多个发送者来进行预留。2、RTP(实时传输协议) 。用于 Internet 上针对多媒体数据流的传输。RTP协议为数据提供了具有实时特征的端对端传送服务,如在组播或单播网络服务下的交互式视频音频或模拟数据。应用程序通常在 UDP 上运行 RTP 以便使用其多路结点和校验服务。RTP 可以与其他适合的底层网络或传输协议一起使用。如果底层网络提供组播方式,那么 RTP 可以使用该组播表传输数据到多个目的- 7 -地。3、RTCP(实时传输控制协议) 。实现通过客户端对服务器上的音视频流做播放、录制等操作请求。该协议通
17、过 RTSP 协议实现了在客户端应用程序中对流式多媒体内容的播放、暂停、快进、录制和定位等操作。RTP 和 RTCP 一起提供流量控制和拥塞控制服务。3 网上音视频广播技术1 网上音视频广播系统因特网音/视频广播是以因特网为传播介质,提供音频和视频业务。 因特网上的广播电视节目作为一个音频或视频数据类型嵌套在www服务器的页面上供用户点击接收,用户使用浏览器或下载专用接收插件就可以收到音/视频节目。网上音/视频广播系统由服务器系统和用户端播放器构成服务器系统包括音/视频广播文件的制作工具、发布服务器系统和监控系统通过视频捕捉卡先将音/视频信号实时捕捉成数字信号,然后利用相应的制作软件将其编码、
18、压缩成实时的广播数据流文件,或者将录制好的音视频文件编码、压缩成适合因特网传输的较小的广播文件;将数据流文件存放到广播服务器,由后者随时诊听来自用户端的请求,并根据请求将相应内容提供绐用户。广播服务器同时还具备多用户并发功能,即同时响应多个用户的请求;监控系统负责检测服务器的运行和负载情况 并可调整和设置服务器的选项。用户端播救器的功能是向广播服务器发出广播请求接收并播放由广播服务器发送的音视频广播内容。2 数据流压缩方式网上音/视频广播主要采用流媒体播放技术和下载播放技术。前者应用最普遍,一般情况下同上音/视频广播技术,专指流媒体播放技术。由于因特网带宽的限制,尤其是大多数用户目前仍采用窄带
19、接入方式(如电话拨号)上网,为实现网上音视频广播,须对数据流进行压缩。目前实现网上音视频广播主要有以下三种解决方案:aReaINetwork的Real Broadcast系统它由服务器系统Real Serger,用户端播放软件Real Player,数据流创作工具Real Publisher Real Ennoder和RealPresenter组成,其特点是:(1)能根据实际带宽提供不同质量的数据流; (2)针对不同的应用提出不同的解决方案;(3)通过Web方式监测和管理服务进程;(4)支持目前流彳亍的所有操作平台;(5)提供开放平台和API便于用户对系统进行扩展;(6J在双机或多机状态下可进
20、行负载平衡动态分配数据赢 Real Broadcast系统目前市场占有率超过80。b. 微软的Windows MediaTechnology系统它由服务器系统Windows MediaServer。制作工具(Windows Media Encoder,OnDemond Producer、PremierePlugin等)和用户播放软件Windows Media Player组成, 其特点是:(1)采用独有的智能流技术,能自动监测网络工作状况,并根据网络的实际带宽,动态优化数据流质量,以便在网络带宽不稳定时保证最佳视音频质量;(2)提供大范围(从144kbs音频到ATM局域网环境下全屏视频)的多媒
21、体数据类型;(3)与其它多媒体服务紧密集成;(4)提供全面、易于使用的多媒体服务。- 8 -cApple的OuickTfme系统QuickTime系统是面向专业视频编辑、Web网站创建和CDROM内容制作的多媒体技术平台,它由三部分组成:QuickTime电影(Movie)文件格式、QuickTime媒体抽象层和QuickTime内置媒体服务系统。其主要特点是:(1)具有目前最高音,视频播放质量的播放器;(2)支持各种格式的静态图像文件;(3)采用内置式Web测览器插件(Plugin)技术;(4)支持1ETF(Internet Engineering TaskForce)流标准,以及RTP、R
22、TSP、SDP、FTP和HTTP等网络协议;(5)支持多种视频和动画格式。三、 结语随着计算机技术的不断发展以及网民对音/视频文件需求的增加,因特网音 /视频服务技术将会日臻成熟并稳步发展。全球信息化是因特网技术发展的必然趋势,如何构建网络环境下高质量的音/视频服务,对于我们来说是一个新的课题。随着宽带网络的发展,因特网上音/视频服务技术特别是流媒体技术必将成为未来互联网上的主流技术,而研究新的传输协议、新的传输介质、新的存储介质将成为未来互联网研究的主要方向。参考文献【1【 谢希仁;计算机网络(第五版);电子工业出版社【2【 胡泽,赵新梅;流媒体技术与应用;中国广播电视出版社【3【 贾代平,范辉; 流媒体技术及其应用技术研究 综述J; 计算机工程;2005年02期【4【 周志强,季平吴,彝鼐,董年初;网络媒体与网上音视频广播技术;世界广播电视;2001年第15卷第12期