1、1,第二章 媒体及媒体技术,2.1 媒体的种类和特点; 2.2 听觉媒体技术; 2.3 视觉媒体技术; 2.4 触觉媒体技术。,2,2.1 媒体的种类和特点,3,文本 文本的定义用字符代码和字符格式表示数据。 文本的分类; 非格式化文本 格式化文本文件,多媒体应用中可显示给用户的媒体形式。,4,2.1.1 常见的媒体元素,图形 图形的概念一般指用计算机绘制的画面。 图形文件的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。 图形文件的特点只记录生成图的算法和图上的某些特征点,也称矢量图。 line(x1,y1,x2,y2,color) circle(x,y,r,colo
2、r),5,2.1.1 常见的媒体元素,图形 图形的特征 图形是对图象进行抽象的结果(人工或自动); 图形的矢量化使得有可能对图中的各个部分分别进行控制(放大、缩小、旋转、变形、扭曲、移位等) 图形的产生需要计算时间,6,2.1.1 常见的媒体元素,图像 图像的概念 用数字点阵方式表示的场景画面。静止的图像是一个矩阵,由一些排成行列的点组成,这些点称之为像素点(pixel),这种图像称为位图(bitmap)。,7,2.1.1 常见的媒体元素,图像 图像的主要技术参数 分辨率 屏幕分辨率 计算机显示器屏幕显示图像的最大显示区 图像分辨率 数字化图像的大小 像素分辨率 像素的宽高比,一般为11,8,
3、图像的分类,矢量图与点位图点位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。点位图的缺点是: (1)存储和传输时数据量比较大。 (2)缩放、旋转时算法复杂且容易失真。,9,图像的分类,矢量图,点位图,10,图像的分类,灰度图,标准单色图 标准灰度图,1位,8位,11,图像的分类,彩色图,256色标准图像 24位标准图像,12,2.1.1 常见的媒体元素,图像 图形与图象的关系 图形是矢量概念,图元;图象是位图概念,象素;
4、 图形显示图元顺序;图象显示象素顺序; 图形变换无失真;图象变换有失真; 图形以图元为单位修改属性、编辑;图象只能对象素或图块处理; 图形是对图象的抽象,但在屏幕上两者无异,13,2.1.1 常见的媒体元素,视频 视频的概念由连续的画面组成。这些画面以一定的速率连续地投射在屏幕上,使观察者具有图像连续运动的感觉。,14,2.1.1 常见的媒体元素,视频 视频的制式 PAL制(625/50) 每秒25帧,水平扫描线为625条,水平分辨率240400个像素,隔行扫描 。62年诞生于德国,应用于中国大陆、新加坡、欧洲地区等(Pal-B、D、G、H、I、N、NC)。 NTSC制(525/60) 每秒3
5、0帧,水平扫描线为525条,水平分辨率240400个像素,隔行扫描 。53年诞生于美国,应用于美国、日本、台湾等(NTSC-M、NC、Japan等)。,15,2.1.1 常见的媒体元素,视频 视频的制式 SECAM制(625/50) 每秒25帧,水平扫描线为625条。由法国人提出,应用于俄罗斯、法国、非洲地区等。 视频的数字化指在一段时间内以一定的速度对视频信号进行捕获并加以采样后形成数字化数据的处理过程。,16,2.1.1 常见的媒体元素,视频 视频的技术参数 颜色空间 R、G、B(红、绿、蓝) Y、U、V(为亮度,U、V为色差) H、S、I(色调、饱和度、强度) 可以通过坐标变换而相互转换
6、 帧速 每秒钟显示的帧数目, 计量单位为帧率(fps) 视频根据制式的不同:30帧/秒(NTSC)、25帧/秒(PAL),17,2.1.1 常见的媒体元素,视频 视频的技术参数 数据量 帧速每幅图像的数据量(不计压缩 ) 图像质量 与数据源质量有关( :表示“好于”)RGB视频YUV视频Y/C视频(S视频)复合视频 与视频数据压缩的倍数有关,注1:UV两个色差信号可合成为一个色度信号C,进而形成Y/C记录方式,这种方式得到的视频称为S视频。,注2:把亮度Y与色度C进一步混合在一起,便形成复合视频。,18,2.1.1 常见的媒体元素,音频 分类 波形声音 (后缀 .WAV,.VOC) 包含了所有
7、的声音形式,它可以把任何声音都进行采样量化,并恰当地恢复出来。,19,用声音录制软件记录的英文单词“Hello”的语音实际 波形,20,2.1.1 常见的媒体元素,音频 分类 语音 人的说话声虽是一种特殊的媒体,但也是一种波形,所以和波形声音的文件格式相同。,音乐 (.MID, .CMF) 符号化了的声音,乐谱可转变为符号媒体形式。,只能记录规定的有限种乐器的组合,21,2.1.1 常见的媒体元素,音频 数字声音波形质量的主要技术参数 采样频率 单位时间采集的信号份数,份数越多,质量越好 11.025KHZ、 22.05KHZ、44.1KHZ 采样精度 每次采样信息量8位、16位通道数 声音产
8、生的波形数 单声道、立体声道、5.1声道,数据量计算: (采样频率采样精度通道数 时间 )/8 字节,22,2.1.1 常见的媒体元素,动画 动画的概念运动的图形,实质是一幅幅静态图形的连续播放。计算机设计动画方法 造型动画 :每一帧中图元表演 帧动画 :位图组成的联系画面,23,2.1.1 常见的媒体元素,动画 帧动画,24,2.1.2 媒体的种类,视觉,25,2.1.2 媒体与多媒体,听觉触觉其他感觉,其它(嗅觉、味觉等),26,2.1.3 媒体的性质和特点,各种媒体具有不同特点和性质 媒体是有格式的 不同媒体表达信息的特点和程度各不相同 媒体之间可以相互转换 媒体之间的关系也具有丰富的信
9、息 媒体具有空间性质 表现空间 ( 出现、显示的位置分布 ) 媒体按相互的空间关系进行组织 (本身的三维结构) 视觉空间、听觉空间和触觉空间这3者既相互独立又需要相互结合,27,2.1.3 媒体的性质和特点,媒体的时间性质 表现需要时间(时间点 属性) 媒体在时间坐标轴上的相互关系 (结构) 媒体的语义 媒体的语义是有层次的 抽象的程度不同,语义的重点也就不同 应用依赖于语义的理解媒体结合的影响 媒体结合是多层次的 媒体结合有利于信息接受和理解 隐喻 交互的概念模型,也称心智模型,28,2.2 听觉媒体技术,29,2.2.1 声音心理学,1.声音的量纲物理量纲:频率,幅度,相位;心理量纲:响度
10、,音调;,30,2.2.1 声音心理学,1.声音的量纲物理量纲和心理量纲不等同,也确有关系。响度取决于强度和频率;20HZ20kHZ音调取决于频率和声强。,31,2.2.1 声音心理学,1.声音的量纲物理量纲和心理量纲的关系:关系不是线性的;关系不是孤立的;关系不是一成不变的。,32,2.2.1 声音心理学,2.听觉特性 等响曲线 定义:等响曲线描述的是响度一定时,频率和强度之间的关系。曲线确定办法: 设定一标准音; 调整强度和频率,使得其响度相等。,结论:同一响度的声音,在频率和强度上可以有很大差别。,33,2.2.1 声音心理学,2.听觉特性 掩蔽 定义:一种声音的出现可能使得另一种声音难
11、以听清。声音的掩蔽效应可用于声音的压缩:,34,如图所示,一个声强为60 dB、频率为1000 Hz的纯音,另外还有一个1100 Hz的纯音,前者比后者高18 dB,在这种情况下我们的耳朵就只能听到那个1000 Hz的强音。如果有一个1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同时听到这两个声音。要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB。一般来说,弱纯音离强纯音越近就越容易被掩蔽。,声强为60 dB、频率为1000 Hz纯音的掩蔽效应,35,2.2.1 声音心理学,2.听觉特性 临界频带 定义:在频率的某一
12、临界区里,各种声音的强度是相互作用的,合成声音的响度由这些频率共同决定。对声音响度的处理可有的放矢。,36,确定一个声音的频率,则能够产生同时掩蔽的另外一个声音的频率范围称为“临界频带”(critical band)通常认为,在20 Hz到16 kHz的音频范围内有24个临界频带。临界频带的单位叫Bark(巴克)。 任何频率的细小声音都会因掩蔽效应而被临界频带内音量较高的声音所覆盖,37,2.2.1 声音心理学,2.听觉特性 相位 定义:声音的起点和方向。用途 回声的消除; 会议系统的声音设计。,38,2.2.1 声音心理学,2.听觉特性 自然声音的时变现象 声音的音调分成三个区域:起始区、稳
13、定状态区、延迟区。区域特点:,结论:声音的起始部分难以识别。,39,2.2.1 声音心理学,2.听觉特性 听觉空间声源位置的确定:低频靠时差,高频靠强度。通过声音的精确再现,就可构造出听觉空间。人耳3种机制:定位、减少干扰和使掩蔽达到最小。,40,2.2.1 声音心理学,2.听觉特性 听觉的频谱特性 定义:声音是时间函数,通过傅里叶变换可做出其频谱图。 人耳对频谱成分的波峰和波谷是非常敏感的。音色:由混入基音的泛音所决定的。每个基音都有其固有频率和不同音强的泛音,因此使得每个声音具有特殊的音色效果。,41,2.2.1 声音心理学,2.听觉特性 声音的心理模拟 定义:通过人工真实的方法,可以对听
14、觉空间的声音进行心理的模拟。 以流水声为例:声音高低流体的粘度冷暖音色流体的温度,42,2.2.2 音频的数字化和符号化,1音频的数字化与再现为什么要数字化?数字音频的特点:保真度好,动态范围大。 数字音频的产生:由外界声音经过采样、量化和编码后得到的。,43,2.2.2 音频的数字化和符号化,1音频的数字化与再现采样频率的确定:奈奎斯特采样定理:只有采样频率高于信号中最高频率的两倍,才可以从采样中完全恢复原始信号的波形。采用44.1KHz作为高质量声音的采样频率。,为什么?,44,声音的采样以及量化图,2.2.2 音频的数字化和符号化,45,2.2.2 音频的数字化和符号化,与数字音频相关的
15、重要特性: 采样频率采样频率与声音的质量关系最为紧密。标准的采样频率有三个:44.1KHz,22.05kHz,和11.025kHz。采样位数存放一个采样点所需的比特数。一般的采样位数为8位或16位,即把声音采集为256等份或65536等分。,46,2.2.2 音频的数字化和符号化,声道数有单声道、双声道和多声道。如多种语言音频混存时,需要多声道 数据量,47,2.2.2 音频的数字化和符号化,WAV文件 又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。WAV文件用于保存Windows平台的音频信息资源,被Window
16、s平台及其应用程序所广泛支持。WAV声音文件是使用RIFF(Resource Interchange File Format资源交换文件)的格式描述的,它由文件头和波形音频文件数据块组成。文件头包括标志符、语音特征值、声道特征以及PCM格式类型标志等。WAV数据块是由数据子块标记、数据子块长度和波形音频数据3个数据子块组成。Wave格式支持多种压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式,但其文件尺寸较大,多用于存储简短的声音片断。,48,2.2.2 音频的数字化和符号化,MPEG音频文件.MP1/.MP2/.MP3 指的是MPEG标准中的音频部分,即MPEG音
17、频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件;MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为41和6181,而MP3的压缩率则高达101121,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。,49,2.2.2 音频的数字化和符号化,2声音的符号化波形声音可以把音乐、语音都进行数据化并且表示出来,但是并没有把它看成音乐和语音。对于声音
18、的符号化(也可以称为抽象化)表示包括两种类型:一种是音乐,一种是语音。,50,2.2.2 音频的数字化和符号化,(1)音乐的符号化MIDI MIDI ( Music Instrument Digital Interface )是指乐器数字接口。MIDI消息,是指乐谱的数字描述。任何电子乐器,只要有处理MIDI消息的微处理器和合适的硬件接口,就构成了一个MIDI设备。当一组MIDI消息通过音乐合成芯片处理时,合成器能解释这些符号并且产生音乐。,51,MIDI实质上是由MIDI控制器(或MIDI文件)产生的指示电子音乐合成器要做什么、怎么做(如演奏某个音符、加大音量、生成音响效果)的一套标准指令。
19、MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是动作指令。,52,MIDI的通道概念,单个物理MIDI通道分为16个逻辑通道,每个逻辑通道可指定一种乐器。MIDI键盘可设置在这16个通道中的任何一个,MIDI合成器可以被设置在指定的通道上接受。,53,2.2.2 音频的数字化和符号化,(2)语音的符号化对语音的符号化实际上就是对语音的识别,将语音转变为字符,反之也可以将文字合成语音。,54,2.2.3 音频媒体的三维化处理,1三维虚拟声空间 目的:作用:空间信息,逼真的虚拟空间定义:三维虚拟声空间(Three Dimensional Virtual Acoustic,3DVA),是指
20、用一定的声音设备人为地产生出来的具有空间位置信息的声音空间。三维听觉明显依赖于人对听觉空间中声源的定位能力,55,2.2.3 音频媒体的三维化处理,23DVA的基本理论 人类感知声源位置的最基本的理论是双工理论:两耳间声音的到达时间差(因距离原因而致) ITD(Interaural Time Differences);两耳间声音的强度差(因信号衰减而致) IID(Interaural Intensity Differences)。大脑根据IID和ITD分别对高频与低频声音定位,56,2.3 视觉媒体技术,57,2.3.1 视觉心理学,1视觉的心理特征 同声音心理学相似,与视觉相对应的光学物理性
21、质和心理知觉也是截然不同的。虽然光的物理特性与心理知觉有关,但它们的关系并不是线性的。,对光的色调和亮度的感觉不仅和它的频率和强度有关,而且还和它出现的背景有关,和同时出现的周围光有关。,58,2.3.1 视觉心理学,59,2.3.1 视觉心理学,2. 视觉特性 亮度亮度是人眼对光强度的感受。一个物体的亮度不仅跟目标的物理强度有关,而且与周围的背景有关。对图像的处理最重要的是亮度的差别。,60,2.3.1 视觉心理学,与声音相似,视觉上也有等亮曲线,反映了视觉在亮度上与波长的关系。在同一亮度感觉下,不同波长的光具有不同的光强。视觉也有掩蔽现象,在很亮的高光周围时难以看清的,道理和声音是类似的。
22、,61,2.3.1 视觉心理学,彩色表示颜色需要考虑三种心理属性:色调、亮度和饱和度。色调就是通常意义下的彩色,它随波长的变化而变化,反映颜色的基本特性。亮度是光作用于人眼所引起的明亮程度的感觉,与光强有关。饱和度是代表颜色的深浅程度。色调和饱和度统称为色度。,62,视觉系统对颜色的感知,眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod)。,63,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此
23、颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。,红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,因此不同组成成分的可见光就呈现出不同的颜色,64,颜色模型,颜色模型(color model)是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。 对于人来说,可以通过色调、饱和度和亮度来定义颜色(HSI颜色模型); 对于显示设备来说,可以用红、绿、蓝磷光体的发光量来描述颜色(RGB颜色模型); 对于打印设备来说,可以使用青色、品红、黄色和黑色颜料的用量来指定颜色(CMYK颜色模型)。 颜色空间通常用三维模型表
24、示,空间中的颜色通常使用代表三个参数的三维坐标来指定,65,视觉系统对颜色的感知,66,理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 颜色CR(红色的百分比)G(绿色的百分比) B(蓝色的百分比)RGB模型称为相加混色模型,用于光照、视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。,RGB颜色模型,67,CMYK颜色模型,在理论上,绝大多数颜色都可以用三种基本颜料(青色cyan、品红magenta、和黄色yellow)按一定比例混合得到。 理论上,青色、品红和黄色三种基本色素等量混合能得到黑色。但实际上,因为所有打印油墨都会包含一些杂
25、质,这三种油墨混合实际上产生一种土灰色,必须与黑色 (K) 油墨混合才能产生真正的黑色,所以再加入黑色作为基本色形成CMYK颜色模型。 CMYK模型称为相减混色模型。,用这种方法产生的颜色之所以称为相减色,乃是因为它减少了为视觉系统识别颜色所需要的反射光。,68,相加色与相减色的关系,69,HSI颜色模型,在HSI模型中, H定义色调; S定义颜色的深浅程度或饱和度; I定义亮度。 RGB模型和CMYK模型主要是面向设备的,而HSI模型更容易被人理解和控制。,颜色纺锤体,70,2.3.1 视觉心理学,在辐射功率相同的条件下,不同波长的光不仅给人不同的颜色感觉,而且也给人不同的亮度感觉。人眼一般
26、感到蓝光最暗,红光次之,而黄绿光最亮。研究表明,人眼对亮度信息敏感,而对颜色的敏感程度相对较弱。,纯正的颜色的明暗差别,71,视觉系统对颜色的感知,视觉系统对颜色和亮度的响应特性曲线(各个波长的光的强度相等),72,视觉系统对颜色的感知,上面的颜色响应曲线表明,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。 亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。,纯正的颜色的明暗差别,73,光亮度与反差的关系: 图中点线所示为光强度的分布,若上述现象实现点线的光强度分布,则人所能感到的光亮度为用实线表示。这就好像一个带子,所以被称为马赫带(Mach band)。,74,视觉系统对颜
27、色的感知,许多具有不同光谱分布的光产生的视觉效果(颜色)是一样的。即光谱与颜色的对应是多对一的。 光谱分布不同而看上去相同的两种颜色称为条件等色(匹配等色)。 绝大部分可见光谱对眼睛的刺激效果都可以用红(700nm)、绿(546.1)、蓝(435.8nm)三色光按不同比例和强度的混合来等效表示。(三刺激理论),75,匹配任意可见光所需的三原色光比例曲线,可见光谱,76,2.3.1 视觉心理学,视觉的时间特性建立视觉图像需要时间,而一旦建立起来之后,即使把图像对象拿走,这种反应也要维持一段时间。正因为视网膜图像是逐渐消退的,所以视觉暂留可以存在十分之几秒。,77,2.3.1 视觉心理学,注视点和
28、视野范围研究表明,视觉注视点主要集中在图像中黑白交界的部分,尤其是拐角处。如果是闭合图形,注视点往往向内侧移动。注视点容易集中在时隐时现运动变化的部分或者图像中特别不规则的地方。人眼的视野开阔,左右视角约为180度,上下约为60度。但视力好的部位仅限于2到3度,用于观察视觉媒体的细节。而在周边,则主要识别特征。,78,2.3.2 模拟视频原理,光栅扫描原理将二维图像转成为一维电信号是由光栅扫描的方法实现的。,79,2.3.2 模拟视频原理,分辨率表现的是电视系统中重现场景细节的能力。水平扫描线所能分辨出的点数称为水平分辨率。一帧中垂直扫描的行数称为垂直分辨率。垂直分辨率和每帧中的扫描线有关,扫
29、描线越多,分辨率就越高。,80,2.3.2 模拟视频原理,每一秒钟所扫描的帧数称为帧频,一般为25帧(PAL)或者30帧(NTSC)。由于是隔行扫描,所以垂直频率分别是每秒50帧和60帧。宽高比是扫描的一个重要的参数。扫描行的长度与在图像垂直方向上的所有扫描行所跨过的距离之比,就成为宽高比。目前电视中的宽高比为4:3,新型电视的宽高比为16:9,有些电影系统的宽高比为2:1 。,81,彩色电视信号的类型,复合电视信号:包含亮度信号、色差信号和所有定时同步信号的单一电视信号。 分离电视信号(SVideo信号):是亮度和色差分离的一种电视信号,它可以(1)减少亮度信号和色差信号之间的交叉干扰。(2
30、)不须要使用梳状滤波器来分离亮度信号和色差信号,这样可提高亮度信号的带宽。 分量电视信号:是指每个基色分量作为独立的电视信号,使用分量电视信号是表示颜色的最好方法,但需要比较宽的带宽和同步信号。,82,2.3.3 视觉媒体数字化,1位图图像与数字视频 与音频信号相似,对所要处理的一幅画面,通过对每一个象素进行采样,并且按照颜色或者灰度进行量化,就可以得到图像的数字化结果。对视频按照时间进行数字化所得到的图像序列,就构成了数字视频序列。,83,2.3.3 视频媒体数字化,84,2.3.3 视觉媒体数字化,2图形图形(Graphics):它不直接描述数据的每一点,而是描述产生这些点的过程及方法。矢
31、量图形是以一组指令的形式存在的,85,2.3.3 视觉媒体数字化,3符号与文字 可以组成文本,即字符串;也可以组成数据组,如数据库中的一个元组,均可表达特定的信息 。,86,常见的图形图像文件格式,矢量图形及其格式 常用的矢量图格式有WMF、DRW、CDR、DXF、FLI、FLC、CG、EMF等。位图图像及其格式 常用的位图图像格式有BMP、PCX、GIF、TIFF、JPEG、TGA、PSD、PNG等,87,图像文件结构,88,2.3.4 视觉媒体的三维立体显示,1立体显示原理三维显示实际上具有两个含义,一个是指物体的三维图像在平面上的显示。另一个含义是指所显示的图像确确实实是立体的。视差(p
32、arallax)是投影到人眼视网膜上图像上两点间的水平距离,正是这个距离产生了视觉上的立体感。,89,2.3.4 视觉媒体的三维立体显示,视差,视差距离,右眼图像,左眼图像,90,2.3.4 视觉媒体的三维立体显示,2视差视差的种类大致分为四种:零视差、正视差、负视差和发散视差。它们产生的立体感觉是不同的。零视差 正视差 负视差 发散视差,91,2.3.4 视觉媒体的三维立体显示,零视差:在显示的左右眼图像之间没有缝隙时,在显示器上平铺,视差为零,没有立体感 正视差:一旦显示的立体图像对的视差大于0,则可看到深度。大脑把两幅图像合并处理,给人的感觉是立体图像显示在屏幕表面与其之后的地方。正视差
33、大于0且小于等于两眼间距(平均64mm)。,92,2.3.4 视觉媒体的三维立体显示,负视差:两眼目光交叉时,产生负视差,所观察对象被从显示器中“拉”出来,浮现在两眼和显示器之间的空间中 发散视差:视差值比两眼间距还大。在真实世界中不会发生。在立体显示过程中一定要避免,因为它使两眼不舒服。,93,94,2.3.4 视觉媒体的三维立体显示,3立体图像的显示 一种方法是让一只眼睛看一个显示器,每个显示器只显示对应眼睛的图像,这样头脑中就产生了立体图像。这种方法的实现是把显示器缩小,放入到头盔中,这就是所谓的头盔显示器。另一种方法是在显示器上快速地显示两眼不同的图像,而观察者带上立体眼镜进行观察。由
34、于眼镜中的液晶片与显示的图像同步地进行开关切换,使得在每一时刻只有一只眼睛能够看到对应的图像,只要速度足够快,由眼睛的暂留现象和大脑的作用,感觉到的就是立体的图像。,95,96,2.4 触觉媒体技术,97,2.4.1 触觉媒体概述,皮肤可以感觉环境的温度、湿度,也可感觉压力,身体可以感觉振动、运动、旋转等,这些都是触觉在起作用,都可以作为传递信息的媒体。事实上,触觉媒体就是环境媒体,它描述了该环境中的一切特征和参数。,98,2.4.2 简单指点设备与技术,1指点的任务 指点的任务包括:选择定位定向路径数量操作,99,2.4.2 简单指点设备与技术,2指点设备指点设备分成直接指点设备和间接指点设
35、备两类。前者直接使用特殊的指点设备或用手指点屏幕,后者则通过指点设备的间接动作对屏幕上的对象进行指点。直接指点设备包括:光笔、触摸屏及输入笔等。 间接指点设备包括:鼠标、跟踪球、控制杆和图形板。这些设备不接触显示屏幕,所以使用时不会遮挡视线,也不易疲劳。,100,2.4.2 简单指点设备与技术,这些指点设备的输入都是在显示平面上的二维坐标空间中进行的,包括坐标改变的速度。除非经过特殊的变换,很难把它们向三维空间转换。,101,2.4.3 位置跟踪,为了与系统交互,系统必须了解参与者的身体动作,包括头、眼、手、肢体等部位的位置与运动方向。系统将这些位置与运动的数据转变为特定的模式,对相应的动作进
36、行表示。1手指动作测量和数字化对手部的跟踪采用一种称为数据手套的工具。对手指的测量主要采用在手套的手指部位装上能够测量手指弯曲、移动的检测器。,102,2.4.3 位置跟踪,对手指动作的测量和数字化,实际上更关心的是手指的相对位置。识别这些相对的动作,采用的方法就是建立手指动作模式库。,103,2.4.3 位置跟踪,2空间位置跟踪在数据手套上有一个定位的装置,这是用于进行手部位置跟踪的。手部的位置是指手部在空中的相对位置,所以还需要一个坐标原点。事实上,无论是数据手套还是头部的位置跟踪其原理都是一样的。,104,2.4.4 力反馈与触觉反馈,这与位置跟踪正好相反,是由系统向参与者反馈力和运动的
37、信息,如触觉刺激(物体的表面纹理等)、反作用力(推门的门重感觉)、运动感觉(摇晃、振动等)及温度、湿度等环境信息。1力反馈力反馈包括对重量的感知、对阻力的感知(在水中前进与前进中碰壁是不同的阻力)、吸引力(如分子间的吸引力、磁铁的吸引力)等。建立力反馈的直接方法是利用提供动力的电动机和对人体或人体部位进行力反馈的“外骨系统”。,105,2.4.4 力反馈与触觉反馈,2触觉反馈对于触觉的反馈需要能够让人体区别出不同物体的质感和纹理结构。采用某些物理装置,可以提供一种直接通过皮肤感知的触觉反馈。例如使用一种手套,分布在手套内表面上的是一个具有若干振动凸起物的矩阵,通过这些振动凸起物的作用,可以模拟
38、出一定的触觉效果。其他的可能方法还有:在手套内部安装一些可膨胀的特制小泡或微型弹簧,或基于在电荷的作用下某些材料可由液态变为固态以及利用记忆合金的变形功能等。,106,2.4.4 力反馈与触觉反馈,3热觉反馈热觉反馈也是一种触觉反馈,但它提供的是温度的反应。当拿一个物体时,应该感觉到物体的温度;当靠近一盆虚拟的篝火时,应能感觉到篝火的温度。这些反馈需要的就是热觉反馈。 有一种热觉反馈系统使用了加热泵、温度传感器和热表面,通过计算机对系统进行控制,控制的温度范围目前在1035之间。加热泵将热从热表面上移入移出,通过传感器的控制,就可以得到所需要的温度。,107,2.5 小 结,108,本章重点,媒体的种类,常见的媒体元素及特点 听觉特性 音频的数字化和符号化及三维化处理 视觉特性 视觉媒体的数字化和三维立体显示 触觉特性 指点、位置跟踪、力反馈与触觉反馈,思考:多媒体技术与心理学之间的关系,