收藏 分享(赏)

j计算机视觉.ppt

上传人:hwpkd79526 文档编号:10024769 上传时间:2019-09-30 格式:PPT 页数:80 大小:1.77MB
下载 相关 举报
j计算机视觉.ppt_第1页
第1页 / 共80页
j计算机视觉.ppt_第2页
第2页 / 共80页
j计算机视觉.ppt_第3页
第3页 / 共80页
j计算机视觉.ppt_第4页
第4页 / 共80页
j计算机视觉.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、1,多媒体基础,主讲教师:唐大仕 http:/,2,课前思考,你用过哪些多媒体设备及软件?,3,本讲内容,多媒体计算机 多媒体信息的表示 多媒体硬件 多媒体软件,4,(一) 多媒体计算机,5,多媒体,媒体 是信息储存、传播表现的载体 传统媒体计算机领域中的媒体多媒体(multimedia) 能将文本、图像、声音、动画、视频等多种形式不同而逻辑上相关的内容向用户进行展现而对它们进行综合处理的技术。 多媒体计算机 MPC,6,多媒体 特点,多样性 集成性 交互性 实时性,7,MPC的硬件系统,主机 接口卡 存储设备 输入输出设备,8,MPC的软件系统,多媒体操作系统 包含了设备驱动程序 包含了多

2、媒体设备接口处理程序(MCI) ) 多媒体素材 多媒体创作工具 多媒体应用系统,9,MPC应用领域,教育电子出版物信息服务商业娱乐在虚拟现实中的应用,10,(二)多媒体信息的表示,音频图像和视频动画超媒体,11,音频,声音信号:音调 20-20KHz音色音量,12,Figure 2-9,Audio representation,13,声音的数字化,声音数字化的三要素 采样频率 根据奈奎斯特理论,采样频率不低于声音信号最高频率的两倍。这样就能把数字表达的声音还原成原来的声音,称为无损数字化。 采样精度 用样本值的二进制位数来表示。位数越多精度越高,数据也越大。量化等级 声道数 例: CD音质 4

3、4.1kHz X 16位 X 2 =176KB/s (约相当于单倍速光驱, 150KB/s),14,声音的编码(了解),ADPCM(自适应差分脉冲编码),15,图像,图像 分辨率 颜色深度(位数) 如:640480 8位(1字节,8位能表示256色,) 300k,16,矢量图(Vector)与位图(bitmap),前者如Office中的剪贴图,用点线面表示,放缩方便 后者如照片,用像素点来表示,17,颜色表示,RGB(彩色最基本模型,适合于计算机系统) CYMK(cyan/magenta/yellow/black),用于印刷 HSL (hue/saturation/luminance) 适合于

4、人的视觉 YUV (亮度、色差) 用于电视信号传输,18,彩色空间RGB,R,G,B分别代表红(red)、绿(green)、蓝(blue)三色。 彩色最基本的表示模型 通过对R、G、B三个颜色通道的变化以及它们相互之间的叠加可得到各式各样的颜色。,19,彩色空间RGB,RGB是计算机系统使用的彩色模型。 24位真彩当显示器可显示256*256*256=16,777,216种颜色特别地,当R=G=B时,该象素是灰度,无颜色更特别,当R=G=B=0时,该象素是黑色当R=G=B=255时,该象素是白色,20,Figure 2-7,Bitmap graphic 位图,21,彩色图的像素 pixels,

5、22,彩色空间HSI (了解),用三个分量来表示一种颜色 H(Hue,色调) S(Saturation,饱和度) I(Intensity,光强度)HSI彩色空间更适合人的视觉特性,23,颜色编辑器,24,颜色编辑器,方形区域为色度图,可对色度进行调节(包括色调和饱和度),色调值 0 255,255,0,亮度 0255,饱和度,从,到,条形区域为亮度图,可调节亮度,25,彩色空间YUV,Y为亮度信号, U(B-Y)和V(R-Y)是色差信号YUV的最初作为电视系统信号编码优点之一是亮度信号和色差信号分离,容易使彩色电视系统与只对亮度敏感的黑白电视机亮度信号兼容; 否则,如果用RGB传输,虽然黑白电

6、视机可以正常接受彩色电视信号(只显示出黑白图像),但YUV系色感较均匀,当不发生偏移时色调饱和度上的变化近似相同。 中国和西欧采用的PAL制式电视系统就采用该空间进行传输,电视机接收到后,再转换成RGB空间,26,彩色空间YUV (了解),国际无线电咨询委员会(CCIR)根据实验认为,采用双倍度采样4:2:2方案效果较好,提出了CCIR 601标准:,线性关系,27,彩色空间转换 YUVRGB(了解),RGB YUV(这里系数有小的改变)Y = 0.3R + 0.59G + 0.11BU = B YV = R Y显然,在视频信号采集时,RGB;而在传送时,只传送: 一个宽频亮度信号Y包含有所有

7、细节 二个窄频色差信号(B-Y,R-Y) 代表彩色,经进一步处理成为U,V信号 而原来,是三个宽频带的基色信号,28,彩色空间转换YUVRGB (了解),当接收时, YUV RGBR = Y + G = Y 0.19U 0.51B = Y + ,29,彩色空间YIQ彩色空间(了解),YIQ彩色空间是在广播电视系统中另一种常用的亮度与色差分离的模型。 美国的电视系统采用NTSC制式,其彩色空间即为YIQ Y是亮度,I和Q共同描述图像的色调和饱和度。YUV与RGB的相互关系为:,30,视频,视频的三要素: 空间分辨率(即屏幕上的点数) 颜色分辨率(即每个点的颜色位数) 时间分辨率(即每秒的帧数)电

8、视: NTSC(美国、日本)30帧/秒,525行/帧 PAL (西欧、中国)25帧/秒, 625行/帧 SECAM(俄、法) 注:电影是24帧/秒,31,声音文件的格式(要求掌握),WAV (Win平台) AU (unix平台) MIDI 记录MIDI信息(Musical Instrument Digital Interface) 记录 音符、节拍、乐器种类及音量等 MP3 它的优点是在保证音质近乎完美的情况下,文件的尺寸却非常小。,32,图像文件的格式(要求掌握),JPEG (Joint Photographic Expert Group) 有损压缩;多用于照片 GIF (Graphics

9、Interchange Format) 无损压缩,最多256色,可透明,可动画;多用于小图标 PNG 具有JPEG及GIF的优点,可压缩,可透明 BMP (Bitmap) Windows中的位图,一般未压缩TIFF(Tag Image File Format) 未压缩或简单压缩;多用于扫描及传真,33,视频文件的格式(要求掌握),MPG (MPEG:Motion Photographic Expert Group)AVI(Audio Video Interactive) 3gpp (手机上常用) 其他格式,34,流媒体,流媒体文件 流媒体简单来说就是应用流技术在网络上传输的多媒体文件,而流技术

10、就是把连续的影象和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不需要等整个压缩文件下载到自己机器后才可以观看的网络传输技术。该技术先在使用者端的电脑上创造一个缓冲区,于播放前预先下载一段资料作为缓冲,于网路实际连线速度小于播放所耗用资料的速度时,播放程序就会取用这一小段缓冲区内的资料,避免播放的中断,也使得播放品质得以维持。 目前在这个领域上,竞争的公司主要有三个:Microsoft、Real Networks、Apple,而相应的产品就是:Windows Media 、Real Media、QuickTime。 常用流式媒体格式 .rm .rmvb (Real格式)

11、 .wma, .asf, .wmv(微软的格式) .mov (Apple的格式) .flv (Flash Video),35,动画,什么是动画 用计算机生成一系列可供实时演播的画面的技术 动画制作 如 Flash (二维动画) 扩展名为.swf 广泛用于网络 闪客 如 3D MAX, Maya(三维动画),37,(三)相关硬件(了解),38,多媒体计算机的硬件设备,主要设备: CD-ROM / DVD-ROM驱动器和光盘 声卡 显卡 视频卡 显示器、音箱(耳机)、麦克风、摄像头、数码相机、数码摄像机、扫描仪、游戏手柄等其它外设,39,声音卡,结构与功能声音数字处理器 DSP混声器合成器波表存储

12、器总线接口 声卡的技术指标 采样能力 合成器、MIDI功能、 音效 总线类型、 标准支持、即插即用、芯片类型,40,视频卡,视频捕获卡 视频叠加卡 MPEG解压卡 电视接收卡,41,光盘技术,CD-ROM(Compact Disk Read-Only Memory) 其他 CD-WORM(Write Only Read Memory) 如:CD-ETOM(Electron Trapping Optical Memory),42,CDROM 标准(了解),CD-DA(红皮书) CD-ROM(黄皮书)VCDDVD, xDVD其他:CD-I, PhotoCD, CD-TV,。,43,44,扫描仪,工

13、作原理:扫描过程中,扫描仪提供光源给图像,光线从图像反射进扫描仪的光学系统,在此过程中不同层次的光得到调节,图像以数字形式重新组合并显示在屏幕上 扫描仪性能指标:幅面,分辨率,颜色数,速度,45,语音处理,实现语音处理的软硬件条件: 硬件:语音卡(加速卡)、麦克风、扬声器 软件:配套软件系统 语音技术 API:语音应用程序接口(SR 和 TTS) SR:语音识别器 TTS:文本语音转换器 相关软件 中自公司的“汉王”系列 IBM公司的ViaVoice,46,数码像机,数码像机:Digital Camera 以CCD电荷耦合器或互补金属氧化物半导体CMOS为感光器件,将客观景物以数字方式记录在存

14、储器中的照像机。 照片以数字文件格式存储 存储体是数字化存储器件,可重复使用 成像质量取决于CCD图像传感器和A/D转换部件 如“中国人自己的800万爱国者V80” 36242448,47,触摸屏,用途:多媒体信息查询 特点:直接、方便、快捷、直观、生动 实例:1)商场导购系统2)火车站信息查询系统 工作原理:一种定位设备,通过一定的物理手段,使用户触摸触摸屏时,所摸的位置(以坐标形式)被控制器检测到,并通过串口或其他接口送到CPU,从而确定用户所输入的信息,48,触摸屏,系统组成 触摸屏控制卡 作用:从触点检测装置上接收触摸信息,将其转化为触点坐标,送给主机,同时可接收主机发来的命令并执行

15、触摸检测装置 检测用户的触摸位置,并将信息传递给触摸屏控制卡。 常用介质 电阻式、电容式、红外式、压力式 电阻式:两层膜之间有网格状触点阵列,膜的压力会造成电阻变化,从而定位压点位置 电容式:屏上有一层金属膜,触摸金属膜会使电流发生变化,从而定位压点位置,49,存储与接口,存储 光盘、磁带、DV带、Memory Stick U盘、移动硬盘 闪存卡 Smart Media(SM卡), Compact Flash(CF卡), Multi Media Card(MMC卡), Secure Digital Card(SD卡), Memory Stick(MS卡), Extreme Digital Ca

16、rd(XD卡), Trans Flash Card (TF卡) 接口 USB接口、1394接口 红外、蓝牙,50,(四)相关软件,51,软件及资源,参考: 北大BBS之multimedia、NetResource、Software版 http:/ 软件: http:/ (华军软件园) 资源: 使用baidu、google、sheenk 使用maze、BT http:/www.51music.org/ http:/ http:/,52,几个小软件,图像抓取软件:SnagIt(推荐); FlashCam;FSCapture(推荐) 屏幕录像软件:屏幕录像专家(推荐); 图像浏览软件:AcdSee

17、简单动画软件:GIF Constructor; 简单动画软件: AnimaGif 简单3D动画软件:Cool3D,53,浏览图像的常用软件ACDSee,ACDSee 的安装与启动 利用图像观察器浏览图片 图片格式转换 桌面背景设置 利用图像浏览器管理图片文件 图片文件的复制、移动、重命名和格式转换 屏保和幻灯演示文件的制作 注:AcdSee完全版 还有图像处理功能 (如图片改大小、改格式、简单的滤镜),54,图像图形处理软件,专业图像处理 PhotoShop PhotoDraw PhotoDeluxe PhotoExpress 专业图形处理 Firework FreeHand CoralDra

18、w,55,PhotoShop,菜单栏 工具箱 控制面板 工作区 状态栏,56,动画处理软件,二维动画Flash Macromedia Flash 现已被Adobe收购 三维动画 3D Max Maya,57,音频相关的软件,播放器: CD播放器 Media Player(Windows自带) WinAmp(经典) Real Player(必装) 超级解霸 编辑器 CoolEdit 录音机 Mp3制作、格式转换 AltoMP3 Maker(不错) CDex,58,Windows 录音机的使用,选择【开始】【所有程序】【附件】【娱乐】【录音机】命令,会出现Windows录音工具 单击【录音】按钮可

19、以录音; 单击【停止】按钮可停止录音。 选择【文件】【保存】菜单命令即可保存刚刚录制的信息。,59,播放音乐常用软件Winamp,播放音乐文件 添加其他文件夹中的音乐文件 保存音乐文件列表,60,视频处理软件,播放: Windows Media Player(Windows自带), RealOne(必装), Media Player Classic , 暴风影音(推荐,强烈推荐) , 金山影霸,DivXPro, HappyShow QuickTime, DivX解码器及mpeg4、ac3相关插件 编辑、制作、转换: Premiere(专业), VirtualDub,EoVideo, helix

20、 producer RealProducer (专业), Easy Video Joiner No1 Vedio Convertor(推荐),61,媒体播放器Windows Media Player,视频方面支持.avi、.mpg、.asf和VCD、DVD光碟 音频方面支持.mp3、.wav、MIDI以及CD光碟播放 选择【文件】【打开】菜单命令,在弹出的对话框中选择需要播放的文件即可,62,其它常用的视频播放工具,RealPlayer 可以播放.rm和.rmvb格式的视频文件(流媒体) 豪杰超级解霸 主要用于播放VCD/DVD光碟,此外还支持CD、mp3等上百种影音格式的播放 Media P

21、layer Classic(暴风影音,推荐) 我常用的一款播放软件,支持多种格式,63,转换格式的软件-TotalVideoConverter,64,光盘相关软件,光盘刻录:Nero (推荐) 虚拟光驱:daemon (推荐) ,金山模拟光驱(推荐) 光盘文件制作:WinISO (推荐) 文件名.bin或.iso,65,网络上的多媒体资源,网络上有丰富的资源 可通过http、ftp、bt、maze等多种工具下载 听音乐: 等网站 看电影: 播客: 视频分享网站,66,多媒体的共享: P2P,如 BT (BitTorrent) Maze(推荐) 迅雷 eDonkey, eMule

22、Napster, ezPeer, KuroM3, KuGoo,67,小技巧:有关rm文件,Rm不能拖动:使用Rm修复终结者(推荐) Rm老弹出网页:使用暴风影音 Rm转mp3: Rm下载:大多数流媒体文件都不提供直接的下载方式,需要用特殊的软件。如: Streambox vcr Net Transport 其他 Woof FlashGet Pubdl Offline Explorer,68,小技巧:字幕,音频文件的字幕 .lrc 文件 插件“酷我歌词”: http:/ 搜索 http:/ 千千静听 http:/ 电影的字幕 .srt文件 搜索:射手网 http:/ http:/ Authorw

23、are ToolBook Director Action! 方正奥思 简单的工具 Movie Maker (WindowsXP自带),70,INTERNET电话,网络电话,71,INTERNET电话,Internet Phone可以使任何 一 位Internet互联网上装备 有声卡的多媒体电脑用户拨 叫国际长途电话。,Skype (推荐) Net2Phone、MediaRing、CollTalk、NetMeeting,网络电话,72,网络音频、视频交流,IM工具中的音频、视频交流 QQ MSN UC Skype Netmeeting(Windows自带) 远程协助 Windows自带 QQ,7

24、3,网络电视,北大的IPTV: http:/ 其他网络电视工具 如FreeTV(推荐) 等等,很多 可以用来看电影 可用来收电台 Media Player也可以当收音机 听各种音乐台 英语台,学英语(推荐):CRI, BBC, NPR, Bloomberg 一些网站: CCTV, http:/, 新流宽频等,74,本讲小结,了解多媒体计算机理解多媒体信息的表示、掌握常见的文件格式了解多媒体硬件熟练使用多媒体软件,75,要点:多媒体文件格式,图片文件 Jpeg, gif, tiff, bmp, wmf 声音文件 Wav, midi, mp3, rm,wma 视频文件 从现实世界采集,经过数字化处

25、理得到 Avi, mpeg, asf, rm, mov 动画文件 由计算机生成 Avi, Gif, flic, swf(Flash文件),76,要点:相关软件,播放 Windows Media player RealOne Player Winamp Acdsee(图片) 制作 Photoshop Authorware Flash mx 视频处理软件 工具 SnagIt,屏幕录像专家 P2P下载 StreamBox, NetTransport,介绍几个常用的工具软件,77,78,压缩工具WinRAR的操作,压缩: 选中一个或多个文件、文件夹,点右键 解压缩 选中.rar文件,点右键 或:双击打开,然后进行文件的拖放操作 还可以创建自释放文件(exe文件),文本处理软件,EditPlus UltraEdit,79,词典及翻译,金山词霸 Lingoes Google的翻译,80,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报