1、网络信息采集期末考试题一、选择题(20)1、用于图像文件中的汉字识别的软件是什么( )CA.ERP B.CRM C.OCR D.PHOTOSHOP、常见的文本文件格式不包括()BA.纯文本文件 B. GIF C. PDF D. XLS3、常用的图像格式不包括()CA. BMP B.TIF C. PPT D. PSD4、音频文件格式5、新闻组命名的规则中,关于商业或与之相关的主题的类别应为()AA. BIZ B.TALK C.NEWS D.MISC6、不属于目录索引搜索引擎的门户网站为() CA新浪 B. 网易 C.百度 D.搜狐7、运动摄影的要求为平、准、稳和() 。DA. 快 B. 慢 C.
2、 专 D. 匀8、消息的特点不包括()CA. 实 B. 快 C. 抒情 D. 新9、通讯具有的特点不包括()BA. 叙述的直接性 B. 描写的间接性 C. 议论和抒情的真实性 D. 说明的直白性二、判断题(10)WAV 是一种无损压缩,其声音质量和 CD 相差无几。 NETGET 仅能做信息采集。 GOOGLE 和中搜都属于全文搜索引擎。 摄像机的跟镜头是摄像机围绕目标进行旋转拍摄的镜头形式。 智能检索技术主要体现在语义理解、知识管理和知识检索 3 个方面。 限制某些链接是限制采集广度的强有力的手段 景别的常规划分一般包括近景、中景、远景 MP3 播放器与电脑的接口连接方式常见的有 USB 接
3、口和 IEEE 1394 接口 三、名词解释(20)1.“超链接”搜索技术:WEB 信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。超文本信息检索技术,以超文本的连接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点到另一个信息节点。2.URL“:网址,是描述网络信息资源的字符串统一资源定位符,它包括传输协议、信息资源的主机 IP 地址和主机目录及文件名的具体地址 3 个部分。3.搜索引擎:网络信息检索的主要工具,被称为“网络之父” ,可以使用户精、准、全、快地检索到结果。 ,一般由搜索器、索引器、检索器和用户接口四部分构成。4.邮件列
4、表:邮件列表作为 E-MAIL 的一种特殊形式,是一种适合一对多方式发布电子邮件的有效工具,主要用于各种群体之间的信息交流和信息发布。5.蒙太奇:是电影、电视用以表达思想、展开叙事的方法,在影视媒体中既是一种影视语言的思维方式,又是影视创作的构成方式,也是影视的技术和技巧。6.博客:是一种很有代表性的网络原创内容形式,是一种时常更新、按照倒时序方式排列的的网络帖子或在线“文本”的网页,内容和形式没有特定的限制,通常需要围绕一个中心或者主题来进行组织、链接和表达。7.消息:以简洁的文字迅速传递新近变动的事实,包括新近发生的事实、某些将要变动的事实,是目前最广泛、最经常应用的一种报道形式8.通讯:
5、运用叙述、描写、抒情、议论等多种手段,具体、生动、形象地反映新闻事件或典型人物的一种新闻报道形式。四、简答(20)1.OCR 软件的工作流程是什么?答:首先对图片文字进行纠斜、图片质量调整,选定识别范围、进行识别、校对、保存。2.图像格式 PNG 的特点有哪些?答:汲取了 GIF 和 JPEG 二者的优点,存储形式丰富;采用无损压缩方式来减少文件的大小,能把图像文件压缩到极限;显示速度很快,只需下载 1/64 图像信息就可以显示出低分辨率得分预览图像;支持透明图像的制作3、网络采集标准的原则是什么?答: 为了避免网络信息资源采集的随意性、无计划性和盲目性,采集标准的原则:全面性、针对性、时效性
6、、选择性和全程性原则。4、网络信息资源采集的特点是什么?答:采集对象多样化、采集方式多元化、采集手段现代化。5、网络信息资源采集的途径有哪些?答:人工采集、采集器自动抓取、定制信息(推送技术)等6、网络信息采集的质量标准时有哪些?答:内容标准:包括权威性、实用性、准确性、实效性、独特性和全面性;形式标准:资源7、网络信息采集技术的发展趋势是什么?答:检索工具的多语种化,检索工具的综合化和专业化,检索工具的内容化,检索工具的智能化。8、邮件列表的形式有哪些?答:交互式的邮件列表-新闻组,单向式的邮件列表时事通讯或电子刊物9、列举网络信息资源的主要载体形式?答:文本信息、图像信息、音频信息、视频信息10、消息的基本构成是什么?答、标题、消息头、导语、主体、背景、结尾五、综述(30)1、试述信息器自动抓取(采集技术)和定制信息(推送技术)的原理、特点,并举一例说明其应用。2、试述网络采集工具的主要工作内容及相应的工作流程3、写一篇 XXX 消息报道(字数 300 字,要求有肩题、标题、副题)