1、实验二实验目的:1 掌握信息组织的新技术:网格技术、信息构建、信息过滤2 了解网络环境下对信息资源的组织方式的开发(了解全文检索和元数据、当前 Internet 信息检索中最突出的问题等) 。实验内容:利用网络搜索引擎及其学校图书馆的期刊网,掌握信息组织的三个新技术;同时了解网络环境下对信息资源的组织方式的开发。注:第一组完成新技术中的网格技术第二组完成新技术中的信息构建第三组完成新技术中的信息过滤第四组完成网络环境下对信息资源的组织方式开发的了解(了解全文检索和元数据、当前 Internet 信息检索中最突出的问题等) 。第一组的同学名单:常苏峰、许远超、王咪、张雷雷、李瑞琴、韦娜、刘希早、
2、黄少颜、周康松、范其锦、杨伟利、程伟(十二人)第二组的同学名单:刘午辰、孙蕾、李建沅、胡杨、梁耀心、武文冲、丁明、包云红、陈舰、兰勇、鲁丹、蔡天才(十二人)第三组的同学名单:赵吕、单春艳、解天龙、王显红、万永翠、李虎、李天祯、李莹、段玥旻、余富艳、王文(十一人)第四组的同学名单:朱红发、韦海风、杨国东、李迅捷、宝丽娟、张艳、方丽娟、马重梅、杨根仁、王金龙、何文雷(十一人)网格技术1 网络技术的定义、演变及发展1.1 网络技术的定义网络技术是从 1990 年代中期发展起来的新技术,它把互联网上分散的资源融为有机整体,实现资源的全面共享和有机协作,使人们能够透明地使用资源的整体能力并按需获取信息。
3、资源包括高性能计算机、存储资源、数据资源、信息资源、知识资源、专家资源、大型数据库、网络、传感器等。 当前的互联网只限于信息共享,网络则被认为是互联网发展的第三阶段。网络可以构造地区性的网络、企事业内部网络、局域网网络,甚至家庭网络和个人网络。网络的根本特征并不一定是它的规模,而是资源共享,消除资源孤岛。1.2 网络技术的演变和发展网络研究起源于过去十年美国政府资助的高性能计算科研项目。这项研究的目标是将跨地域的多台高性能计算机、大型数据库、大型的科研设备、通信设备、可视化设备和各种传感器等整合成一个巨大的超级计算机系统,以支持科学计算和科学研究。 微软公司把开发力量集中在数据网络上,关注使用
4、网络共享信息,而不是网络的计算能力,这反映了学术和研究领域内的分歧。事实上,很多用于学术领域的网络技术都能够成为商业应用。 Globus 是美国阿贡(Argonne)国家实验室的网络技术研发项目,全美 12所大学和研究机构参与了该项目。Globus 对资源管理、安全、信息服务及数据管理等网络计算的关键理论进行研究,开发能在各种平台上运行的网络计算工具软件,帮助规划和组建大型的网络试验平台,开发适合大型网络系统运行的大型应用程序。目前,Globus 技术已在美国航天局网络、欧洲数据网络、美国国家技术网络等 8 个项目中得到应用。2005 年 8 月,美国国际商用机器公司(IBM)宣布投入数十亿美
5、元研发网络计算,与 Globus 合作开发开放的网络计算标准,并宣称网络的价值不仅仅限于科学计算,商业应用也有很好的前景。网络计算和 Globus 从开始幕后走到前台,受到前所未有的关注。 中国非常重视发展网络技术,由 863 计划“高性能计算机及其核心软件”重大专项支持建设的中国国家网络项目在高性能计算机、网络软件、网络环境和应用等方面取得了创新性成果。具有 18 万亿次聚合计算能力、支持网络研究和网络应用的网络试验床中国国家网络,已于 2005 年 12 月 21 日正式开通运行。这意味着通过网络技术,中国已能有效整合全国范围内大型计算机的计算资源,形成一个强大的计算平台,帮助科研单位和科
6、技工作者等实现计算资源共享、数据共享和协同合作。2.网络技术的主要功能与应用领域2.1 网络技术的功能2.1.1 资源共享网络的出现使资源共享变得很简单,交流的双方可以跨越时空的障 碍,随时随地传递信息。2.1.2 信息传输与集中处理数据是通过网络传递到服务器中,由服务器集中处理后 再回送到终端。2.1.3 负载均衡与分布处理负载均衡同样是网络的一大特长。举个典型的例子:一 个大型ICP(Internet 内容提供商)为了支持更多的用户访问他的网站,在全世界多个 地方放置了相同内容的 WWW 服务器;通过一定技巧使不同地域的用户看到放置在离他最 近的服务器上的相同页面,这样来实现各服务器的负荷
7、均衡,同时用户也省了不少冤枉路。2.1.4 综合信息服务网络的一大发展趋势是多维化,即在一套系统上提供集成的信息服务,包括来自政治、经济、等各方面资源,甚至同时还提供多媒体信息,如图象、语音、动画等。在多维化发展的趋势下,许多网络应用的新形式不断涌现,如: 电子邮件 这应该是大家都得心应手的网络交流方式之一。发邮件时收件 人不一定要在网上,但他只要在以后任意时候打开邮箱,都能看到属于自己的来信。 网上交易就是通过网络做生意。其中有一些是要通过网络直接结算,这就要求网络的安全性要比较高。 视频点播这是一项新兴的娱乐或学习项目,在智能小区、酒店或学校应用较多。它的形式跟电视选台有些相似,不同的是节
8、目内容是通过网络传递的。 联机会议也称视频会议,顾名思义就是通过网络开会。它与视频点播的不同在于所有参与者都需主动向外发送图像,为实现数据、图像、声音实时同传,它对网络的处理速度提出了最高的要求。2.2 网络技术的分类及组成2.2.1 局域网在某一区域内由多台计算机互联成的计算机组。一般是方圆几千米以内。局域网可以实现文件管理、应用软件共享、打印机共享、工作组内的日程安排、电子邮件和传真通信服务等功能。局域网是封闭型的,可以由办公室内的两台计算机组成,也可以由一个公司内的上千台计算机组成。2.2.2 城域网在一个城市范围内所建立的计算机通信网,简称 MAN。属宽带局域网。由于采用具有有源交换元
9、件的局域网技术,网中传输时延较小,它的传输媒介主要采用光缆,传输速率在 l00 兆比特/秒以上。MAN 的一个重要用途是用作骨干网,通过它将位于同-城市内不同地点的主机、数据库,以及 LAN 等互相联接起来,这与 WAN 的作用有相似之处,但两者在实现方法与性能上有很大差别。2.2.3 广域网也称远程网。通常跨接很大的物理范围,所覆盖的范围从几十公里到几千公里,它能连接多个城市或国家,或横跨几个洲并能提供远距离通信,形成国际性的远程网络。2.24.网间网。2.3 网络技术的应用领域2.3.1 分布式超级计算 分布式超级计算将分布在不同地点的超级计算机用高速网络连接起来,并用网络中间件软件“粘合
10、”起来,形成比单台超级计算机强大得多的计算平台。2.3.2 分布式仪器系统 分布式仪器系统使用网络管理分布在各地的贵重仪器系统,提供远程访问仪器设备的手段,提高仪器的利用率,方便用户的使用。 2.3.3 数据密集型计算并行计算技术往往是由一些计算密集型应用推动的,特别是一些带有巨大挑战性质的应用,大大促进了对高性能并行体系结构、编程环境、大规模可视化等领域的研究。数据密集型计算的应用比计算密集型的应用多得多,它对应的数据网络更侧重于数据的存储、传输和处理,计算网络则更侧重于计算能力的提高。在这个领域独占鳌头的项目是欧洲核子中心开展的数据网络(DataGrid)项目,其目标是处理 2005 年建
11、成的大型强子对撞机源源不断产生的 PB/s 量级实验数据。 2.3.4 远程沉浸这是一种特殊的网络化虚拟现实环境。它是对现实或历史的逼真反映,对高性能计算结果或数据库可视化。 “沉浸”是指人可以完全融入其中:各地的参与者通过网络聚集在同一个虚拟空间里,既可以随意漫游,又可以相互沟通,还可以与虚拟环境交互,使之发生改变。目前,已经开发出几十个远程沉浸应用,包括虚拟历史博物馆、协同学习环境等。远程沉浸可以广泛应用于交互式科学可视化、教育、训练、艺术、娱乐、工业设计、信息可视化等许多领域。 2.3.5 信息集成网络最初是以集成异构计算平台的身份出现,接着进入分布式海量数据处理领域。信息网络通过统一的
12、信息交换架构和大量的中间件,向用户提供“信息随手可得” 式的服务。网络信息集成将更多应用在商业上,分布在世界各地的应用程序和各种信息通过网络能进行无缝融合和沟通,从而形成崭新的商业机会。 信息集成如信息网络、服务网络、知识网络等,是近几年网络流行起来的应用方向。2002 年,Globus 联盟和 IBM 在全球网络论坛上发布了开放性网络服务架构及其详细规范,把 Globus 标准与支持商用的万维网服务标准结合起来。2004 年,Globus 联盟、IBM 和惠普(HP)等又联合发布了新的网络标准草案,把开放性网络服务架构详细规范 I 转换成 6 个用于扩展万维网服务的规范,网络服务已与万维网服务彻底融为一体,标志着网络商用化时代的来临。 3