1、1面向用户的学科信息门户服务研究刘竟(江苏大学科技信息研究所 镇江 212013)摘要:在提供高质量资源的同时,细致、完善的服 务功能也是学科信息 门户发展的关键。随着“面向用户”服务理念的提出和发展,学科信息门户也向着更深层次上的信息与服务集成的方向发展。文章着重对学科信息门户的服务方式进行了分析,包括学科信息门户的浏览、 检索、个性化及辅助服务。最后提出了对学科信息门户服务的改进建议。关键词:学科信息门户 服务机制 个性化服务 搜索引擎Research on the Subject-based Information Gateways User-oriented ServicesLiu J
2、ing(Institute of Science and Technology Information of Jiangsu University, Zhenjiang, 212013)Abstract: In providing high-quality resources, meticulous and comprehensive services are also the key to the subject-based information gateways development. With the “user-oriented“ service concepts proposin
3、g and developing, subject-based information gateway is also developing towards the more deep integration of information and services. This paper analyzed mainly the services of subject-based information gateway, including subject-based information gateways browse service, retrieval service, personal
4、ized service and assistant service. Finally, the author pointed out her suggestions for ameliorating the service of subject-based information gateway.Keywords: Subject-based Information Gateway; Service Mechanism; Personalized Service; Search Engine近年来,学科信息门户的研究和建设在国内外得到了广泛重视,并已发展成为网络环境下信息服务的重要模式之一。
5、它的出现有效弥补了搜索引擎的不足,提高了检索的效率,给广大的专业人员、教师、学生、科研人员查找学术网络资源提供了极大的便利。服务是学科信息门户的本质,在提供高质量资源的同时,细致、完善的服务功能也是学科信息门户发展的关键。随着“面向用户”服务理念的提出和深入,学科信息门户也向着更深层次上的信息与服务集成的方向发展。国外学科信息门户非常注重用户服务的开发,在浏览和检索基本服务的基础上,不同程度地提供了个性化的和辅助的增值信息服务,更体现了“以人为本”的服务理念,有很多经验值得我国学科信息门户借鉴。本文中,笔者拟对学科信息门户的服务进行分析和探讨,以期为我国已有学科信息门户的改进和新学科信息门户的
6、构建提供参考。1 浏览服务浏览是网络用户查找信息的基本方式之一。当用户难以清楚表达信息需求、检索提问不很明确时,可利用这种方式查找资源,逐渐明确信息需求、完善检索策略,可灵活限定检索范围,进行扩检和缩检;且用户通过这种方式获得“意外发现”的几率较大。学科信息门户利用超文本链接技术允许用户对相关内容进行非线性浏览,用户可以从任一感兴趣的结点出发,一边判断,一边沿路探查各相关结点的信息,并可随时结合在查找过程中产生的新的兴趣和需要,学习开发相关知识 1。目前学科信息门户主要提供按资源的学科分类和资源类型两种途径查看资源的浏览服务。1.1 通过学科分类实现浏览分类法按照学科或主题形式将不同的信息资源
7、进行分类和集中,通过等级和层次的显示,为用户使用信息提供良好的知识向导体系。学科信息门户根据信息服务的范围、学科、语言、地理覆盖2以及目标用户群采用通用、专业分类法或自己编制分类法来构建资源分类浏览结构 2。多数学科信息门户提供了按学科分类浏览资源的服务。通常的做法是,在分类浏览的第一层页面显示类目的大类,大类类名下用小字列出大类包含的主要子类目,起到类目解释的作用,有利于用户进一步了解类目的含义,判断是否需要点击进入。类目层次一般为 23 层,最多不超过 4 层。用户通过点击,逐层打开类目层次,在每一子类目及底层类目下有资源列表,提供资源的题名、描述、URL 等信息。有很多学科信息门户还在类
8、目或子类目名称后显示类目下聚集的资源数量。如SOSIG、LII、武汉理工大学图书馆的学科门户体系等,有利于用户了解门户资源的分布情况。为了适应网络环境,使类目体系更加贴切,学科信息门户在使用分类法时,一般都对分类法的类目进行了一定的改造、调整。如 SOSIG 在使用 UDC 时,并不是完全照搬 UDC,主要表现在:(1)不是使用 UDC 的详版,而是从中选择属于社会科学的 1000 多个类目建立浏览体系;(2)只显示类名,类号只是在编目人员编目和内部管理时使用;(3)类目的排列不是按照 UDC 的分类号序列(即分类体系) ,而是按照类目名称字母顺序进行排列;(4)可以给同一资源分配多个类号;(
9、5)在每一子类目下,都建立了与相关类目的链接,加强了类目之间的横向联系 3。1.2 通过资源类型实现浏览网络中的资源类型具有多样化的特点,较之传统印刷文献资源,学科信息门户收录的资源类型更加丰富,包括文本资源、数据库资源、交互式资源、图形图像、多媒体、机构和人物、软件、服务等等。多数学科信息门户有其相应的资源类型选择标准,对其标准范围内的资源进行收集、整理,且提供按资源类型的浏览服务。陈丽萍对国内外30个学科信息门户的资源类型进行了调查和统计,总结出约90种资源类型,在30个学科信息门户网站中有25个学科门户网站有资源类型浏览或检索的功能,占总数的76 4。由此可以看出,按照资源的类型组织网络
10、资源已经成为学科门户资源组织的主要方法之一,资源类型浏览服务可以满足用户从资源类型角度对资源进行查找的需求。DCMI类型元素控制词表(DCMI Type Vocabulary)是著名的通用资源类型分类表。该表把资源类型分为12个大类,是DC元数据中资源类型(Type)元素的参照表。有的研究人员指出DCMI划分的12个资源类型过于笼统和宽泛,“不太适用于网络导航的构建” 5。因此,大部分学科门户都有自己专用的资源类型表。这些资源类型表,资源类型的数量不同,BUBL LINK将资源分为27种类型,SOSIG的资源类型有25种,而INFOMINE的资源类型划分更加细致,共102项,CSDL学科信息门
11、户体系和CALIS重点学科网络资源导航采用了二级资源类型分类体系;同时资源类型的术语不规范,同一类资源有着不同名称。这种情况,将影响用户对资源的使用,造成用户使用上的混乱,同时影响不同学科信息门户在资源类型上的互操作。在这方面,renardus为我们提供了一定的解决思路:它采用了DCMI资源类型表对其子门户的所有资源类型进行映射,统一类型术语,实现了多个学科信息门户的跨库浏览和检索。2 检索服务随着学科信息门户资源数量的增多,用户难以通过单一的浏览方式迅速找到符合自己需求的信息,因此,学科信息门户还需要为用户提供更精准的检索服务。是否提供主题词检索服务成为了衡量学科信息门户是否完整的一个重要指
12、标 6,它提供的检索功能是否全面、检索界面是否友好、检索结果是否方便用户使用直接影响门户的使用效率。2.1 检索途径大多学科信息门户为用户提供了简单检索和高级检索,借鉴了很多联机检索的检索技术。用户可以在简单检索中选择在所有字段或只在资源题名、主题、描述、URL 字段中进行单条件检索;在高级检索中,可以构造复杂的检索条件,例如,可以在资源的更多字段中进行多字段组合检索,支持布尔逻辑检索、字段的模糊检索和精确检索,在精确检索模式下支持通配符的前方一致检索和后方截断检索,可以对检索范围进行约束和限制,这样可以更加准确地描述用户的检索要求,提高检3索的准确度。除了简单检索和高级检索这两种基本的检索方
13、式外,一些学科信息门户还从用户需求出发为用户提供了一些更加人性化的辅助检索服务。LII 将浏览方式和检索方式相结合,支持对当前浏览目录内的资源进行检索;同时,LII 为用户在门户中使用其他搜索引擎提供了接口“Search Beyond LII”,列出了GOOGLE、YAHOO、Vivisimo 等 16 种普通搜索引擎、BLOG 搜索引擎、新闻搜索引擎和图书馆员建立的搜索工具(Librarian-Built Search Tools),用于对 LII.ORG 以外的站点进行搜索 7。Intute 为用户提供了 Intute harvester(Intute 收割机) 8,它是独立于 Intut
14、e 目录的网页索引,其实质为搜索引擎,源自于 SOSIG 社会科学搜索引擎。与一般搜索引擎不同,Intute harvester 是由 harvester(其机制类似于“机器人”和“网络蜘蛛”)软件在经过学科专家筛选的、Intute 目录中的高质量网站中自动收集网页,形成网页索引的,更新周期为一个月。这样,既克服了一般网络搜索引擎网页质量不高的缺点,又解决了 Intute 目录不能提供足够多的资源且加工描述只到站点级别的缺陷,是用户利用 Intute 查找网络资源的一个很好的补充工具。但美中不足的是,Intute harvester 使用的仍是基于关键词的全文检索方式,仍存在普通搜索引擎检索效
15、率低的缺点。若对 Intute harvester 收集到的网页利用自动标引与自动分类技术进行自动化处理,然后提供对加工处理后网页的检索服务,则检索效果将有很大的提高。2.2 检索结果显示检索结果显示包括结果显示项目、排列顺序、一页显示的结果数、检索结果的处理方式等,用以帮助用户判断返回记录与自己需求的相关性,决定是否打开超链接。一般学科信息门户为用户提供的显示形式分为简单记录显示和完整记录显示两种,其中默认形式为简单显示,即只显示返回记录的资源题名、描述和 URL 等信息,同时提供记录“详细信息”的链接,用以显示描述记录的完整元数据。除了默认方式,学科信息门户应当为用户提供显示方式的定制功能
16、,让用户选择显示自己感兴趣的内容、按自己的习惯或需要对检索结果排序或指定检索结果页面每页显示的结果数,这也是衡量检索结果显示友好度的重要指标。国内外很多学科信息门户都注意到了这一点。SOSIG 允许用户在高级检索中对检索结果的排列顺序和显示项目进行定制,检索结果可以按相关度和字母顺序进行排序;LII 为用户提供对返回记录按域名、出版者、加入到 LII 的时期进行分组的功能,按题名及加入 LII 时间的正序和逆序多种排序形式,提供查看和打印资源的详细信息、对资源评论和将资源发送到邮箱等多种结果处理形式;在 CSDL 的学科信息门户中,用户可以在其高级检索中,定制结果的显示内容和每页的记录数,可选
17、的显示内容有标题/URL/描述、标题/URL 或只显示标题三种,每页的记录数可以为 5、10、20、30、50 或 100;“材料复合新技术信息门户”提供了阅读次数和发布日期两种结果排序形式,供用户选择。2.3 词表导航在网络资源组织中采用受控词表,可以规范网络信息标引和检索中的同义词、准同义词、多义词和同形异义词,方便用户检索时扩检、缩检,有助于提高检全率和检准率。为了解决搜索引擎基于关键词全文检索而引起的检索结果冗余量过大、检准率不高的问题,大多学科信息门户使用了叙词表标引和检索资源,一方面可以满足人们对特定事物、特定主题的检索需要,另一方面可提高检索效率。但用户最常使用的自然语言与受控语
18、言之间是有区别的,未经过专业训练的普通用户对叙词表语词是不熟悉的,这就存在用户与系统交流之间的障碍问题。为了解决这一问题,国外的一些学科信息门户采取了一些有效措施为用户提供受控词表入口。OMNI 为用户提供“Browse by MeSH Headings”按 MeSH 词表主题词字顺浏览资源,点击某一主题词,可以得到该词的上、下位词及相关词的浏览与链接。SOSIG 按学科使用HASSET、IBSS、SCIE、SRM、CABI 等多个叙词表对资源进行标引,同时为用户提供了词表引擎4(thesaurus engine) ,用户在检索框中输入一些字母,词表引擎将为用户检索包含这些字母的所有匹配的叙词
19、,例如输入“econ”将检索到“economics” 、 “economic policy”等词,用户可以点击检索到的叙词,查看它们的上下位词和相关词,以便用户从中选择点击与其信息需求最相关的叙词作为检索词检索 SOSIG 资源或作进一步的修正浏览。LII 采用 LCSH 对资源进行标引,虽然没有像 MeSH 和 SOSIG 一样为用户提供叙词表入口,但考虑到用户经常使用自然语言的关键词进行检索,LII 对资源进行描述时,设置了关键词字段,将资源 LCSH 标题词的同义词、组织的缩写或全称等都尽可能多地放在关键词字段,为用户提供了更多的检索入口词。我国的学科信息门户在这方面有明显的不足, “材
20、料复合新技术信息门户”和 CSDL 学科信息门户均没有使用叙词表,标引词都是取自题名、交替题名及资源描述和介绍语句中的词或词组,即关键词,没有很好地利用叙词表揭示和组织网络资源。笔者认为,我国的学科信息门户完全可以选择中国分类主题词表或根据自身学科的特点选择合适的专业叙词表,也可考虑自编叙词表,同时在门户中提供叙词表入口;或者利用后控词表,对检索词进行控制,提高学科信息门户的检索效率,实现概念检索和智能检索。近年来,本体、主题图、知识库、语义网络等知识组织系统迅速发展,在其推理机制下可实现知识检索。若把它们应用到学科信息门户的资源组织中,将会大大提高学科信息门户的检索效率。英国的 WWW Vi
21、rtual Library 的页面就是利用主题地图自动产生的,目前已建立了地区主题图,用户可对主题图数据库进行检索。3 个性化服务学科信息门户的用户,哪怕是同一个学科领域的用户,由于研究方向、学术水平、个人习惯等因素的影响,信息需求的差异亦很大。用户信息需求的个性化要求学科信息门户在提供浏览与检索等基本服务的同时,还要针对用户的具体需要,利用信息推送、动态 HTML 生成、自动跟踪、智能代理等技术,为用户提供更有效、更方便的个性化服务,节约用户的时间,满足不同用户的信息需求,这也是信息服务发展的必然趋势。目前,个性化服务通常是基于用户注册机制的,用户在注册过程中提供用户信息和需求特征信息,登陆
22、后自行设置定制信息。学科信息门户的个性化服务的主要方式有个性化信息推送和信息定制服务,其中个性化推送服务包括频道式、电子邮件式、网页式和专用软件式等方式;信息定制服务包括内容定制、界面定制、服务定制、检索定制等。在 LII 中,用户可以通过 E-MAIL 和 RSS 订阅一个星期内 LII 新增资源的情况,目前它已拥有接近 40 万的订阅用户。SOSIG 为每个注册用户提供了 MyIntute 信息账户。MyIntute 具有个人收藏夹功能,用户可以将在 SOSIG 查找到的、自己感兴趣或觉得有价值、希望经常访问的资源收录到 MyIntute 中,并提供“标签云” (tag cloud)功能,
23、允许用户使用“标签(tag) ”对收集的资源进行简单的标引,资源通过“标签”聚集,同时可以将做过标签的资源发送到用户的邮箱中或者导出保存为HTML、JavaScript 格式以嵌入到自己的网页中;允许用户对自己感兴趣的主题进行定制和保存用户的检索式,当门户中有相关的新资源加入时,系统会通过 E-MAIL 通知用户。除此之外,SOSIG为所有用户提供了自己网站的 RSS 频道,用户可以在自己的网站、服务或桌面 RSS 阅读器中免费使用。我国的几个学科信息门户中, “CALIS 重点学科网络资源导航”的个性化服务比较突出,它为注册用户提供分类定制、关键词定制、个人收藏夹、保存检索策略和检索历史及界
24、面定制等功能。“材料复合新技术信息门户”为用户提供 RSS 推送服务。CSDL 学科信息门户允许用户根据自己的需要定义“个人收藏夹” ,用户可以修改个人信息、定制推送代理和设置 RSS 聚合功能。4 辅助服务5除了浏览、检索和个性化服务功能外,各学科信息门户还不同程度地为用户提供了多种形式的辅助服务。如学科论坛、用户资源推荐、最近更新(如 30 天) 、点击排行、网站地图、门户 FAQ 等功能。虽然这些服务不是学科信息门户所必须的,但对提高门户的服务质量是非常有益的。随着学科信息门户的成熟与发展,辅助服务也将逐渐受到人们的重视。学科信息门户的用户多数为专业的研究人员,他们既是资源的需求者,又是
25、资源的拥有者。为此,很多学科信息门户采取了一些有效措施来调动用户的积极性,如设置学科论坛、用户反馈、允许用户推荐资源和在线评价资源等。多数学科信息门户都很重视用户对资源的推荐,将用户推荐作为门户资源采集策略的一部分,且在门户中为用户提供了资源推荐接口。若用户发现了他们认为有价值的、却没有包含在门户中的资源,则可以把资源提交给门户。提交时需要填写用户推荐表单,一般包括的内容有资源的网址、题名、资源描述、用户名和用户 E-MAIL。门户资源加工人员会对用户提交的资源进行审核,若满足门户的资源选择标准,且门户中没有收录,则该资源将被收录到门户目录中。通过这种方式,可以在一定程度上弥补系统工作人员资源
26、收集的不足,且调动了用户的能动性。学科论坛为用户提供了一个信息共享和交流的空间,是学科信息门户中的学科信息交流社区。它把具有同样兴趣爱好的用户聚集在一起,可以分享自己的研究心得、对研究中遇到的难题寻求其他人的帮助,也可以就学术中的某一问题展开讨论。有人还提出了设立基于专家的学科论坛的构想9,在获得相关专业学者的许可后,在专家论坛中发布他们的信息并邀请他们参与论坛的讨论,利用其专业特长和权威在论坛中解答用户的问题或由他们提出问题引发他人思考。此种方式可以为用户提供与学者交流的机会,提供权威的专家型学科信息服务,不失为一种有效的学科论坛模式,同时也符合学科信息门户提供高质量资源的特点。某些学科信息
27、门户还从用户需求出发,设计了一些比较有特色的、实用的辅助服务形式。如The WWW Virtual Library 为世界范围的用户设有东英格兰、德国、法国和中国等镜像站点;SOSIG 为用户提供了博客、会议与事件(conferences & events) 、部门(department) 、新闻聚合(newsround) 、大事件记年表(timeline)及用户网络应用虚拟培训组(virtual training suite)等。其中,新闻聚合服务相当于一个 RSS 在线阅读器,它为用户聚合了遵循 RSS 协议的118 个学科领域的工作和新闻种子(feed) ,并通过单一的、具有检索功能的界
28、面呈现,用户可以使用关键词在选定的某一个或所有可用的种子中检索当天、过去 7 天或所有日期的学科新闻,为用户的研究工作提供了巨大的方便。我国的学科信息门户只是提供了一些简单的辅助服务,如最新资源推荐、点击排行、网站地图等,未见特色辅助服务形式出现。5 讨论使某一专业领域的学习型、教授型和研究型用户,以最方便的方式获取所需的多种多样的资源和服务,提高信息服务的准确度和时效性,更好地满足用户的信息需求,正是学科信息门户要解决的根本问题。为了达到这一目的,学科信息门户通过多种方式为用户提供信息服务,包括学科资源浏览、检索、个性化定制、信息推送、学术论坛、用户反馈处理等。但在某些方面仍需进一步改进。(
29、1)我国的学科信息门户仍属于“以资源为中心”的信息服务类型,应充分借鉴国外成功经验。在资源和用户之间,我国学科信息门户的天平更偏重于资源,服务方式简单,对于个性化服务、定制服务、推送服务、学术论坛等只是设置了空栏目,而无实际内容,基本上仍属于“以资源为中心”的信息服务类型,用户更多的是被动地接受学科信息门户提供的资源和服务。国外学科信息门户在用户服务上做了非常细致的工作,有很多经验值得我国学科信息门户借鉴。如叙词表和词表导航的使用;对高质量网页资源的检索;设置学术论坛等。我国的学科信息门户应充分借鉴国外成功信息门户的经验,增加相应服务内容,提高服务质量,将学科信息门户建设和发展为“以资源为基6
30、础,以用户为中心”的集成信息服务形式,从而真正成为用户获取网络学科资源的最重要的途径。(2)建立学科门户智能搜索引擎,加强对网页资源的收集和深层次加工。一些学科门户与搜索引擎的使用调查表明,虽然学科信息门户在不断的发展,但其使用率并不高,77的学生使用搜索引擎但从未使用质量受控的学科门户 1011。其原因很大程度上归咎于:为了克服搜索引擎的不足,同时因为网络中的网页数量过多,学科信息门户收集的资源大多为网站,而对网页没有进行大规模的、深层次的组织加工;而习惯了搜索引擎“网页查找”的用户,更多的希望学科信息门户为他们提供对更高效的网页资源的查找,而不仅仅是网站。因此,笔者建议:将搜索引擎与学科信
31、息门户结合起来,利用学科信息门户收集的高质量的网站资源以及学科信息门户中使用的分类体系和叙词表,在学科信息门户中建立专门的、智能的学科门户搜索引擎。这方面,Intute 为我们提供了一定的思路。但为了进一步提高检索的准确度,在利用 Robot 技术对学科内的网页资源进行收集的同时,还应该利用自动标引、自动分类和自动文摘技术,对网页资源进行分类和主题标引,加强对网页资源的收集和深层次加工,为用户提供更高效、更直接的信息服务。(3)利用 Web 挖掘技术挖掘用户的信息需求,提高服务的主动性。我们看到,无论是国内还是国外的学科信息门户,其个性化都是基于用户定制机制的,服务仍有一定的被动性。目前,学科
32、信息门户对用户需求的挖掘还只处于初级阶段,在使用过程中,有一些信息需求是用户所没有发现或无法清楚表达的,同时随着用户研究的进行,其信息需求也在不断的变化。这些需求和变化会及时地反映在用户浏览和检索的过程中。Web 挖掘是使用数据挖掘技术自动地从 Web 文档和服务中发现和提取信息和知识的技术。学科信息门户通过对注册用户访问门户时产生的日志记录的挖掘,可以发现用户感兴趣的主题、资源类型或服务,挖掘用户的潜在信息需求,继而向用户推荐或推送相关资源,这样,学科信息门户的服务才由被动式真正转变为主动式。参考文献:1 何惠芬,网络用户信息查找行为模式综述.情报探索,2006,(8):53-552 李育嫦
33、.受控语言在学科信息门户中的应用研究.情报理论与实践,2006,29(4):485-4883 刘竟,侯汉清.情报检索语言与主题网关.新世纪图书馆,2005,(1):30-334 陈丽萍.学科门户资源类型组织研究.图书情报工作,2005,49(11):34-375 萧德洪,张春红等.学术图书馆学科导航门户资源类型表的设定.大学图书馆学报,2004,(5):28-33,676 李运景,侯汉清.主题网关关键技术研究.大学图书馆学报,2006,(1):69-73, 837 Librarians Internet Index 2007-4-17http:/lii.org/pub/htdocs/searc
34、h_tools.htm 8 Intute: Social Science-Harvester 2007-9-6http:/www.intute.ac.uk/socialsciences/harvester.html 9 向菲,面向用户的学科信息门户构建模式分析,情报科学,2005,23(10):1568-157210 Lesly H, Angela J. A social science gateway in a shifting digital world: shaping SOSIG for users needs of the future. Online Information Review, 2004, 28(5):328-33711 李阳晖,刘泾.学科门户服务发展趋势分析.情报科学,2006,24(9):1414-1418作者简介:刘竟,女,1980年生人,讲师,研究方向:情报检索语言与信息组织。联系方式(1) 通讯地址:江苏省镇江市学府路301号江苏大学科技信息研究所(212013)(2) 电话:150614906797(3) E-mail: