1、第三章 信息与引擎搜索文献检索 -“不仅仅提供资料信息,更重要的是提供研究的思路”“一流的科研需要一流的学术信息” “科学研究的过程同时也是科学信息积累与交流的过程”,第一节 信息素质一、信息素质1、定义:信息素质是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。,2、信息素质构成要素:信息意识:强烈的信息意识对信息敏感。 信息能力:信息的搜集获取能力主要包括信息接受能力力;信息捕捉能力;信息吸收能力;信息检索能力等。其中信息检索能力指熟悉各种信息源,掌握信息检索的基础理论和基本技术,熟练地利用各种手工检索工具和计算机检索系统查找所需信息的能力。信息道德:在信息领域中用以规范人们相
2、互关系的思想观念与行为准则。,3、信息素质可分为:工具素质:能用印刷和电子信息资源的有关工具,如计算机、软件等;资源素质:了解信息资源的种类、形式和查找、检索方法;社会结构素质:掌握信息的社会地位、作用、影响;研究素质:掌握利用信息进行有关学科研究的技能;出版和传播信息素质:能利用文本或多媒体报告研究结果。,4、美国信息素质评价1999年1月,美国大学与图书馆协会通过了“美国高等教育中学生信息素质能力标准”,共5条,每条附有具体的操作说明,为教师或图书馆对学生、用户、读者的信息素质评价提供了依据。这5条主要内容如下:(1)能确定信息资源的特点和范围;(2)能有效地获取所需信息;(3)能评价信息
3、及其来源,(4)利用其知识基础和价值系统选择适当的信息;(5)能有效利用所获得的信息实现特定的目标;,美国信息素质评价要点:(1)能运用新的和以前的信息开发新产品或项目;(2)能调整开发产品或项目的过程;(3)能与别人就产品或项目情况进行有效的沟通(4)了解信息使用的经济、法律和社会问题,在信息获取和利用时自觉遵守道德规范和有关的法律。(即在产品或项目开发中能正确使用有关信息资源,如合理使用或引用等),第二节 信息与科研一、学术研究中的时间分配据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计
4、数字可以看出,科研人员花费在科研文献查询的时间为全部科研时间一半还要多。 美国科学基金会NSF (National Science Foundation) ttp:/www.nsf.gov,二、科研流程图,三、科研选题和文献检索科技信息是知识创新的源泉:世界上任何一项科研成果或创新都是在吸取和借鉴前人或他人研究成果的基础上,再加上自己的钻研和创新所获得的。科技信息是科研的先决条件。,四、科研选题及其步骤 课题是为了实现某个特定目标所需要研究的一个或一组科学问题。科研选题就是形成、选择和确定所要研究和解决的课题。科研选题的步骤一般是:文献调研和实际考察提出选题初步论证评议和确定课题。,第三节、I
5、nternet概论 一、 Internet 简介INTERNET中文译为因特网,它是由众多计算机网络互联而成的,也称网间网(Network of Networks),是覆盖全球的信息交流与共享网络。计算机网络是一个数据通信系统,是由相互独立的计算机相互连接在一起的计算机集合,它跨越了时空的限制,最大限度地实现了信息资源的共享。计算机网络经过了由最简单的两台计算机通过诸如电缆连接而成,发展到今天的由全世界上亿台计算机通过电缆、光缆和无线等方式连通的全球Internet。,二、计算机网络的分类:(按分布距离的长短)1、局域网(LAN):将有限范围内的各计算机、终端和外部设备互联成网。可分为共享式和
6、交换式两种。最大距离不超过10KM。特点是容易管理与配置,拓扑结构简洁整齐,传输速率高、延迟短、成本低、应用广、级网方便、使用灵活。例如图书馆网络。2、城域网(MAN):将现有的局域网互连起来的一种规模较大的城市范围内的网络。范围为几十公里。3、广域网(WAN):一种跨城市、地区甚至国家的远程网络。采用分组交换技术,点对点通信技术。4、互联网(Internet):将不同的物理网络技术按某种协议统一起来的一种高层技术。,三、Internet 在中国的发展1986年拨号到欧洲一些国家,1994年4月正式接入Internet网。四个骨干网:中国公用计算机互联网(Chinanet)中国教育与科研计算机
7、网(Cernet)中国科技计算机网(Cstnet)中国金桥互联网(ChinaGBN),四、Internet 相关概念1、传输控制协议/网间协议(TCP/IP)传输控制协议/网间协议:(Transmission Control Protocol/ Internet Protocol /TCP/IP)是Internet的基础协议。是不同型号的计算机和操作系统进行数据传输的一种规则。TCP/IP协议好比因特网上一种公共语言,使来自各个不同国家和地区的人们可以相互交流和建立联系。,2、IP 地址为了保证Internet上的计算机(主机)在通信时能相互识别,TCP/IP协议要求Internet 上任何一
8、台计算机都有一个不允许重复的地址,这个地址就是IP地址(Internet Protocol Address)。IP地址由四组数字组成,每组数字中间用点隔开,如:202.112.175.4是的主机在Internet上的IP地址。图书馆购买的数据库的使用权限绝大多数通过IP控制。,3、WWWWWW (World Wide Web),译为万维网。是一种基于超文本(Hypertext) 方式的信息查询工具。WWW通过这种超文本的方式,把世界各地服务器上的信息连接在一起,图文并茂地显示在用户面前。WWW基于以下几个基本概念:超文本标记语言(HTML)超文本传输协议(HTTP)统一资源定位符(URL)浏览
9、器(BROWSER)WEB服务器(WEB SERVER),4、浏览器(Browser)浏览器是用户访问WWW的工具。与其它浏览器不同的是WWW浏览器不仅可以浏览简单的二进制文件,还可以浏览超文本标记语言中所能描述的图形、图像、声音、动画、表格以及进一步的连接信息。目前流行的浏览器主要有:Netscape Navigator 和 Microsoft Internet Explorer (简称IE)。,IE浏览器是目前应用最普遍的浏览器。通常计算机WINDOWS桌面上,可以找到上面的图标,这就是IE浏览器的标示。双击它可打开浏览器。,五、Internet的主要服务功能(1)电子邮件服务(E-mai
10、l)(2)文件传输服务(Ftp)(3)远程登录服务(4)万维网(5)电子论坛(BBS、Blog),第四节 网络信息资源一、网络信息资源定义 (Network Information Resource)指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷质的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源。随着因特网的迅速发展和普及,网络信息资源主要指放置在因特网上的信息集合,但并非包含所有因特网信息,而只是指其中能满足人们信息需求的那一部分。,二、网络信息资源的类型1、依据信息源的信息内容则可将网络信息源分为以下类型:(1)联机数据库各类数据库是联机存储电子
11、信息源的主体,据统计,仅至1991年中期,世界上就有数据库7600个。目前,很多重要的数据库都已经联入Internet,仅DIALOG 就有400多个。这些数据库包括各个学科,涉及各种文献的信息。,(2)联机馆藏目录库 目前Internet上的电子图书馆很多,国内外的许多图书馆都已经在网上提供服务。包括美国国会图书馆在内的许多著名公共图书馆、大学图书馆及学术机构的图书馆的馆藏机读目录库,通过网络对外开放,提供OPAC(图书馆联机公共目录查询系统)服务。,(3) 网络图书电子图书在Internet上越来越多,电子图书涉及的领域特别广泛,包括文学、艺术、科学、人文等各个领域。其中网上的电子词典、百
12、科全书更是独树一帜。(4) 网络报刊 在Internet上,已有很多的电子期刊对用户提供服务。世界著名的Times、Forbes、 Science、 Nature等都有网络电子版。我国的很多刊物报纸也都已经上网提供服务。如: 人民时报、经济日报,(5) 软件与娱乐游戏类网上的这类资源也很多,且大都是免费的。如Internet上有搜索引擎的介绍、语言帮助、幼儿教育之类的培训信息。而且随着远程教育的发展,这类信息的数量将大量增加。(6) 动态性信息在Internet上有许多动态性信息,如BBS、广告、新闻时事等。,三、文献信息网络检索工具网络检索工具,是指在因特网上提供信息检索服务的计算机系统,其
13、检索的对象是存在于因特网信息空间中各种类型的网络信息资源。 科研文献信息网络检索主要分为两种方式: 网络资源检索 专业数据库检索,第五节 网络资源检索方法网络资源检索和数据库检索有相同之处,也有不同点,总的来讲,网络资源检索的目标是检索与要求相关的网站或网页,通过这些网站或网页所提供的信息来决定检索的最终选择。网络资源检索的方法主要有以下几种: 一、布尔逻辑检索大多数网络检索工具都支持布尔逻辑检索,即:用布尔逻辑算符来表达检索词之间的逻辑关系。,常用的布尔逻辑算符有: 逻辑或(+,OR) 逻辑与(*,AND) 逻辑非(-,NOT)逻辑或(+,OR):表达检索词间的并列关系。可扩大检索范围,提高
14、查全率。如:A+B,表明结果中含有A或B都为检索命中逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中逻辑非(-,NOT):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:AB,表明结果是A中不包含B的那部分。,逻辑或,逻辑与,逻辑非,A,B,A,B,A,B,二、截词检索(通配符检索) 又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。检索系统不同,截词符也不同,常用的有:#,?,*等。截词检索也是一般数据库检索中常用的方法。截词的方
15、式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。,1.右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。而在搜索引擎中,目前多只提供右截法。而且搜索引擎中的截词符则通常采用星号*。如educat*。相当于educationeducationaleducator。若输入PY=199?,会把90年代的记录全部查出来。,2.左截断:截去某个词的前部,是词的后方一致比较,
16、也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。3.中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f?t可查出foot、feet。,4.复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemi
17、cal、thermochemistry等。,按截断长度可以分为有限截断和无限截断。1、.有限截断:是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、acids,但不能检出acidic、acidicity、acidity等词。又如comput? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。,2、无限截断:是指允许截
18、去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。 采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。,另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。并不是所有检索工具都能使用通配符检索,有些检索工具可以自动截词,如:Yahoo。,三、词组检索词组检索是将一个词组(通常用双引号“”括起)当作一个独立运算单元,进行严格匹配,以提
19、高检索的精度和准确度,它也是一般数据库检索中常用的方法。如:要检索“计算机网络”方面的网站或网页,可输入“computer network”。词组检索实际上体现了临近位置运算(Near运算)的功能,即它不仅规定了检索式中各个具体的检索词及其相互间的逻辑关系,而且规定了检索词之间的临近位置关系。,几乎所有的搜索引擎都支持词组检索,并且都采用双引号来代表词组,如“信息教育”。但在Infoseek中,除了用双引号外,还使用了短横线“-”来代表词组,如 digital-library-definition,区别在于以“-”表示的词组不区分大小写。 InfoSeek是1995年2月由InfoSeek公司
20、推出的搜索引擎。2001年2月InfoSeek改用Overture的搜索结果。InfoSeek公司后被Disney公司兼并,InfoSeek搜索引擎成为G的一部分,并采用Google的引擎技术。其网址是:http:/:,四、限制检索限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。 1.字段检索:是把检索词限定在某个/些字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。 在搜索引擎中,字段检索多表现为限制前缀符的形式。,属于主题字段限制的有:Title,Subject,Keywords,
21、Summary等。属于非主题字段限制的有:Image,Text等。字段限制也可以用缩写:TI(题名) AU(作者) AB(文摘) JN(刊名)PY(年代) LA(语种)如: information/TI LA=english文摘=网络信息资源,作为一种网络检索工具,搜索引擎提供了许多带有典型网络检索特征的字段限制类型,如主机名(host);域名(domain);链接(link);URL(site);新闻组(newsgroup)和 Email限制等。这些字段限制功能限定了检索词在数据库记录中出现的区域。由于检索词出现的区域对检索结果的相关性有一定的影响,因此,字段限制检索可以用来控制检索结果的相
22、关性,以提高检索效果。在著名的搜索引擎中,目前能提供较丰富的限制检索功能的有 AltaVista,Lycos和 Hotbot等。,如:用标题字段检索时可输入标题字段的标示符,通常是英文词“title”加“:”构成。用URL字段检索时用输入“url”加“:”,冒号后面跟上检索式。如:检索标题为运动与健康方面的网页,可以输入:title:sport and health,冒号后不能有空格。并不是所有检索工具的标题字段检索都使用titlt, 如:Yahoo的标题字段检索可使用“title” 也可使用“t”。因此,要根据不同的检索工具的检索功能使用检索词或标示符。除常用的标题字段以外,还有域名字段、主
23、机字段及出版物字段等。,2. 使用限制符:用表示语种、文献类型、出版国家、出版年代等的字段标识符来限制检索范围。例如要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊,则检索式为:(microcomputer? ?/de,ti,ab OR personal computer/ ti,ab)AND PY1999 AND(LAEN OR FR)AND DTSerial,3. 使用范围符号:如 :、Less than、Greater than、From to等,如查找19891999年的文献,可表示为:PY1989:1999 或者 PY1989 to PY=1999 又如查找2000年以
24、来的计算机方面的文献,可表示为 computer? ? And Greater than 1999 查找在指定的文摘号范围内有关地震方面的文献,可表示为 earthquake?/635000800000,4. 使用限制指令:限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限制)、全限制指令(Limit all,它是在输入检索式之前向系统发出的,它把检索的全过程限制在某些指定的字段内)。例如:Limit S5/328000-560000 表示把先前生成的第5个检索集合限定在指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段。上述几种限制
25、检索方法既可独立使用,也可以混合使用。,五、位置算符通过位置算符对复合检索词进行加工,限定词与词之间的位置关系,提高检准率。(W)算符:表示该算符两边的检索词顺序排列,不能颠倒,且除空格和标点符号外,不能插入其他词或字母。 例: High(w)Strength结果: High StrengthHigh_Strength在google, yahoo, baidu中,检索“产品(W)蒸馏”,都没有得到理想结果。,(nW)算符:允许两词间最多插入n个词例:eat(1W)Combustion结果:Heat of Combustion(N)算符:除空格和标点符号外,不得插入其它词或字母,但两词顺序可以颠
26、倒。例:money(N)supply结果:money supplysupply money(nN)算符:两词顺序可以颠倒,中间可以插入最多n个词。例:number(2N)theory结果:number theorytheory of number theory of the number,六、加权检索加权检索:用专门符号规定某个检索词在检索结果中的权值例:+environment 表示关键词environment必须出现在结果中例:-truck 表示关键词truck一定不能出现在结果中,第六节 网络资源检索工具-搜索引擎一、搜索引擎的定义:搜索引擎(Search Engine)是INTERNE
27、T上完成各种信息检索任务的一种工具。广义上是指一种基于INTERNET的信息查询系统,包括信息抓取、信息管理和信息检索;狭义上是指一种为搜集INTERNET上的网页信息而设计的检索软件。它通过分析Web页面的标题并跟踪它们所含的具体信息,整理成含有站点及Web页的URL、关键字等信息的庞大数据库,并根据用户的检索请求,返回其需要的信息。,二、搜索引擎的主要功能:1、在INTERNET上搜集信息;2、对搜集到的信息进行标引和分类等处理,并以此来建 立或更新数据库;3、接受用户的访问,提供实时的检索服务。作为因特网上专门提供网上信息查询服务的网站,搜索引擎可以在浩如烟海的网站中迅速查找有效信息,具
28、有强大的导航作用,已经成为人们上网时必备的工具。,http:/ 中文雅虎 http:/ 若比邻中文搜索引擎 http:/ 天网 http:/ 百度 http:/ 搜索客 1.AltaVista (http:/) 2.Excite (http:/) 3.Webcrawler (http:/) 4.Lycos (http:/) 5.Opentext (http:/) 6.Infoseek (http:/) 7.Yahoo! (http:/) 8.HotBot (http:/) 9.Google(http:/ 10.Magellan (http:/),三、典型搜索引擎Yahoo 1、Yahoo简介Y
29、ahoo!是世界上第一个搜索引擎,也是Internet最著名的查询系统,提供免费查询服务。Yahoo!是由两名斯坦福大学电机工程博士生David Filo和Jerry Yang(杨致远,华人)于1994年开发的,并于1995年成立Yahoo!公司。Yahoo!拥有第一流的Web目录和最佳的新闻链接以及许多附加服务,因而Yahoo拥有许多用户,每天约有400万人次访问,在短短的几年里,Yahoo就成为网上最热门的搜索工具,而且还为Internet增添了无穷魅力。,Yahoo!对收集到的信息都进行严格的审核和分类,从而保证了内容馈乏的网站不会在Yahoo!中找到。如果用户的检索要求没有满足,Yah
30、oo会自动将用户的检索要求转到Google进行查寻。在浏览器地址框键入即进入Yahoo!世界。,2、Yahoo 搜索功能:Yahoo!提供一些操作符用以对检索项的限定,主要包括以下几种:(1) +:表示结果中必须包含这个词,如:+market检索表示检索结果中必须含有market一词。(2) :表示限定检索字串一定不要出现在结果中,如:+market -survey表示检索结果中一定不包含有survey一词。注意“”与词之间不能有空格。,(3) 词组检索:把检索词放在双引号“”中,则此检索词作为短语检索,如“American Marketing Association”。若没有双引号则表示各单
31、词为“或”的关系,即“+”功能。(4) 截词检索:通配符号用“*”,但词干部分必须有3个字母。(5) 字段检索:Yahoo允许两种类型的字段检索,title和url 。t:表示只查网站名称,如t:football,在网站名称中查football。u:表示只查询网址(url),u:football网址中含football。,3、Yahoo 搜索方式: 目录查询普通搜索高级搜索,(1) Yahoo目录查询Yahoo的真正优势在于其分类目录的内容组织,其目录和分类系统比其它搜索引擎详细。Yahoo数据库有65,000篇HTML文献和其它Internet资源,共20多万个条目,提供优秀的主题浏览工具,
32、对网站信息按主题建立分类索引,按字母顺序列出14个大类,每个大类所包含的子类有精炼的描述,每个子类有数以千计的相关Internet网站信息。Yahoo的目录查询使用很简单,只要进入其主题分类界面,选定所查主题,逐级进入即可。如查科学技术,链接科学技术选项即可。,(2) Yahoo普通搜索打开Yahoo!主页进入普通搜索界面,在窗口的对话框中直接输入关键词进行检索,此时将在 Categories (类目);Web Sites( 网站);Web Pages(网页);News Stories(新闻故事);Net Events(网络新闻);Images(图像);Products(产品)中进行。Yaho
33、o!会从其数据库里检索符合条件的主题目录的Web站点,其结果依次为站点(The Web),目录(Directory),新闻(News), Products(产品),要想查看检索到的目录、站点和新闻,直接点击即可。,(3) Yahoo 高级搜索(Advanced Search): 高级搜索界面提供多种选择,包括搜索方式、搜索范围、时间范围以及显示结果数等,同时,还提供了检索词的逻辑组配方式,包括逻辑与(include all of the words)词组检索(include this exact phrase)逻辑或(include at least one of these words)逻辑
34、非(exclude these words),4、Yahoo 搜索结果: Yahoo!搜寻引擎会根据分类类目网站信息与关键字的相关程度来排列出相关的Yahoo!类目和网站。影响相关程度的因素有:与关键词相同的词的多少,相同的词愈多,表示相关程度愈高。(2) 与关键词完全符合(Exact Match),相关程度高于部分符合。(3) 与关键词符合的词的位置。网站名称(或新闻标题)符合关键词的相关程度高于网址(或新闻内文)符合关键词的网站。(4) 对新闻检索而言,新闻更新的时间也是搜寻结果排序的考虑要素,最新更新的新闻将优先列出。,四、典型搜索引擎Google (http:/ Google由两位斯坦
35、福大学的博士生 Larry Page 和 Sergey Brin 于 1998 年创立。Google Inc.于1999 年创立。Google 通过自己的公共站点 提供服务。Google收录的网站内容丰富,在主页中使用“Im feeling lucky”,“手气不错” 按钮,可以使检索直达与关键词最相关的网站中,这是该搜索引擎的一个特色。Google包含20 多亿网页,搜索速度快。现在,Google 每天提供 1.5 亿次查询服务。,2、Google 搜索功能:自动使用“and”进行查询:不需在关键词之间加上逻辑算符“and”或“*”,关键词之间“空格”表示逻辑关系与。 忽略词:Google
36、 会忽略最常用的词和字符,这些词和字符称为忽略词。Google 自动忽略“http”, “.com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。使用英文双引号可将这些忽略词强加于搜索项。,截词检索:为提供最准确的资料,Google 不支持截词(通配符*) 搜索,即Google 只搜索与输入的关键词完全一样的字词。忽略大小写:Google 搜索不区分英文字母大小写,所有的字母均当做小写处理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的结果都一样,搜索方式-目录搜索Google目录搜索,按照主题分为若干类,其搜索方法与Yahoo!
37、基本相似。,搜索方式-基本搜索:进入Google的查询界面即为基本搜索,其搜索简洁方便,仅需输入关键词并按回车键 (Enter),或单击“Google 搜索”按钮即可得到最相关的内容。,搜索方式-高级搜索(Advanced Search):点击“高级搜索”即可进入高级搜索界面,高级搜索界面提供多种选择,包括搜索方式、搜索范围、时间范围以及显示结果数等。同时,还提供了检索词的逻辑组配方式包括:逻辑与(包含以下全部的字词)词组检索(包含以下的完整字句)逻辑或(包含以下任何一个字词)逻辑非(不包括以下字词),Google 的特殊功能: 查找 PDF 文件 :除一般网页外,Google 现在还可以查找
38、文档格式为PDF的文件。如果某个搜索结果是 PDF 文件而不是网页,它的标题前面会出现以蓝色字体标明的 PDF。这样,用户就知道需要启动 Acrobat Reader 程序才能浏览该文件。单击 PDF 右侧的标题链接就可以访问这个 PDF 文档。如果您只想查找一般网页,而不要 PDF 文件,只需在搜索关键词后加上“ -filetype:pdf” 就可以了。,Google 的特殊功能:网页快照 :Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符
39、合您的需求。在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。,Google 的特殊功能:类似网页单击“类似网页”时,Google 侦察兵便开始寻找与这一网页相关的网页。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google 侦察兵会帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google 侦察兵会为您提供相关信息,供您比较,使您尽可能货比三家;如果您在某一领域做学问,Google
40、 侦察兵会成为您的助手,帮您快速找到大量资料。但网页越有个性,能找到的类似网页就越少。,Google 的特殊功能: 手气不错:按下“手气不错”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多,搜索结果- 搜索结果排序:Google搜索结果按相关性由大到小的排序方式输出,相关性判断的依据包括检索词在多页中的出现频率、位置、以及检索词与网页的匹配程度。Google搜索结果结果的每一条记录均提供了检索词出现的上下文,若多个检索词出现的位置相距较多,描述信息中大多数用省略号代替,则相关性可能较小。搜索结果-结果格式: 基本格式为:标题、摘要。 另外,Google提供检索结果总数和检索时间两个基本统计信息。,