收藏 分享(赏)

搜索引擎发展史.doc

上传人:jinchen 文档编号:8766887 上传时间:2019-07-11 格式:DOC 页数:8 大小:49.50KB
下载 相关 举报
搜索引擎发展史.doc_第1页
第1页 / 共8页
搜索引擎发展史.doc_第2页
第2页 / 共8页
搜索引擎发展史.doc_第3页
第3页 / 共8页
搜索引擎发展史.doc_第4页
第4页 / 共8页
搜索引擎发展史.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、搜索引擎发展史Archie-所有搜索引擎的祖先所有搜索引擎的祖先,是 1990年由 Montreal的 McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan 发明的 Archie(Archie FAQ)。当时 World Wide Web还未出现。Archie 是第一个自动索引互联网上匿名 FTP网站文件的程序,但它还不是真正的搜索引擎。Archie 是一个可搜索的 FTP文件名列表,用户必须输入精确的文件名搜索,然后 Archie会告诉用户哪一个 FTP地址可以下载该文件。由于 Archie深受欢迎,受其启发,Nevada Sys

2、tem Computing Services大学于 1993年开发了一个 Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead 是后来另一个 Gopher搜索工具。由于专门用于检索信息的 Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的 Robot程序被称为 spider(Spider FAQ)程序。世界上第一个 Spider程序,是 MIT Matthew Gray的 World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)

3、。与 Wanderer相对应,1993 年 10月 Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于 Archie的 HTTP版本。ALIWEB 不使用网络搜寻 Robot,如果网站主管们希望自己的网页被 ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的 Yahoo。1993 年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland 的 JumpStation、Colorado 大学 Oliver McBryan的 The Wor

4、ld Wide Web Worm(First Mention of McBryans World Wide Web Worm)、NASA 的 Repository-Based Software Engineering (RBSE) spider。1993 年 2月,6 个 Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是 Excite。后来曾以概念搜索闻名,2002 年 5月,被 Infospace收购的 Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile1994 年 1月,第一个既可搜索又可浏览的分类目录 EINet Galaxy

5、(Tradewave Galaxy)上线。除了网站搜索,它还支持 Gopher和Telnet搜索。 1994 年 4月,Stanford 两名博士生,美籍华人 Jerry Yang(杨致远)和David Filo共同创办了 Yahoo。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为 Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用 Altavista、Inktomi、Google 提供搜索引擎服务)WebCrawler-互联网上第一个支持搜索文件全部文字的全文搜索引擎 1994 年初

6、,Washington 大学 CS学生 Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994 年 4月 20日,WebCrawler 正式亮相时仅包含来自 6000个服务器的内容。WebCrawler 是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过 URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前 100个字。(后来 webcrawler陆续被 AOL和 Excite收购,现在和 excite一样改用元搜索引擎 Dog

7、pile)Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的 Michael Mauldin将 John Leavitt的 spider程序接入到其索引程序中,创建了 Lycos。1994 年 7月 20日,数据量为 54,000的 Lycos正式发布。除了相关性排序外,Lycos 还提供了前缀匹配和字符相近限制,Lycos 第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎

8、的数据量:1994 年 8月394,000 documents;1995 年 1月1.5 million documents;1996 年 11月over 60 million documents。(注:1999年 4月,Lycos 停止自己的 Spider,改由 Fast提供搜索引擎服务)Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称 1994年 1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek 只是一个不起眼的搜索引擎,它沿袭 Yah

9、oo!和 Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而 1995年 12月与 Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击 Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由 Yahoo!提供该服务。(注:Infoseek 后来曾以相关性闻名,2001 年 2月,Infoseek 停止了自己的搜索引擎,开始改用

10、Overture的搜索结果)元搜索引擎(A Meta Search Engine Roundup)1995 年,一种新的搜索引擎形式出现了元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是 Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。 DEC 的 Al

11、taVista(2001年夏季起部分网友需通过 p-roxy访问,无 p-roxy可用 qbseach单选 altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年 12月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista 最突出的优势是它的速度(搜索引擎 9238:比较搞笑,设计 altavista的目的,据说只是为了展示 DEC Alpha芯片的强大运算能力)。 而 Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista 是第一个支持自然语言

12、搜索的搜索引擎,AltaVista 是第一个实现高级搜索语法的搜索引擎(如 AND, OR, NOT等)。用户可以用 AltaVista搜索 Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索 Titles、搜索 Java applets、搜索ActiveX objects。AltaVista 也声称是第一个支持用户自己向网页索引库提交或删除 URL的搜索引擎,并能在 24小时内上线。AltaVista 最有趣的新功能之一,是搜索有链接指向某个 URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助

13、用户更好的表达搜索式,这些小 tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista 发布了一个图形演示系统 LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。然后到来的是 HotBot。1995 年 9月 26日,加州伯克利分校 CS助教 Eric Brewer、博士生 Paul Gauthier创立了 Inktomi(UC Berkeley Announces Inktomi),1996 年 5月 20日,Inktomi 公司成立,强大的 HotBot出现在世人面前。声称每天

14、能抓取索引 1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot 也大量运用 cookie储存用户的个人搜索喜好设置。(Hotbot 曾是随后几年最受欢迎的搜索引擎之一,后被 Lycos收购)Northernlight 公司于 1995年 9月成立于马萨诸塞州剑桥,1997 年 8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有 Stop Words,它有出色的 Current News、7,100 多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002 年 1月 16日,No

15、rthernlight 公共搜索引擎关闭,随后被divine收购,但在 Nlresearch,选中“World Wide Web only“,仍可使用Northernlight搜索引擎)1998 年 10月之前,Google 只是 Stanford大学的一个小项目BackRub。1995 年博士生 Larry Page开始学习搜索引擎设计,于 1997年 9月15日注册了 的域名,1997 年底,在 Sergey Brin和 Scott Hassan、Alan Steremberg 的共同参与下,BachRub 开始提供 Demo。1999 年 2月,Google 完成了从 Alpha版到 B

16、eta版的蜕变。Google 公司则把 1998年 9月 27日认作自己的生日。Google 在 Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象 Altavista一样,再一次永远改变了搜索引擎的定义。在 2000年中以前,Google 虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到 2000年中数据库升级后,又借被 Yahoo选作搜索引擎的东风,才一飞冲天。Fast(Alltheweb)公司创立于 1997年,是挪威科技大学(

17、NTNU)学术研究的副产品。1999 年 5月,发布了自己的搜索引擎 AllTheWeb。Fast 创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用 ODP自动分类,支持 Flash和 pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和 FTP搜索,拥有极其强大的高级搜索功能。Teoma 起源于 1998年 Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔 Tao Yang教授等人创立 Teoma于新泽西 Piscataway,2001 年春初次登场,2001 年 9月被提问式搜索引擎

18、 Ask Jeeves收购,2002 年 4月再次发布。Teoma 的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的 Refine;同时提供专业链接目录的 Resources。Wisenut 由韩裔 Yeogirl Yun创立。2001 年春季发布 Beta版,2001 年 9月 5日发布正式版,2002 年 4月被分类目录提供商 looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的 WiseGuide;预览搜索结果的 Sneak-a-Peek。Gigablast 由前 Infoseek工程师 Matt Wells创立,2002 年 3月展示 pr

19、e-beta版,2002 年 7月 21日发布 Beta版。Gigablast 的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个 spammers的肉包子功能暂已关闭)。Openfind 创立于 1998年 1月,其技术源自台湾中正大学吴升教授所领导的 GAIS实验室。Openfind 起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被 Baidu和 Google瓜分。2002 年 6月,Openfind 重新发布基于 GAIS30 Project的 Openf

20、ind搜索引擎 Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页 35亿,开始进入英文搜索领域,此后技术升级明显加快。北大天网 是国家“九五“重点科技攻关项目“中文编码和分布式中英文信息发现“的研究成果,由北大计算机系网络与分布式系统研究室开发,于 1997年10月 29日正式在 CERNET上提供服务。2000 年初成立天网搜索引擎新课题组,由国家 973重点基础研究发展规划项目基金资助开发,收录网页约 6000万,利用教育网优势,有强大的 ftp搜索功能。Baidu 2000年 1月,超链分析专利发明人、前 Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)

21、在北京中关村创立了百度(Baidu)公司。2001年 8月发布 B搜索引擎 Beta版(此前 Baidu只为其它门户网站搜狐新浪 Tom等提供搜索引擎),2001 年 10月 22日正式发布 Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过 9000万,可能是最大的的中文数据库。Baidu 搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash 搜索、信息快递搜索。2002 年 3月闪电计划(Blitzen Project)开始后,技术升级明显加快。移动通信可以说从无线电通信发明之日就产生了。1897 年,M.G马可尼

22、所完成的无线通信试验就是在固定站与一艘拖船之间进行的,距离为 18海里。 现代移动通信技术的发展始于本世纪 20年代,大致经历了五个发展阶段。 第一阶段从本世纪 20年代至 40年代,为早期发展阶段。在这期间,首先在短波几个频段上开发出专用移动通信系统,其代表是美国底特律市警察使用的车载无线电系统。该系统工作频率为 2MHz,到 40年代提高到 3040MHz 可以认为这个阶段是现代移动通信的起步阶段,特点是专用系统开发,工作频率较低。 第二阶段从 40年代中期至 60年代初期。在此期间内,公用移动通信业务开始问世。1946 年,根据美国联邦通信委员会(FCC)的计划,贝尔系统在圣路易斯城建立

23、了世界上第一个公用汽车电话网,称为“城市系统”。当时使用三个频道,间隔为 120kHz,通信方式为单工,随后,西德(1950 年)、法国(1956年)、英国(1959 年)等国相继研制了公用移动电话系统。美国贝尔实验室完成了人工交换系统的接续问题。这一阶段的特点是从专用移动网向公用移动网过 渡,接续方式为人工,网的容量较小。 第三阶段从 60年代中期至 70年代中期。在此期间,美国推出了改进型移动电话系统(1MTS),使用 150MHz和 450MHz频段,采用大区制、中小容量,实现了无线频道自动选择并能够自动接续到公用电话网。德国也推出了具有相同技术水平的 B网。可以说,这一阶段是移动通信系

24、统改进与完善的阶段,其特点是采用大区制、中小容量,使用 450MHz频段,实现了自动选频与自动接续。 第四阶段从 70年代中期至 80年代中期。这是移动通信蓬勃发展时期。1978年底,美国贝尔试验室研制成功先进移动电话系统(AMPS),建成了蜂窝状移动通信网,大大提高了系统容量。1983 年,首次在芝加哥投入商用。同年 12月,在华盛顿也开始启用。之后,服务区域在美国逐渐扩大。到 1985年 3月已扩展到 47个地区,约 10万移动用户。其它工业化国家也相继开发出蜂窝式公用移动通信网。日本于 1979年推出 800MHz汽车电话系统(HAMTS),在东京、大胶、神户等地投入商用。西德于 198

25、4年完成 C网,频段为 450MHz。英国在1985年开发出全地址通信系统(TACS),首先在伦敦投入使用,以后覆盖了全国,频段为 900MHz。法国开发出 450系统。加拿大推出 450MHz移动电话系统 MTS。瑞典等北欧四国于 1980年开发出 NMT450移动通信网,并投入使用,频段为450MHz。 这一阶段的特点是蜂窝状移动通信网成为实用系统,并在世界各地迅速发展。移动通信大发展的原因,除了用户要求迅猛增加这一主要推动力之外,还有几方面技术进展所提供的条件。首先,微电子技术在这一时期得到长足发展,这使得通信设备的小型化、微型化有了可能性,各种轻便电台被不断地推出。其次,提出并形成了移

26、动通信新体制。随着用户数量增加,大区制所能提供的容量很快饱和,这就必须探索新体制。在这方面最重要的突破是贝尔试验室在70年代提出的蜂窝网的概念。蜂窝网,即所谓小区制,由于实现了频率再用,大大提高了系统容量。可以说,蜂窝概念真正解决了公用移动通信系统要求容量大与频率资源有限的矛盾。第三方面进展是随着大规模集成电路的发展而出现的微处理器技术日趋成熟以及计算机技术的迅猛发展,从而为大型通信网的管理与控制提供了技术手段。 第五阶段从 80年代中期开始。这是数字移动通信系统发展和成熟时期。 以 AMPS和 TACS为代表的第一代蜂窝移动通信网是模拟系统。模拟蜂窝网虽然取得了很大成功,但也暴露了一些问题。

27、例如,频谱利用率低,移动设备复杂,费用较贵,业务种类受限制以及通话易被窃听等,最主要的问题是其容量已不能满足日益增长的移动用户需求。解决这些问题的方法是开发新一代数字蜂窝移动通信系统。数字无线传输的频谱利用率高,可大大提高系统容量。另外,数字网能提供语音、数据多种业务服务,并与 ISDN等兼容。实际上,早在 70年代末期,当模拟蜂窝系统还处于开发阶段时,一些发达国家就着手数字蜂窝移动通信系统的研究。到 80年代中期,欧洲首先推出了泛欧数字移动通信网(GSM)的体系。随后,美国和日本也制定了各自的数字移动通信体制。泛欧网GSM已于 1991年 7月开始投入商用,预计 1995年将覆盖欧洲主要城市、机场和公路。可以说,在未来十多年内数字蜂窝移动通信将处于一个大发展时期,及有可能成为陆地公用移动通信的主要系统。 与其它现代技术的发展一样,移动通信技术的发展也呈现加快趋势,目前,当数字蜂窝网刚刚进入实用阶段,正方兴末艾之时,关于未来移动通信的讨论已如火如菜地展开。各种方案纷纷出台,其中最热门的是所谓个人移动通信网。关于这种系统的概念和结构,各家解释并末一致。但有一点是肯定的,即未来移动通信系统将提供全球性优质服务,真正实现在任何时间、任何地点、向任何人提供通信服务这一移动通信的最高目标。 分工:资料搜集:陈剑平资料整理:刘振鸣高二(1)班

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报