收藏 分享(赏)

seo-搜索引擎优化魔法书.doc

上传人:dzzj200808 文档编号:2953499 上传时间:2018-09-30 格式:DOC 页数:222 大小:3.52MB
下载 相关 举报
seo-搜索引擎优化魔法书.doc_第1页
第1页 / 共222页
seo-搜索引擎优化魔法书.doc_第2页
第2页 / 共222页
seo-搜索引擎优化魔法书.doc_第3页
第3页 / 共222页
seo-搜索引擎优化魔法书.doc_第4页
第4页 / 共222页
seo-搜索引擎优化魔法书.doc_第5页
第5页 / 共222页
点击查看更多>>
资源描述

1、搜索引 擎优化魔法书 SEO Magic Book 免费电子书 目 录 关于这本书1 第一章 搜索引擎基础2 第一节 什么是搜索引擎 2 一、搜索引擎的作用2 二、搜索引擎的定义4 第二节 搜索引擎的基本工作原理.4 一、抓取5 二、索引5 三、排序5 第三节 搜索引擎的分类 6 一、网页级搜索6 二、垂直搜索6 三、元搜索引擎6 四、目录搜索6 五、集成搜索7 第四节 搜索引擎的未来 7 一、快速化7 二、多样化7 三、智能化7 四、社会化7 五、个性化8 第五节 主要搜索引擎介绍 8 一、Google 8 二、Yahoo.12 三、百度13 四、搜狗15 五、中文搜索引擎列表16 第二章

2、 搜索引擎营销基础17 第一节 什么是搜索引擎营销 17 一、搜索引擎营销的定义17 二、搜索引擎营销的价值17 三、搜索引擎营销原理18 第二节 搜索引擎营销的特点 19 一、广泛使用19 二、用户主动查询,针对性强19 三、获取新客户19 四、竞争性强20 第 1 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 五、动态更新,随时调整20 六、门槛低,投资回报率高20 第三节 搜索引擎营销的目标 21 一、被收录21 二、排名靠前21 三、被点击21 四、客户转化21 五、提高品牌知名度21 第四节 搜索引擎营销的形式 22 一、搜索引擎登录22 二、固定排名和广告2

3、3 三、按效果付费排名24 四、自然排名24 第三章 搜索引擎优化基础25 第一节 为什么要搜索引擎优化.25 一、搜索引擎优化的定义25 二、搜索引擎优化的价值25 三、SEO 和 SEM 的关系 .26 四、SEO 和付费排名的关系26 第二节 搜索引擎对 SEO 的态度.27 一、Google 27 二、Yahoo.29 三、百度30 四、搜狗34 第三节 白帽 SEO 和黑帽 SEO .37 第四节 搜索引擎优化的发展 39 一、SEO 的发展历史 39 二、SEO 在中国 40 三、SEO 的发展方向 42 第五节 关于搜索引擎优化的一些观点.43 一、搜索引擎优化合法吗?43 二、

4、会不会和搜索引擎对着干?43 三、搜索引擎是否会人工干预?44 四、我的网站有大量的优质原创内容,所以我不需要 SEO 了。 44 五、SEO 没有技术含量或 SEO 需要很高深的技术44 六、大网站那样做了,我也向他们学习44 七、SEO 企业或 SEO 工具的保证排名宣传 44 八、稳定的排名45 九、SEO 的目标就是获得排名第一的位置或尽可能多的访问量 45 十、竞争对手无法破坏我的排名45 第四章 SEO 相关的搜索引擎技术46 第 2 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 第一节 搜索引擎机器人 46 一、什么是搜索引擎机器人?46 二、如何辨别搜索

5、引擎机器人身份47 第二节 超链分析 47 一、基本原理48 二、工作步骤48 三、搜索效果49 四、超链分析技术的应用49 五、存在的缺陷50 第三节 中文分词 50 一、什么是中文分词?50 二、中文分词的意义和作用50 三、中文分词技术51 四、分词中的难题53 五、中文分词的应用53 六、中文搜索引擎技术54 第四节 基于词意的文本分析 55 一、文本分析技术特点55 二、文本分析应用55 第五章 了解网站的搜索引擎表现57 第一节 基础查询 57 一、域名信息查询57 二、域名历史查询57 三、主机连接速度和 IP 地址查询57 四、同 IP 网站查询57 第二节 收录查询 58 一

6、、是否被收录58 二、网页收录数量58 第三节 反向链接查询 59 第四节 网页 RANK 查询.59 一、Google PageRank 查询 59 二、Sogou Rank 查询59 第五节 关键词排名查询 59 第六节 ALEXA 查询.60 一、什么是 Alexa?60 二、Alexa 主要数据60 三、用 Alexa 查什么?60 第六章 基于搜索引擎友好的网站设计 62 第一节 域名策略 62 一、不同后缀的域名在搜索引擎中的权重62 二、域名基本常识62 第 3 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 三、域名的关键词策略69 四、中文站点的域名的拼

7、音策略70 五、谨防注册一个遭受搜索引擎惩罚过的域名70 第二节 空间策略 71 一、安全元素一:稳定性71 二、安全元素二:良好的共处环境71 三、本节附录72 第三节 网站结构规划 72 第四节 站点导航设计 73 第五节 IFRAME、J AVASCRIPT 和 AJAX 73 一、IFRAME .74 二、JS .74 三、AJAX.74 第六节 URL 设计 75 一、便于用户记忆75 二、URL 静态化.75 三、URL 的关键词部署 .78 第七节 网页代码的编写 80 一、遵循 WEB 标准 80 二、代码的逻辑性80 第八节 面向搜索引擎的文案写作指导.81 一、网页标题 T

8、itle81 二、Meta 元标签.84 三、图片 ALT 替换文本85 四、Robots .txt.85 五、链接锚文本89 六、Sitemap.xml .89 七、版权与隐私97 第九节 用户友好性检测 97 一、链接的可用性97 二、访问速度体验97 三、查找信息的便捷度98 第七章 创建搜索引擎喜欢的内容99 第一节 搜索引擎喜欢什么内容.99 一、Google 对网站内容的说明:99 二、百度对网站内容的说明:99 第二节 内容的四大来源 99 一、自己撰写原创文章99 二、使用他人的内容100 第三节 常见问题 102 一、网站内容的更新102 二、内容匮乏怎么办103 第 4 页

9、 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 三、采集系统104 四、商城程序的内容问题105 第八章 提交你的网站106 第一节 向搜索引擎提交网站 106 一、常用搜索引擎登录入口106 二、提交注意事项106 三、登录搜索引擎的最佳办法106 第二节 登录分类目录站 107 第三节 登录网址导航站 108 第四节 登录垂直行业门户 109 第九章 链接策略(一) 111 第一节 链接的基本知识 111 第二节 为什么链接很重要 111 一、超链分析技术 111 二、网页级别 111 三、网站的更新频率 112 四、内容的相关性 113 第三节 网站内部页面的链接策略

10、. 113 一、给重要的网页更多的关注 113 二、相关链接(人工和自动)和频道关联 114 三、链接的导出 114 第十章 链接策略(二) 115 第一节 登录开放目录 DMOZ. 115 一、为什么登录 DMOZ 如此重要 . 115 二、DMOZ 开放目录登录实战攻略 . 115 三、一些对你有帮助的建议 116 第二节 交换链接 116 第三节 购买链接 117 第四节 链接诱饵 118 一、如何制造链接诱饵 118 二、对链接诱饵应如何看待 118 第五节 外链建设中的几个误区. 119 一、外部链接数目增长的自然化 119 二、不要忘记你最能做好的事情 119 三、不宜使用软件群发

11、120 第十一章 数据监测和分析121 第一节 网站流量数据统计与分析.121 一、什么叫网站流量及网站流量统计分析121 二、网站流量指标121 第 5 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 三、用户行为指标123 四、用户浏览网站的方式126 第二节 中文常见流量统计系统介绍.126 一、51.la 统计服务.126 二、网站管理员统计126 三、ItSun 统计 126 四、51Yes 网站流量统计 126 五、武林榜、太极链126 六、一统天下统计服务127 七、趋势流量分析系统127 八、Google Analytics127 九、Measure Ma

12、p .127 十、Statcounter .com.127 第三节 流量统计分析实例 128 一、典型性数据采集抓取128 二、IP 与 PV 128 三、网页访问入口分析130 四、搜索引擎流量导入131 五、搜索引擎关键词分析132 第四节 行业热点跟踪 133 一、Yahoo 风向标: .133 二、百度风云榜:133 三、百度指数134 第十二章 高端技巧137 第一节 搜索行为分析 137 一、什么是搜索行为分析137 二、为什么要进行用户搜索行为分析137 三、用户搜索行为的几个特点137 四、搜索行为分析的重点对象138 五、搜索行为变化情况138 六、用户的关键词搜索行为140

13、 第二节 关键词分析 143 一、什么是关键词143 二、如何挑选正确的关键词143 三、竞价关键词的选择147 四、关键词竞争程度分析148 五、关键词查询工具153 第三节 关键词密度 153 一、什么是关键词密度153 二、正确理解关键词密度153 三、适当的关键词密度153 四、关键词位置和形式154 第 6 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 五、Google 和 Yahoo 的区别 .156 六、关键词密度的基本原则156 七、如何增加关键词密度157 八、关键词密度工具158 第四节 信息干扰现象 158 一、信噪比与干扰信息158 二、信息干扰

14、的副作用158 三、如何减小信息干扰158 第五节 重定向 159 一、什么是重定向159 二、301 重定向.159 三、302 重定向.161 四、404 重定向.162 五、其他重定向164 第六节 垂直搜索引擎优化概览(图片搜索、移动搜索等).165 一、图片搜索165 二、Flash 167 三、视频搜索167 四、避免搜索中的搜索168 第十三章 几个重要的问题169 第一节 搜索引擎排名作弊 169 一、什么是搜索引擎作弊?169 二、搜索引擎排名作弊的常见形式169 三、常见的作弊载体171 第二节 搜索引擎的反作弊 172 一、为什么搜索引擎要反作弊172 二、搜索引擎对待

15、SEO 与作弊的态度 172 三、主要搜索引擎反作弊的一些规定173 四、搜索引擎惩罚站点事件举例175 第三节 搜索引擎惩罚和解除 176 一、搜索引擎惩罚的方式176 二、站点被惩罚后的影响176 三、如何投诉作弊177 四、你的站点是否被惩罚?177 五、搜索引擎作弊惩罚解除流程178 第四节 搜索引擎反作弊任重道远.178 一、搜索垃圾永不会消失178 二、搜索引擎反作弊的历程179 三、石头记录的 2005 年 SEO 作弊状况180 四、曾经的作弊有多疯狂182 五、SEO 的职业道德 186 六、搜索引擎反作弊的人性化189 第 7 页 搜索引 擎优化魔法书 SEO Magic

16、Book 免费电子书 七、搜索引擎反作弊的法律支持190 第十四章 附录191 第一节 搜索引擎发展史 191 一、搜索引擎编年史:全球191 二、搜索引擎编年史:中国197 第二节 搜索引擎行业八卦 200 一、中国 SEO 市场概况200 二、杨致远为 Yahoo 做优化 .201 三、SEO 大赛 201 第三节 SEO 工具介绍.202 一、SEO 工具软件种类 202 二、Google Sitemaps 206 三、通过 sitemaps 分析死链 .206 第四节 GOOGLE 的几个著名现象.207 一、Google Trust Rank .207 二、Google Sandb

17、ox.208 三、Google Dance .210 四、Sitelinks . 211 五、补充材料213 第 8 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 2007关于这本书 年初 ,的一次内部讨论中,产生了一个 想法:写一本关于搜索引擎优化的书。这个想法很快被转化成实际的行动,柳焕斌、陈小华和我开始了白天工作晚上码字的生活。 写作过程中,因为个人的原因,柳焕斌、陈小华先后离开了公司,开始了他们自己的事业。虽然留下了一部分书稿,但看着还有些残缺和混乱的文档,我有些茫然。 在很多朋友的支持下,我们还是决定把这本书写完。于是,胡利和方琳加入了写作的队伍,经过一个多月

18、的后续工作,书稿完成了。 已经不止一家出版社和我们联系这本书的出版事宜,但最终我们还是放弃了出版的机会,决定以免费的电子书的形式推出。 中文搜索引擎优化发展过程中,胡宝介女士免费的电子书和和王通先生收费的电子书都产生了重要的影响,希望我们的这本电子书也能发挥些作用。 书名是受了哈利波特的影响,但不是想表现搜索引擎优化的神秘,而是想说明,通过实施搜索引擎优化,能化腐朽为神奇,为网站带来更强的生命力。 感谢所有写这本书的人,大家都很辛苦,却没有稿费了;也感谢所有看这本书的人,时间仓促,有很多疏漏,大家看在免费的份上,多多包涵吧。 姚志国 2007 年 8 月 28 日 第 1 页 搜索引 擎优化魔

19、法书 SEO Magic Book 免费电子书 第一章 搜索引擎基础 第一节 什么是搜索引擎 一、搜 索引擎的作用如果非要列举出搜索引擎能做什么,恐怕没有人可以给出完整的答案。那么搜索引擎到底在我们的生活中扮演着怎样的角色呢?以下是一些普通网民使用搜索引擎的过程,从中我们不难看出搜索引擎正在发挥着怎样的做用。 小张喜欢和朋友聊天,却经常被朋友口中冒出的一些新名词搞得头晕,又不太好意思经常问。昨天几个朋友 闲聊,有人提到 “导弹打卫星 ”,却是一 带而过,小张有些犯迷糊了。晚上一回到家中,小张就打开电脑,上百度,搜索一下“ 导弹打卫星”,来龙去脉就一清二楚了。 重装了电脑,常用的 MP3 播放

20、软件没有了。搜索一下 “MP3 播放软件”,找到了一个叫“千千静听” 的,好像和以前用的不一样啊。再搜索一下“千千静听”,发现大家对这个软件的评价挺高的,而且知道了 这个 MP3 播放软件还能自动下载歌词、显示歌词。搜索“千千静听官方网站”,去下 载最新版本的软件了。 周五照例要和朋友小聚一下,可是每周聚会,吃来吃去就是那几个餐馆,都腻味了。打开 Google,试试看本地搜索。搜索 “南京川菜”,一下子出来几百个结果,好多都是没有听说过的餐馆。本地搜索 还有地图,把 查找范 围缩小到家附近,这样吃完饭回家就方便了。 小李是个旅游爱好者,每年五一 长假都要和朋友们一起出游。可是随着黄金周旅游越来

21、越火爆,一般景点五一期间简直是人头碰人头,根本不能去。春节一过,小李就开始琢磨今年的五一计划了,一定要着一个 风景不 错,又不是那么商 业化的地方。往边远地区找吧。搜索“贵州户外旅游”,找到当地一家不错的户外俱乐部网站,上他们的论坛泡泡,再咨询咨询,很快,小李就确定了一条位于黔东南的背包游线路。在制定具体计划的 过程中,一些交通 衔接的问题 有点麻烦。小李又在百度知道和新浪爱问提了一些问题,很快就得到了 满意的回答。 老吴是个摄影爱好者,最近一直想 买一个新的数码单反相机。那天咖啡馆取阅的杂志上看到一款佳能新型号相机的广告,漂亮的外观和看上去不 错的功能参数让老吴有点心动了。老吴用记下了 这款

22、产品的型号,回家直接用百度搜索一下,再 阅读了几百篇关于这款相机的使用心得和测评文章后,老吴终于决定出手了。不 过老吴可没有直奔商店,而是通过 比价搜索引擎找到了最便宜的网上商店 购买,比商 场卖了便宜了将近 1000 元。 小王今年高考,填报志愿的事情 让父母犯了愁。小王平 时成 绩算是中等,而且他一定要去北京读大学。虽然清 华北大大家都很熟悉,却不是小王的成绩能达到的,而其他学校大家就都不熟悉了。父母想知道北京其它高校的教学水平、学习风气以及生活条件,说要专门去趟北京考察考察。小王劝住了父母,打开电脑,搜索“北第 2 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 京

23、 大学”,一下子北京各大高校的网站出 现在面前。小王和父母把这些网站的内容仔仔细细的看了一遍,还分析了一些感 兴趣的学校往年的考分情况,基本上心中有数了。 小赵所在的公司原来提供某个配件的供应商出了一些问题,不能继续提供配件了,老板急得团团转。小赵通过搜索引擎找到了十多家具有生 产这种配件能力厂家,很快就落实了新的供应商。 搜索引擎已经成为广大网民日常生活中不可缺少的重要部分。中国互联网信息中心(CNNIC)2007 年第二十次调查报告显示:搜索引擎以 74.8%的比率已经成为中国网民最常使用的网络服务之一。详细数据见下表: 表 1-1-1 网民使用网络的功能及其所占比例 互联网功能 浏览新闻

24、 使用者占网民的比例 77.3% 获取信息 76.3% 搜索引擎 74.8% 即时通信 69.8% 网络音乐 网络影视 收发邮件 网络游戏 网络购物 网络教育 网上银行 博客 网络求职 网上炒股 网络销售 网上旅行预订 68.5% 61.1% 55.4% 47.0% 25.5% 24.0% 20.9% 19.1% 15.2% 14.1% 4.3% 3.9% 第 3 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 二、搜 索引擎的定义给搜索引擎下一个定义是非常困难的。一千个人就有一千个搜索引擎:有人认为搜索引擎就是百度,有人认为搜索引擎就是 Google,有人认为搜索引擎就

25、是 Yahoo。 如果非要给个定义,就让我们来看看微软大百科全书(MSN Encarta)是怎么定义搜索引擎的吧: 这个定义可能越看越模糊,那么以下章节的内容将会让你清晰地认识搜索引擎。 第二节 搜索引擎的基本工作原理 现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上,分布在世界各地的数据中心和机房。 对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是抓取技术存在瓶颈,无法遍历所有网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果

26、按照每个页面平均大小 20K 计算(包含图片) ,100亿网页的容量是 1002000G 字节,即使能够存储,下载也存在问题(按照一台机器每秒下载 20K 计算,需要 340 台机器不停的下载一年时间,才能把所有网页下载完毕) 。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而评价重要性的主要依据是某个网页的链接深度。 有人会认为搜索引擎在接收到搜索请求时,会实时地从全球所有的服务器上查询信息,并把查询结果展示在用户面前,这其实是一种误解。如果搜索引擎是这样工作的,那么查询一条信息可能要等上好几年才能得到搜索结果,这还不包括期间网页

27、发生的变化。 实际上,搜索引擎会预先去拜访大量的网站,并把这些网页的部分信息预先存储在自己的服务器上,这样,当用户搜索的时候,其实是在搜索引擎自己的服务器中进行查询,就像我们在自己的电脑中查询文件一样。 搜索引擎是非常复杂的技术,但是其基本原理并不复杂,其基本技术包括抓取、索引、排序。 第 4 页 Search Engine, software program that helps users find information stored on a personalcomputer, or a network of computers, such as the Internet. A use

28、r enters search terms,typically by typing a keyword or phrase, and the search engine retrieves a list of WorldWide Web (WWW) sites, personal computer files, or documents, either by scanningthe content stored on the computers or computer networks being searched or by parsing(analyzing) an index of th

29、eir stored data.搜索引擎是帮助用户查找存储在个人电脑、计算机网络如互 联网上的信息的软件程序。用户输入搜索项目,通常是通过录入一个关键词或短 语,搜索引擎通过扫描被搜索的计算机和计算机网络,或者分解(分析)它 们数据的索引,返回万维网站点、个人电脑文件或文档的列表。搜索引 擎优化魔法书 SEO Magic Book 免费电子书 一、抓 取图 1-2-1 搜索引擎工作原理 搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,根据一定规则扫描存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站。为保证采集的资料最新,它还会回访已抓取过的网

30、页。 二、索 引由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等) ,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性) ,然后用这些相关信息建立网页索引数据库。 三、排 序当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组

31、织起来,返回给用户。 第 5 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 第三节 搜索引擎的分类 按照不同的技术特点,可以把搜索引擎分为网页级搜索、垂直搜索、元搜索引擎、目录搜索和集成搜索等五类。 一、网 页级搜索网页级搜索引擎是名副其实的搜索引擎,国外具代表性的有 Google、Yahoo、MSN Live Search、Ask,国内著名的有百度、搜狗等。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。网页级搜索引擎也是目前常规意义上的搜索引擎。 二、垂 直搜索垂直搜

32、索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。它将网页库中某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理,然后再以某种形式返回给用户。 垂直搜索引擎与普通网页搜索引擎的最大区别是对网页信息进行了结构化抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引,再以搜索的方式满足用户的需求。可以这样说,网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。 各大搜索引擎都有自身的垂直搜索功能,比如 MP3 搜索、图片搜索、新闻搜索、B

33、log搜索等。独立的垂直搜索网站也受到有相关兴趣的用户的青睐,比如旅游搜索引擎、商业搜索引擎、比价搜索引擎等。 三、元 搜索引擎元搜索引擎在接受用户查询请求时,同时在其它多个引擎上进行搜索,并将结果返回给用户。元搜索引擎并不直接抓取网页,而是抓取多个搜索引擎的索引数据库,并根据自己的算法对抓取结果重新筛选排序。 虽然说元搜索引擎综合了多个搜索引擎的结果,但由于是建立在其他搜索引擎基础之上,自身的排序算法也难以得到认可,所以一直没有特别的影响力。 比较知名的元搜索引擎有 Dogpile() 、Vivisimo() 、比比猫()等。 四、目 录搜索目录索引虽然有搜索功能,但在严格意义上算不上是真正

34、的搜索引擎,仅仅是按目录分类的网站链接列表,并提供站内搜索而已。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。 Yahoo 和搜狐都提供分类目录功能,其它知名的目录还有 DMOZ(www.dmoz.org) 、第 6 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 Looksmart()等。 五、集 成搜索集成搜索算不上是搜索引擎,只是运用了一定的网页技术,把多个搜索引擎的搜索功能整合在一个搜索页面,并对各个搜索引擎的功能进行分类,方便用户在多个搜索引擎的搜索结果中进行比较和选择。部分集成搜索甚至没有对用户的搜索请求做出任何记录。所以,集成搜索更像一个在

35、线的、集合了多个搜索引擎入口的软件,而不是搜索引擎。 国内有很多集成搜索的网站,如优客搜索() 。 第四节 搜索引擎的未来 随着计算机和互联网应用的普及,大众对搜索的要求也越来越高,人们期望搜索引擎的速度更快、返回结果更准确、可以搜索的内容更丰富、更加智能化和个性化。 一、快 速化速度的提高是现在各个搜索引擎都在努力达到的目标。快不仅仅是指搜索引擎返回结果的速度,更是指搜索引擎获取新信息的速度。现在博客和论坛已经成为信息最重要的来源,一条爆炸性的新闻很可能来自某个人博客,而不是知名媒体。 二、多 样化多样化主要包括两个方面:内容多样化和搜索途径多样化。 内容多样化 除文字之外还包括图片、音频、

36、视频内容的搜索。 搜索途径多样化 可以通过语音指令、动作指令、甚至是思维指令进行搜索。 三、智 能化语义输入 可以通过输入自然语言来查找结果,就像在问朋友问题。比方说, “第一个登上太空的中国宇航员是谁?”这是很多搜索引擎研究的防线。虽然如 一直宣称自己是提问式搜索,但实际上并不能完全做到和用户的自然对话。 互动功能 逐层缩小搜索范围,使用户更快更准地找到所需信息。目前有些搜索引擎已实现了部分互动性。 相关搜索 在用户搜索过程中结合大量其他用户的搜索习惯统计,给出可能用户要查找的内容,引导和启发搜索者找到想要找的内容。 四、社 会化有人把社会化搜索称作“搜索人脑” 。搜索引擎借助对大量用户的

37、粘性,提供用户提问的功能,而这一提问的回答者不是搜索引擎本身,而是其他所有看到这一问题的用户。通过大量用户的群策群力,以及对应的专业人士的帮助,这些问题往往能得到比较好的解答。比第 7 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 如新浪的爱问、百度知道等都属于社会化搜索的范畴。 目前,社会化搜索的不足是还不能对回答内容的准确性进行评价,只能依靠提问者自己的判断。另外问题不能及时得到解答也会影响用户的耐心。 五、个 性化因为每个用户的喜好、目的不同,对搜索结果的期待就有很大差异。比如同样是搜索“绿茶” ,有人希望查找“绿茶”的商品信息,有人则是要找一部叫绿茶的电影。 所

38、以现在很多搜索引擎开始建议用户注册登录,比如 Google 和 Yahoo,这样用户的搜索习惯就会被搜索引擎记录和分析。如果你经常查询电影的相关资料,那你下次输入“绿茶”的时候,返回结果中绿茶电影的信息就会出现在靠前的位置了。 个性化搜索对用户搜索习惯的数据收集有很高的要求,不过在某种程度上,又涉及到用户的隐私问题。 第五节 主要搜索引擎介绍 一、Google 1、关 于 Google “Google”来源于“Googol” ,这是一个数学名词,表示一个 “1” 后面跟着 100 个“0”。这个词是由美国数学家 Edward Kasner 的外甥 Milton Sirotta 创造的,随后通过

39、 Kasner 和 James Newman 合著的“Mathematics and the Imagination” (数学与想象力 )一书广为流传。Google 使用这一术语体现了公司整合网上海量信息的远大目标。 Google 的使命是整合全球信息,使人人皆可访问并从中受益。完成该使命的第一步始于 Google 创始人 Larry Page 和 Sergey Brin,他们在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。目前 Google 被公认为全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到相关的搜索结果。 访问 或众多 G

40、oogle 域之一时,用户可以使用多种语言查找信息,查看股价、地图和要闻,查找美国境内所有城市的电话簿名单,搜索数十亿计的图片并详读全球最大的 Usenet 信息存档超过十亿条帖子,发布日期可以追溯到 1981 年。 用户甚至不必特意访问 Google 主页,也可以访问所有这些信息。使用 Google 工具栏,用户可以从网上的任何位置执行 Google 搜索,而 Google 桌面栏(测试版)将 Google 搜索框放在 Windows 任务栏中,这样用户可以从任何正在使用的应用程序中执行搜索,而不必打开浏览器。即使身边没有 PC 机时,用户也可以通过 WAP 和 i-mode 手机等无线平台

41、使用 Google。Google 的实用性及便利性赢得了众多用户的青睐,它几乎完全是在用户的交口称颂下成为全球最知名的品牌之一的。 作为一个企业,Google 通过提供广告服务来获取收入,使广告客户能够刊登与特定网页内容相关、重要而又经济实效的在线广告。这不仅为用户提供了实用的广告信息,同时也给刊登广告的客户带来了好处。Google 认为,搜索用户应该知晓在他们面前展示的讯息是自然排名还是付费信息,因此始终在搜索结果或网页上将广告与其他内容区分开来。Google不出售搜索结果中的排名,也不允许有人通过付费来提高在搜索结果中的排名。 第 8 页 搜索引 擎优化魔法书 SEO Magic Book

42、 免费电子书 成千上万的广告客户加入了 Google AdWords 计划,利用定位广告在网上推广他们的产品和服务,可以相信 AdWords 是同类计划中规模最大的一个。此外,成千上万的网站管理人员利用 Google AdSense 计划刊登与其网站内容相关的广告,增加收入并改善用户体验。 Google 是全球最大的搜索引擎,借助和 America Online、Netscape 及其他公司的合作伙伴关系,它所回应的查询远远多于其他在线服务商。 G 是互联网上 5 大最受欢迎的网站之一,在全球范围内拥有无数的用户。 Google 是阿根挺、澳大利亚、比利时、巴西、加拿大、丹麦、法国、德国、印

43、度、意大利、墨西哥、西班牙、瑞典、瑞士、英国和美国的头号搜索引擎(根据 Nielsen/NetRatings 05 年 6 月调查报告唯一身份访问者总数结果) 。 每月全球唯一身份用户:3 亿 8000 万(Nielsen/NetRatings,05 年 8 月调查报告) 。 全球受众:超过百分之五十的点击量来自美国境外。 Google 在硅谷和全球各地拥有最顶尖的技术人员和业务专家。截止到 2005 年 12 月 31日,共有 5,680 名全职员工,其中许多是技术人员或工程师。 2、Google 技 术Google 秉持着开发“完美的搜索引擎”的信念,在业界独树一帜。所谓完美的搜索引擎,就

44、如公司创始人之一 Larry Page 所定义的那样,可以“确解用户之意,切返用户之需” 。为了实现这一目标,Google 坚持不懈地追求创新,而不受现有模型的限制。为此,Google开发了自己的服务基础结构和具有突破性的 PageRank技术,使得搜索方式发生了根本性变化。 Google 的开发人员从一开始就意识到,要以最快的速度提供最精确的搜索结果,就需要一种全新的服务器设置。大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就会减慢,而 Google 却利用相互链接的 PC 来快速查找每个搜索的答案。这一创新技术成功地缩短了响应时间,提高了可扩展性,并降低了成本。这也是其他公司一

45、直在效仿的技术。与此同时,Google 从未停止过对其后端技术的改进,以使其技术效率更高。 Google 搜索技术所依托的软件可以同时进行一系列的运算,且只需片刻即可完成所有运 算,而传统的搜 索引擎在很大 程度上取决于 文字在网页上 出现的频率。Google 使用 PageRank技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,Google 可以将最相关最可靠的搜索结果放在首位。 PageRank 技术 通过对由超过 5 亿个变量和 20 亿个词汇组成的方程进行计算,PageR

46、ank 能够对网页的重要性作出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。 此外,PageRank 还会评估每个投票网页的重要性,某些网页的投票被认为具有较高的价值,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank 值较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性,搜索结果没有人工干预或操纵,不受付费排名影响。这也是 Google 成为一个公正客观、并且广受用户信赖

47、的信息来源的重要原因。 超文本匹配分析 Google 的搜索引擎同时也分析网页内容。然而,Google 的技术并不采用单纯扫描基于网页的文本这一方式(网站发布商可以通过元标记控制这类文本) ,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。Google 同时还会分析相第 9 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 邻网页的内容,以确保返回与用户查询最相关的结果。 Google 的创新并不限于台式机 为了确保通过便携式设备访问网络的用户能够快速获得精确的搜索结果,Google 还率先推出了业界第一款无线搜索技术,将 HTML 即时转换为针对 WAP、i

48、-mode、J-SKY 和 EZWeb 优化的格式。 3、Google 的搜 索过程Google 查询的全过程通常不超过半秒时间,但在这短短的时间内需要完成多个步骤,然后才能将搜索结果交付给搜索信息的用户。 4、Google AdWords 图 1-5-1 Google 的搜索过程 Google AdWords 是 Google 提供的搜索引擎关键词广告,采用按点击付费方式的网络广告模式,只有当用户点击广告时广告主才支付广告费用。 第 10 页 搜索引 擎优化魔法书 SEO Magic Book 免费电子书 Google AdWords 的表现形式是这样的:当用户用某个关键词在 Google 进行检索时(例如“鲜花” ) ,在搜索结果页面右侧会出现与鲜花这一关键词相关的广告(如果有公司购买这一关键词广告的话) 。广告的显示顺序取决于广告主愿意为每次点击支付的价格,比如广告主 A 愿意为每次点击支付 1 元,而

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报