收藏 分享(赏)

第1章基础篇.doc

上传人:涵涵文库 文档编号:12195764 上传时间:2021-11-03 格式:DOC 页数:21 大小:691.50KB
下载 相关 举报
第1章基础篇.doc_第1页
第1页 / 共21页
第1章基础篇.doc_第2页
第2页 / 共21页
第1章基础篇.doc_第3页
第3页 / 共21页
第1章基础篇.doc_第4页
第4页 / 共21页
第1章基础篇.doc_第5页
第5页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、21第1章 基础篇第1章 基 础 篇任何一门学科,基础知识都是非常重要的,只有在掌握了大量的基础知识之后,才会在实践中游刃有余。本章主要介绍SEO的定义、国内主要搜索引擎简介、搜索引擎的工作原理、SEO与网络营销以及常见的SEO术语和专业的搜索引擎指令。通过阅读本章,读者可以对SEO概念有一个大致的了解。当然,如果读者已经对这方面比较熟悉,可以跳过本章,直接进入第2章站内篇。1.1 什么是SEOSEO是英文Search Engine Optimization的缩写,中文翻译为“搜索引擎优化”。简单地说,SEO就是从搜索引擎上获得流量的技术。搜索引擎优化的主要工作包括:通过详细了解搜索引擎的工作

2、原理、如何在浩瀚的网页流中爬取网页、如何进行索引以及如何确定某一关键词排名位置从而对网页内容进行科学的优化,使其符合用户浏览习惯,在不损害用户体验的情况下提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。所谓“针对搜索引擎优化处理”是为了要让网站更容易被搜索引擎认可。搜索引擎会将网站彼此间的内容做一些相关性的分析对比,然后再由浏览器将这些内容以最快速且近乎最完整的方式,呈现给搜索者。不少研究者发现,搜索引擎的用户往往只会留意搜索结果最开始的几项条目,所以很多商业网站都希望通过各种方式来干扰搜索引擎的排序,其中以依靠各种广告为生的网站居多。目前SEO技术被很多目光短浅

3、的人,用一些SEO作弊的不正当手段,牺牲用户体验,一味地迎合搜索引擎的缺陷来提高排名,这种SEO方法是不可取的,最终也会受到用户的唾弃。网站的优化分为站内优化和站外优化两部分。站内优化指的是站长能控制网站本身所有细节的调整,如网站结构、页面HTML代码、服务器设置、文章优化等。站外优化指的是外部链接建设及行业社群的参与互动,这些活动不在网站本身进行的。获得和提高关键词自然排名是SEO效果的表现之一,但最终目的是获得搜索流量,没有流量的排名是没有意义的。因此,关键词研究、文案写作十分重要。进一步说,SEO追求的是目标流量,能最终带来盈利的流量。网站的最终目的是完成流量转化,记住要做科学的SEO,

4、切不可为SEO而SEO。1.2 SEO的作用SEO在今天看来已是一个非常热门的行业,尤其是电子商务的兴起,对SEO的需求也越来越大。每个经营性网站需要大流量的支撑才有转化的可能,搜索流量显得异常重要。SEO的作用主要有以下几个分类。(1)通过搜索引擎引来足够的流量,进一步扩大品牌的知名度,使其得到小投入大回报。如中国移动、国美电器等。(2)力图让搜索引擎给网站带来大的流量,以使网站的业绩指标攀升,吸引投资者或者收购等。(3)吸引在搜索引擎上搜索某一需求的精准客户,使他们了解并购买搜索的目标产品。如网店、销售型企业网站等。(4)依靠搜索引擎流量,换取广告商的青睐使其投放一定程度的广告。如百度联盟

5、。(5)希望获得来自搜索引擎的大流量,向浏览者推介某一产品,而不是当场购买。如生产型品牌企业网站、交友网站、会员模式站点等。1.3 常用搜索引擎简介这里主要列举国内使用频率相对较高的四个搜索引擎,分别是:百度、谷歌、搜搜、搜狗。通过对这四个搜索引擎的简单介绍,让我们对搜索引擎有一个简单的了解。1.3.1 百度百度(),全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村,它的Logo如图1-1所示。从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,10年来,公司秉承“以用户为导向”的理念,始终坚持如一地响应广大网民的需求,不断地为网民提供基于搜索引擎的各

6、种产品,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,MP3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过70%。 图1-1 百度网站的Logo百度的中文搜索优势如下:(1)百度中文数据库不仅最全,也是质量最好的。 (2)全球第一的数据挖掘、分布式索引和检索技术与处理速度,以及大规模的工业级系统的开发,支持百度以最快的速度呈现搜索目标内容相关的一切。(3)百度首页不到4K,最干净、最简洁的页面,随区域合理密布的多组服务器机群,架构于强大的网通及电信的骨干网上,可以在瞬间呈现搜索结果。

7、(4)百度拥有全球第一的网页分析技术、世界上独一无二的“中文分词”技术及全球最完善的反垃圾网页技术与流程,因此,百度对搜索结果的显示最为 准确。百度在中国的地位已经举足轻重,尤其是谷歌退出之后,百度在中文搜索市场更占据领导地位。很多小站长也靠百度过活,比如做淘宝客、做产品等。在中国要做SEO优化首先要研究的就是百度。1.3.2 GoogleGoogle 的使命是整合全球信息,使人人皆可访问并从中受益。他拥有全世界最先进的搜索技术。虽然Google已经退出中国大陆市场,但它还是学习SEO的好对象,推荐大家多去关注谷歌的站长管理员指南,所谓“知己知彼,百战不殆”。以下网址http:/ 材料。图1-

8、2 Google网站的Logo1.3.3 搜搜SOSO是腾讯QQ旗下重点发力的搜索引擎,现在整合了QQ客户端,给SOSO加上了强大有力的助推器。现有很多营销人士已开始对SOSO进行布局,您还等什么。从SOSO实验室的网址:http:/ 图1-3 搜搜网站的Logo1.3.4 搜狗搜狗是搜狐旗下的搜索引擎,现为淘宝合作项目,如果您是从事电子商务行业的,完全可以在这里开拓市场,网站Logo如图1-4所示。搜狗拼音是搜狐于2006年推出的一款汉字拼音输入法。凭着易用、灵活、全面等特点,再加上推广得当很快就在网络上蔓延开来。搜狗输入法最显著的特点是基于搜狗搜索引擎,很多在搜狗搜索引擎中所查询的热门关键

9、词会同步到搜狗输入法当中,如图1-5所示。 图1-4 搜狗网站的Logo 图1-5 搜狗拼音输入法自动更新搜狗输入法有一个自己特有的搜狗细胞词库,里面有网友自己创建的关键词,基本上都是日常所用到的,还有很多是最新最热门的关键词。词库的首页还有一个热词指数,对SEO人员很有参考价值。搜狗与搜狗拼音整合之后最大的好处就是方便SEO人员查询当下热门关键词,以备工作之需。搜狗拼音细胞库网址为:http:/ 搜索引擎工作原理从事SEO(搜索引擎优化)工作的人可以比喻成搜索引擎的贴身管家,作为一名合格称职的管家必须了解所服务对象的习性、爱好、健康程度等。SEO服务的对象就是搜索引擎,必须对它的运行规律、工

10、作原理、习性、优缺点等都要铭记在心,多多实践操作,平时实践的越多,经验也就越丰富。搜索引擎是由人创造出来的,所以也是有理可寻的。搜索引擎工作过程有主要有三段工作流程,爬行抓取、预处理及服务输出。1.4.1 爬行抓取爬行抓取是搜索引擎工作最重要的一步,把所有需要抓取的地方抓取回来处理分析,因此如果在抓取这部分出了错,后面完全就瘫痪了。回想一下每当我们用搜索引擎输入关键词后,会出现许许多多所查询的关键词信息,这个过程是以秒来计算的。这时我们可以想一想,搜索引擎是在1秒钟之内把所查询的关键词从广大的互联网中逐一抓取一遍,还是事先已经处理好了这部分数据呢。平时我们上网的时候随便打开一个网页的时间也是在

11、1秒钟之内,这仅仅是打开一个网页的时间,所以搜索引擎在以秒计算的情况下是不可能把互联网上的信息都查询一遍,这不仅耗时也耗钱。因此现在的搜索引擎是事先已经处理好了所抓取的网页。搜集工作也是要按照一定的规律来进行的,基本上有如下两种特征。 批量收集:对互联网上只要是存在链接的网页都收集一遍,耗时在几周左右。缺点在于增加了额外的带宽消耗,时效性也不高。 增量收集:是批量收集的一个技术升级,完美的弥补了批量收集的缺点。在原有的基础上搜集新增加的网页,变更上次收集之后有改变的页面,删除收集重复和不存在的网页。还有一种比较简单的方法让搜索引擎来爬行,自己主动向搜索引擎提交网站,等到一定的时间就会来爬取。不

12、过现在主动提交后再来爬行的速度越来越慢了,最理想的办法还是顺着自然链接来收集比较好。这就需要我们在前期做好蜘蛛爬行的入口,一定要找一个和网站自身相关的入口。下面将详细介绍搜索引擎蜘蛛的情况。1各搜索引擎蜘蛛介绍搜索引擎蜘蛛是搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在搜索引擎中搜索到您网站的网页、图片、视频等内容。一般用法为“spider+URL”,后面的URL(网址)是搜索引擎的痕迹,如果要查看某搜索引擎是否来爬取过你们的网站,可查看服务器的日志里是否有该URL,同时还能查看来的时间、频率等(1)百度蜘蛛:可以根据服务器的负载能力调节访问

13、密度,大大降低服务器的服务压力。根据以往的经验百度蜘蛛通常会过度重复地抓取同样的页面,导致其他页面无法被抓取到而不能被收录。这种情况可以采取robots协议的方法来 调节。百度蜘蛛的用法如下:Baiduspider+(+http:/ (compatible; Yahoo! SLurp China; http:/ (compatible; Yahoo! SLurp/3.0; http:/ (+http:/ YodaoBot/1.0; http:/ spider/;)2链接布局蜘蛛主要通过爬取页面上的链接来发现新的页面,以此类推不停地十字交叉爬行下去便形成一张蜘蛛网。爬行主要按两种策略来执行:一是

14、深度优先爬行,二是广度优先爬行。 深度优先爬行:如图1-6所示,蜘蛛从A网页顺序到A1、A2、A3、A4,爬行到A4页面之后发现没有页面了,于是又重新返回到了A页面,以此类推爬行到B1、B2、B3、B4页面。深度爬行的主要特点是蜘蛛会一直沿着一条线抓取下去,直到最后,然后再返回到另一条线。图1-6 深度优先爬行示意图 广度优先爬行:指蜘蛛在一个页面上发现多个连接的情况下,首先要做的是把所有第一层的链接抓取一遍,然后再沿着第二层的链接向第三层链接爬行,如图1-7所示。归根到底,只要给蜘蛛足够的时间,无论是广度爬行还是深度爬行都能爬完整个网站。我们做SEO优化就要给蜘蛛节省宽带和资源,毕竟蜘蛛的资

15、源不是无限的,也有满负载的时候,我们所要做的工作就是为蜘蛛指明一条正确的道路,尽量减少蜘蛛的工作。图1-7 广度优先爬行示意图3避免网页重复收集重复收集,从表面意思可以理解为第一次已经收集过之后,又进行了第二次的收集。效率不但没有提高反而增加了带宽的额外开销。对于搜索引擎而言重复做事情相当地消耗资源,也就做不到时效性地更新,而且有可能降低秒级的输出服务。造成重复收集的原因在于蜘蛛并没有记录访问过的页面的url,另一方面还有可能在于一个页面有多个域名指向所导致。因此搜索引擎在这方面增加了一个额外的技术,分别定义两个不同类型的表,即“已访问表”和“未访问表”,依靠这个技术就很简单地解决了重复收集的

16、难题。蜘蛛抓取到一个链接之后,从这两个表中判断这个链接是否已经被访问过,如果没有访问过,抓取回来添加到未访问表中去。如图1-8所示,蜘蛛从开始爬行到网页D、网页A、网页C或者从网页F顺着链接爬行到网页G、网页D、网页A,蜘蛛都会调用两边中的数据,以此来判断爬取网页的重复度。4收集重要的网页由于互联网信息实在太多太杂,随着时间的积累不可能将所有的信息都收集起来,所以要尽可能地收集重要的网页。网页信息的重要性是根据信息本身来决定的,从而收集的方式也采用不同的策略。对网页重要程度的判断也有一些方法可循。整站页面的质量权重度,并非是网站首页权重越高越好,需结合全局来分配权重。判断一个页面的重要程度可从

17、这四点来检验,基本上能肯定下来这个页面的重要度。目录深度大的页面也并非不重要。图1-8 蜘蛛解决重复抓取的过程(1)网页目录越小越好。利于用户体验,节省蜘蛛爬行时间。(2)高质量相关链接导入。从外部导入和自身相关度大的链接,可以增加页面权重。(3)信息的新鲜度。一个有价值的网站每天都会有更新,用户天天来看,蜘蛛也会天天来光顾。(4)网页内容的原创性。原创性越好的网页重要性越高。1.4.2 预处理通过前面的爬行抓取流程,已经把网页全都抓取回来了,接下来的工作就是对这部分数据进行一个索引工作,其中包括了很多个处理流程。和爬行一样,预处理也是在后台提前完成的。1关键词提取搜索引擎完全能识别的依旧是以

18、文字内容为主的。蜘蛛在爬取一个页面的同时也把大量的HTML代码抓取下来,如JavaScript、css、div标签等,这些对排名都毫无意义。首先的工作是要将HTML标签、程序去除,提取用于排名的文字。2去除停用词同一个词可能在一篇网页中出现多次,如“得”、“的”、“地”、“啊”、“阿”、“呀”、“却”、“再”、“从而”之类的无用词,反复的出现就没什么价值了,我们称这类词为停用词。这类词也需要去除掉。3分词技术分词是中文搜索引擎特有的技术支持。中文信息和英文信息的差别在于:英文单词与单词之间用的是空格分隔的,这对中文就行不通了,搜索引擎必须将整个句子切割成小单元词,如“我的兄弟姐妹”拆分出来的形

19、态是“我”、“的”、“兄弟”、“姐妹”。分词技术的效率直接影响到整个系统的效率。分词的方法基本上有两种:基于字符串匹配的分词方法和基于统计的分词 方法。1)基于字符串匹配的分词方法按匹配方向的不同,可分为正向匹配、逆向匹配和最少切词。可将这三种方法混合起来使用,即正向最大匹配、逆向最大匹配、正向最小匹配、逆向最小 匹配。正向最大匹配:假设字典中最长的词语字数为m,先根据汉语标点符号及特征词把汉语句子切分为短语,然后去取短语的前m个字,在字库里面查找是否存在这个词语,如果存在,短语就去掉这个词;如果不存在就去掉这m个字的最后一个字,接着检查剩下的词是否是单字,若是则输出此字并将此字从短语中去掉,

20、若不是则继续判断字库中是否存在这个词,如此反复循环,直到输出一个词,此后继续取剩余短语的前m个字反复循环。这样就可以将一个短语分成词语的组合了。以“我是一个好人”为例,假设字典中最长词语字数为3,正向最大匹配顺序为:(1)取出短语“我是一”,检查“我是一”是否在字典中存在或是一个单字,处理方式是去掉最后面的“一”字;(2)检查短语“我是”是否在字典中存在或是一个单字,处理方式是去掉 “是”字;(3)检查“我”字是否在字典中存在或是一个单字,“我”是一个单字,将“我”字输出;(4)继续取出短语“是一个”,检查“是一个”是否在字典中存在或是一个单字,处理方式是去掉最后面的“个”字;(5)检查短语“

21、是一”是否在字典中存在或是一个单字,处理方式是去掉 “一”字;(6)检查“是”字是否在字典中存在或是一个单字,“是”是一个单字,将“是”字输出;(7)取出短语“一个好”,检查“一个好”是否在字典中存在或是一个单字,处理方式是去掉最后面的“好”字;(8)检查短语“一个”,发现是字典中的一个词,直接输出;(9)检查短语“好人”,发现是字典中的一个词,直接输出;(10)最后输出结果为: 我、是、一个、好人。逆向最大匹配:以句子结尾处进行分词的方法。逆向最大匹配技术最大的一个作用是用来消歧。如“富营销线下聚会在下城子镇举行”按照正向最大匹配结果为:富/营销/线/下/聚会/在/下/城子镇/举行,很显然这

22、当中差生了歧义。下城子镇是一个地名,没有被正确地切分。采用逆向最大匹配的技术可以修正这个错误。例如设定一个分词节点大小为7,那么“在下城子镇举行”中很显然“举行”被分出来了,最后剩下“聚会在下城子镇”,这样一来歧义就被消除了。正向最小匹配/逆向最小匹配:一般很少使用到,实际使用中逆向匹配的精准度要高于正向匹配度。2)基于统计分词方法 直接调用分词词典中的若干词进行匹配,同时也使用统计技术来识别一些新的词语,将所有的统计结果匹配起来发挥切词的最高效率。分词词典是搜索引擎判断词语的依据,基本上收录了汉语词典当中所有的词语。如我们在搜索引擎中输入“我要减肥了”,“减肥”两字就会被判定为一个 词语。现

23、在网络上经常会出现一些新造的网络流行词语如“神马”、“犀利哥” 等,这样的词也都会慢慢地被收录。分词词典只有不断更新才能满足我们日常搜索判断的需求。4消除噪声网页上有各种形形色色的广告文字、广告图片、登录框、版权信息等,为了某些目的不得不放上去,这些对搜索引擎来说不是有用的东西,可以直接去掉。如图1-9所示,这个是富营销论坛的一些噪音元素。登录框只对用户登录使用,对搜索引擎来说不用登录进去再查看信息,“发帖”和“回复”自然也是不必要的噪声。5分析网页建立倒排文件正向索引:经过前面几步的工作之后就开始提取关键词了,把页面转换为一个关键词组合,同时记录每一个关键词在页面上的出现频率、出现次数、格式

24、、位置,这样每一个页面都可以记录为一串关键词组合,其中每个关键词的词频、格式、位置等权重信息也都记录在案,如图1-10所示。图1-9 富营销论坛噪音元素图1-10 简化的索引词表结构倒排索引:正向索引还不能直接用于排名。假如用户搜索关键词3,如果只用正向索引,排名程序需要扫描所有的索引中的文件,找出包含关键词3的文件,再进行相关计算。这样一来计算无法实时返回排名结果。所以搜索引擎会将正向索引数据库重新构造为倒排索引,倒排索引以关键词为索引,如图1-11所示。图1-11 倒排索引词表结构6链接关系计算链接关系计算是预处理中重要的一步。主流搜索引擎排名因素都包含网页之间的链接流信息。事先必须计算出

25、页面上有哪些链接指向哪些其他页面,每个页面有哪些导入链接,链接使用了什么锚文本等种种的链接计算。Google PR是这种链接关系计算的重要代表之一。7特殊文件处理可以抓取和索引以文字为基础的多种文件类型。对flash、视频、PPT、XLS、图片等非文字内容不能执行脚本和程序。搜索引擎目前还无法获取flash文件和图片中的文字信息。图片一般推荐使用ALT标签图片文字信息。1.4.3 服务经过前面的爬行抓取和预处理之后已经存储了一定的数据,并且已经记录了重要关键词的集合,即正向索引和倒排索引中的关键词集合,每个关键词赋予特殊的编码形成了一个倒排文件。输入一个关键词就能马上从相关文档编号中找到所需信

26、息了。用户输入某个关键词如“减肥”,查找的出发点还是比较模糊的,究竟是要找寻减肥方法,还是减肥教练等,这是大部分用户的一个习惯。搜索引擎处理方法是尽量把出现减肥二字的词都调用出来,可能包含几百页之多。排名靠前的,用户也就点击的也越多。输出的结果采用列表的形式。随着谷歌技术的进步也有了一些不错的进展,谷歌采取了预加载网页可视图的形式来增强用户体验,如图1-12所示。图1-12 Google搜索页信息预览页很显然这样的显示方法更有利于用户体验,不用点击链接就能看到整个网页的布局及分布情况,节省了用户的时间。文档摘要在列表中起着重要的作用,一个丰富而有吸引力的描述更加能够引起用户的兴趣。那么搜索引擎

27、是如何提取这些描述信息的呢。一般从网页正文开头部分提取256个汉字,或者将每一个段落的第一个句子拼起来,一旦查询匹配就返回给用户。我们日常都习惯用百度搜索一些相关的知识,和搜索的关键词所匹配出来的词是黄背景、红颜色的字,这是搜索引擎在用户体验上的一种进步,也是现代搜索引擎必须要有的一个技术。1.5 SEO与网络营销网络营销是一种网上营销手段,又可称为在线营销、网络事件营销、互联网营销等。网络营销以互联网为载体,制定详细的网络营销策划方案,预测和掌控每一环节,从而更有效地发挥策划的最大功效。SEO是隶属于网络营销范畴内的,只是它的一个细小的分支,但是SEO又是网络营销不可或缺的营销方式,它的低投

28、入、高回报让诸多营销人士心动不已。1.5.1 网络营销的前景随着信息技术的不断发展,网民的数量也在不断增加。据CNNIC在2010年发布的报告称网民规模数已达3.84亿。巨大的上网人数,带来了新的商机。同时也有很多的商家通过建立自己的网站来吸引目标客户群体,通过各种实现策划过的方案去逐步实施。互联网巨大的消费群体,只要你对自己的产品定位把握好,客户是迟早的事。电子商务在近几年可是风生水起,最有代表性的淘宝、京东、当当等,均制定了周密的网络营销策划方案,每一个推广、每一个活动,把握每一个细节。同时对网络营销人才的需求也不断的加大,正是这个特殊的时候出现了很多网络营销培训机构。SEO从2006年开

29、始慢慢地在国内流行起来,是一个低廉而且非常有效果的推广手法,非常适合中小型站长。同时对于企业来说,既降低了推广成本,也使得推广效果大大地提高。现在电子商务是一个热门的行业,SEO从中也发挥了巨大的作用。京东商城在这方面做得尤为出色。SEO和网络营销是相辅相成的,如何正确有效地把这两点结合起来,正是我们日常工作不断在寻找的。到今天为止,SEO已经衍生出另外一种更加有效的推广方法,不再单单只做网页的优化,而是结合搜索引擎的一些特点与网络营销结合起来,包括全方位的优化,比如用户体验上的优化、活动促销方案的优化、转化率的优化等。这就是我们业内人士称之的SEM,搜索引擎营销。搜索引擎营销最大的特点是把产

30、品自身的优点信息,以最简单的方式告知最有需求的用户,一般做搜索引擎营销的工作人员营销前会做一些调查,针对这些调查情况来展开营销活动。营销活动包括PPC付费广告、网站关键词布局、用户体验的优化、搜索引擎的登录、搜索引擎自然优化等。SEM最大的特点在于利用自身产品特色优势,来吸引最目标人群。1.5.2 网络营销的优势网络营销之所以会成为互联网不可或缺的热门行业之一,是因为营销的本质决定了绝大多数公司或者团队都不能离开它。同时,网络营销又有诸多优势。(1)能直接进行在线销售,减轻库存压力。(2)网络营销可以花少部分的资金发挥最大的功效,范围广、速度快、无时间限制、能快速得到回应等特点,有利于提高品牌

31、的推广,成本方面的降低比较明显。(3)营销范围广,可进行任何一个国家的营销操作。(4)市场信息更加的透明。(5)能制定各种营销活动,吸引潜在客户。(6)布局长尾,让每一个潜在客户无处可逃。1.5.3 网络营销的劣势当然,由于互联网的制度还有待改善,目前的网络营销行业也存在许多不正当的竞争手段,比如欺诈、产品质量无法控制等。这里笔者列举了三点网络营销的劣势,供读者参考。(1)无法当面看到实物,通过图片和文字信息无法获取100%的信任。(2)市面上价格幅度比较大,常常打价格战。(3)支付问题上存在风险。1.6 常见SEO术语这些术语对普通用户来说,基本上用不到,但对于SEO人员来讲,熟悉SEO术语

32、会有助于帮助我们更好地理解SEO。下面是笔者列举的16个最为常见的SEO术语。1.6.1 网站分类目录网站分类目录是人为编辑的搜索结果,即将互联网上较为优秀的网站收集整理在一起,按照不同的分类或者主题放在相应的目录中,大多数目录依靠的是人为提交而不是蜘蛛。网站分类目录在互联网早期应用非常广泛,随着搜索引擎的发展,目前该应用发展迟缓。但这种网站模式在国内还是很受用户所喜爱,只是在中国,这种网站模式被称之为网址导航,比如hao123、2345网址导航、265网址导航等。1.6.2 关键词关键字、关键词和关键短语是Web站点在搜索引擎结果页面(Search Engine Results Page,也

33、称为SERP)上排序所依据的词。根据站点受众的不同,您可以选择一个词、多个词的组合或整个短语。为简化起见,本文将使用关键词这个术语表示这三种类型。1.6.3 链接场在SEO术语中,链接场是指一个充满链接的页面,这些链接其实没有实际作用,它们只作为链接存在,而没有任何实际的上下文。那些采用黑帽SEO方法的人利用链接场,在一个页面中增加大量链接,希望能通过这种方式使Google误认为这个页面很有链接价值。一个好的页面链接场,页面中充实的是和本页面最最相关的链接页面。因为传统的链接场会容易受到处罚,因此擅长黑帽SEO的人便将其利用到站群手法中,从近期所关注到的几个站群来看,这种效果很不错,只是一般这

34、种站群被曝光后,就离被处罚不远了。目前百度对这种手法还没有较好的解决措施。1.6.4 有机列表有机列表是 SERP 中的免费列表,即搜索引擎结果页面的免费列表,SEO人员通过对网站内部的结构优化、内容优化以及相关的外部操作来提升网页在该列表中的位置。相对于用户来讲,最为关注和信任的也是有机列表中所展现的内容,如图1-13所示。图1-13 百度的搜索页面结果页面免费列表1.6.5 PageRankPageRank是Google搜索引擎用来衡量网页重要性的一种方法,也是Google用来判断一个网站好坏的重要标准之一。PageRank目前被大量用于SEO人员的日常工作中,比如交换友情链接,分析竞争对

35、手等。一般影响PageRank最大的因素在于该网页是否拥有大量的高质量外链,当然,网站内链以及导出链接等因素也会影响到PageRank的值。1.6.6 付费列表顾名思义,付费列表就是只有在付费后才能列入搜索引擎的服务。根据搜索引擎的不同,每次点击(PPC)、赞助商链接(Sponsored Link)或者在搜索目标关键词和短语时网站出现的位置也不尽相同。付费列表在搜索引擎中又被称之为付费推广,如图1-14所示为百度付费推广示意图。图1-14 百度付费推广示意图1.6.7 排名排名是页面在目标关键词的搜索引擎结果页面( SERP) 中列出的位置,这里说的排名一般是指自然搜索排名,即不包含付费推广后

36、的排名结果。SEO 的目标是提高网页所包含目标关键词的排名。1.6.8 排名算法排名算法是搜索引擎用来对其索引中的列表进行评估和排名的规则。排名算法决定哪些结果是与特定查询相关的。大多数搜索引擎决定关键词排名的因素都超过100种以上,但最为重要的一些算法在各大搜索引擎都是通用的,例如标题是否包含关键词、关键词密度是否合理、内容质量以及外链质量是否很好等。正因为是涉及到排名的算法,所以并没有任何一个SEO人员能够全部知道这些搜索引擎的排名规则,即使是现有的一些算法,也是广大的SEO人员的经验总结,在一定的时期具有一定的参考性。1.6.9 搜索引擎营销搜索引擎营销(SEM)这个术语可以与SEO互换

37、使用,但SEM常常是指通过付费或者广告向搜索引擎展示站点,同时应用SEO技术。应用频率最高的是标题设计、描述设计以及整站规划等,大多数用户希望在付费推广的时候,同时也能在搜索引擎的自然搜索结果中拥有一个不错的展现效果。1.6.10 搜索引擎优化搜索引擎优化(SEO)就是根据对搜索引擎的算法规则来优化内容,从而使页面能够被搜索引擎信任,并获得较好的排名。对于任何一家网站来说,要想在网站推广中取得成功,搜索引擎优化是最为关键的一项任务。同时,随着搜索引擎不断变换它们的排名算法规则,每次算法上的改变都可能会让一些排名很好的网站在一夜之间名落孙山。失去排名的直接后果就是失去了网站固有的可观访问量。所以

38、每次搜索引擎算法的改变,都会在网站之中引起不小的骚动和焦虑。因此可以说,搜索引擎优化也成了一个越来越复杂的任务。1.6.11 搜索引擎结果页面搜索引擎结果页面(SERP)是为特定搜索显示的列表或结果。SERP有时候定义为搜索引擎结果的安排(placement)。本书中我将其称为页面而不是安排。在 SEO 领域中,在SERP中取得良好的表现就是一切。1.6.12 垃圾技术垃圾技术是一种欺诈性的SEO手段,它尝试欺骗蜘蛛(spider),并利用排名算法中的漏洞来影响针对目标关键词的排名。垃圾技术可以表现为多种形式,但是“垃圾技术”最简单的定义是Web站点用来伪装自己并影响排名的任何技术。根据是否采

39、用垃圾技术,SEO方法可分白帽SEO和黑帽SEO。1.6.13 黑帽SEO黑帽SEO是用垃圾技术欺骗搜索引擎,一般叫做SEO作弊。黑帽SEO以伪装、欺诈和窃取的方式骗取在 SERP 中的高排名,比如群发留言增加外链,关键词叠加,域名轰炸,转向新窗口链接等。随着搜索引擎的发展,黑帽SEO的做法越来越容易被搜索引擎所识别,从而受到严重的惩罚。虽然黑帽SEO见效较快,但一般不能持续多久,因为它有违搜索引擎以用户为中心的初衷。1.6.14 白帽SEO白帽SEO是以正当方式优化站点,使它更好地为用户服务并吸引爬行器的注意。在白帽SEO中,能够带来好的用户体验的任何东西也都被视为对SEO有益。通常好的SE

40、O人员会对网站的各个细节进行优化和设计,来展现出一个良好的被用户所喜欢的网站,因此也会被搜索引擎所喜爱。1.6.15 蜘蛛(爬行器)蜘蛛在Web上漫游,寻找要添加进搜索引擎索引中的列表。蜘蛛有时也称为爬行器或者机器人。针对有机列表优化页面也就是为了吸引蜘蛛的注意。蜘蛛,也称为蜘蛛程序(Spider)。网络蜘蛛是一个自动提取网页的程序,是搜索引擎的重要组成部分。作为蜘蛛来讲,就是尽可能多和快地给搜索引擎输送网页,实现强大的数据支持。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。1.6.16 权重网站权重是指网站与网站在搜索引擎眼中的分级制“待遇”表现,是搜索引擎中的一个综合表现指标。例如同一篇文章,在很多网站上都会列出,此时对于搜索引擎来说它不能单 独地去考虑把哪个网站的文章排在搜索的第一位或者是前几条,而是要根据网站 的权重来排名,哪个网站的权重高,搜索引擎就会把它放在搜索第一位或者是前 几条。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报