1、讲师:郝文荣,一、SEO是个什么鬼?,汉译为搜索引擎优化。 SEO是一种利用搜索引擎的搜索规则来提高目标网站在搜索引擎内的自然排名的技术。 简单理解: SEO是对网站的优化,使网站符合搜索引擎的喜好,从而给网站一个好的排名的技术。,SEO,认识搜索引擎,国内搜索引擎市场份额,本套教程以百度为研究对象,认识百度搜索结果页,万事不决问百度,网站建设,认识搜索结果页,认识搜索结果页,一、SEO是个什么鬼?,简而言之: SEO是一种通过搜索引擎给网站免费带来客户的技术。,SEO,为什么做SEO,搜索引擎客户转化率高,1,性价比高,2,长期有效,3,搜索引擎的用户是主动寻找网站上的产品,目的比较明确,转
2、化率高。,当站长掌握SEO技术时,SEO可以说是免费的。,SEO只要不作弊,排名一旦上去,可以维持相当长的时间,流量源源不断。,“58同城”收购“赶集”竟然是因为他!,陈晓华“SEO骨灰级高手”。2007年6月,陈晓华入职赶集网,负责SEO。用半年时间让赶集网的流量从10万提升到40万,远远超过58同城。这件事引起了姚劲波的注意,并下定决心要把陈晓华挖到58同城。 陈晓华到了58同城后采用人海战术,投入之前三四倍的人力,用8个月的时间将58同城的流量从20万突破到100万,这不仅拉大了58同城和赶集网的差距,还改变了58同城的地位58同城在此之前只能算是小网站,经过用SEO导入流量后,奠定了行
3、业领先地位。 如今,58同城成为国内生活分类网站的代表,用户每天上传的信息达数百万条,月独立用户数突破4亿。SEO给58同城带来了持续的业务和流量增长。 陈晓华(58同城CSO首席战略官),“58同城”和“赶集”不为人知的恩怨情仇,学SEO能做什么,个人站长,1,SEO培训,2,SEO服务,3,企业上班,4,,SEO培训非常火,潭州学院、达内、北大青鸟,都有专门的seo培训课程,成立个人工作室,为企业提供SEO服务,网络营销策划,从SEO专员做起,以陈晓华为偶像,以CSO为目标,如何做SEO,SEO,站内优化,站外优化,怎么做SEO站内优化,站内优化,七、404页面,怎么做SEO站外优化,站外
4、优化,外,链,质量,数量,SEOER常用工具-百度指数,探索关键词背后的秘密,网民的搜索意图,关键词的搜索指数,百度指数,太阳的后裔、宋仲基是什么时候火的,宋仲基、太阳的后裔到底有多火,宋仲基的需求图谱,如何利用宋仲基赚钱-推广化妆品,http:/ 如果用户看了标题,根本没有点击的欲望,那内容写的再好也是徒劳。,那些年我们曾被忽悠的标题,沙滩美女走光图,1,美女真的走光了,好好工作吧,别乱想了,那些年我们曾被忽悠的标题,实情:有对白头鹎(bi,一种鸟)在一居民楼阳台筑巢、生子、哺养,市民看到后,用相机拍下来了。,那对情侣在阳台做了什么?全程被房东偷拍,白头鹎居民家中筑巢,那些年我们曾被忽悠的标
5、题,实情:韩国女团最新的mv,韩女团禁播mv,韩女团最新mv,那些年我们曾被忽悠的标题,拿什么来唤醒你啊,我的爱人 沉睡的少女啊!痴心等待终遇有情郎! 一根纺针引发悲剧,痴情哥哥披荆斩棘唤醒妹妹 安然入睡的容顔,是百年不变的等待 百年不变的守候,只为你那淡定的一吻!,小结,看一个人漂不漂亮,要看她的脸,而看一个人的脸,最重要的是看她的眼睛。一篇软文好看不好看,首先我们看的就是标题,标题有没有吸引力,能不能抓住读者的眼球至关重要,标题没有吸引力,就没有点击率。所以标题的撰写是软文写作至关重要的一个环节,也是seoer必须具备的能力。,SEO的发展史,SEO的发展史:,SEO 1.0 大约是199
6、5-1998年,内容为王的时代;SEO 2.0 大约是1999-2010年,外链为皇的时代;SEO 3.0 大约是2011-?年,用户是上帝的时代;SEO 3.0S刚开始?,SEO 1.0,1995-1998年,排名依据是网站的内容匹配,搜索引擎蜘蛛识别能力较弱,是否有内容成了排名的主要因素之一。 排名的规则更加注重于页面关键词密度、title、keyword、description等因素。 这个时候无数站长都在疯狂大量的在页面里堆积关键词,光是meta keyword标签都要写上好几百关键词。 在SEO1.0时代更加注重的是网站的内容,认为内容相关度越高的页面就越应该靠前展示给用户。简而言之
7、就是SEO1.0时代,内容为王。出现的弊端,网站站长在页面大量重复堆积关键词,很多网站没有实际内容排名也不错,导致用户体验不好。,SEO 2.0,是1999-2010年,排名依据是站内优化,站外优化。 同时搜素结果的地区性差异,以及多媒体结果的出现(搜索结果中出现图片等结果)。 网站是否有高的权重,是否有高质量的内容成了排名的主要因素。 搜索引擎算法改进,页面的想要排名靠前更加注重内链结构以及高质量外部链接的导入。 所以这个时候的站长每天都忙碌着发外链、发外链、发外链,甚至有些公司在招聘SEO人员的时候,都只是叫做外链专员,他们认为只要外链做好了,SEO也就成功了。 虽然这种观点是错误的,可是
8、也在某种程度反映出SEO2.0时代的特点 从搜索引擎的角度出发,在SEO2.0时代,以链接投票的方式,通过获得票数的多少来决定页面排名顺序。 SEO2.0时代,外链为皇。,SEO 3.0,是2011-至今, 是否满足用户的需求, 是否有高的权重, 是否有好的内容 成了排名的主要因素。 产品设计优化、用户满意度优化、资源整合优化在此阶段显得尤为重要。 SEO的英文定义也可从Search Engine Optimization演变为Searcher Experience 【ksprins】 Optimization,中文翻译为搜索体验优化。搜索引擎越来越人性化,搜索引擎考虑的是为搜索者提供高质量的
9、用户体验。,什么是搜索引擎?,官方定义: 搜索引擎是指:根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 我的理解是: 可以帮助用户从互联网繁杂的信息中找到他需要的信息的工具。,搜索引擎的工作原理,百度在很短的时间0.04秒内找到了49,100,000个结果 我们复制一下关键词重新搜索发现这回只用了0.001秒。 它是怎么做到的?,它是怎么做到的?,1、是百度在0.04秒的时间内从互联网中抓去了所有的内容? 2、是百度提前就已经抓好了内容,然后从自己的数据库中调去的? 答案: 搜索引擎平时就已经开始在互
10、联网中抓取网页信息并建立自己的网页数据库。当网民搜索的时候,百度会直接从数据库中调去数据经过处理后呈现在网民面前。 注意:为什么第二次用的时间只有0.001秒比第一次还快? 答:百度在处理网民搜索信息时,先从本地浏览器缓存中寻找网民以前是否搜索过相关信息,如果有就从缓存中调取,如果没有再从百度数据库中调去。,搜索引擎的工作三阶段,搜索引擎的工作过程分三个阶段:第一阶段:爬行和抓取第二阶段:预处理第三阶段:排名,阶段一:爬行和抓取,爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。 1、蜘蛛 搜索引擎用来爬行和访问页面的承训被称为蜘蛛(spider)或机器人(bot) 搜索引擎蜘蛛访问网站页面
11、时类似于普通用户使用的浏览器。蜘蛛发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取的速度,都使用多个蜘蛛并发分布爬行。,阶段二:预处理,搜索引擎蜘蛛抓取的原始页面,并不能直接用户查询排名处理,因为搜索引擎数据库中的页面数都是数万亿级别以上的,用户输入搜索词后,靠排名程序立即对这么多页面进行分析排序工作量太大,不可能在一两秒内返回排名结果。因此抓取过来的页面必须经过预处理,为最后查询排名做准备。 在索引之前有五个工作需要做(1)提取文字;(2)中文分词;(3)去停止词;(4)去除噪声;(5)去重(读chong),(1)提取文字: 蜘蛛
12、抓取的是全部HTML代码,这里面其实包含:文字,HTML格式标签,javascript程序! 但是HTML格式标签、javascript程序是无法参与到排名内容中来的,提取文字的过程就是从HTML代码中取出标签和程序提取出可以用于排名处理的页面文字内容!注意:搜索引擎除了提取出可见的文字外,还可以提出以下不可见的文字内容;比如:METa标签中的文字内容,图片 ALT属性文字,链接锚文字等!,(2)中文分词 英文:单词之间有空格作为天然分隔,因此不需要进行切词。 中文:字和字没有之间没有分隔符,一个句子中的词都是连在一起的!所以,这时候搜索引擎就必须先分辨一下哪几个字组成一个词,哪几个字本身就是
13、一个词! 比如:“波司登羽绒服”就将其分为“波司登”和“羽绒服”两个词;,(3)去停止词 什么是停止词?就是在页面中出现次数比较多的,对内容没有实质性影响的那些词;比如:“的”,“得”“地”这些助词,“啊”“哈”“呀”等感叹词,“从而”“以”“却”等副词或者介词,这些词就被称之为停止词!英文里有:the,a,an,to,of等等 搜索引擎去停止词主要有两个目的: 一个是:使索引数据主题更为突出,减少无谓的计算量; 另一个是:检测你的网站内容是否和数据库中其他的内容大量的重复。 在这里需要提醒各位的是:以后不要随便在网上复制一篇文章加上几个停止词就粘到自己的网站上去了,学完上边的,你应该懂什么意
14、思了!,(4)去除噪声: 绝大部分页面上有一部分内容对页面主题没有任何贡献,比如版权声明文字、导航条、广告等。这些区块都属于噪声,对于页面主题只能起到分散作用。 搜索引擎需要识别并消除这些噪声,排名是不使用噪声内容。消噪的方法是根据HTML标签对页面分块,区分出页头、导航、正文、页脚、广告等区域,在网站上大量重复出现的区块往往属于噪声。对页面进行消噪后,剩下的才是页面的主体内容。,(5)去重(chong) 一篇同样的文章出现在不同的网站上,搜索引擎就会认为它是一个文件,它并不喜欢这样的重复内容,在进行索引之前就需要对这些内容进行识别和删除重复的内容,就叫“去重”! 搜索引擎如何去重!技术我们不
15、需要掌握,但是我们得注意几个关键点: A:简单的增加“的”“地”“得”,是很容易的被识别的,一定要慎重使用! B:复制别人的文章,简单的交换一下段落结构!这种伪原创也一定要慎重使用! 这是因为:这样的操作无法改变文章的特定关键词,上面的那些做法始终逃不过搜索引擎的去重算法。,经过上面的五个步骤后,搜索引擎就能得到独特的,能反映页面主要内容的,以词为单位的内容。 把每一个网站页面都转化为一个关键词组成的集合!同时记录下每一个关键词在该页面上出现的频率、次数、格式(比如:标题标签、黑体、H标签、锚文本等)位置(第几段),这些都已权重的形式记录在下来!然后放到一个地方,这个地方就是专门放置这些组合词
16、的词表结构索引库! (6)正向索引: 每一个文件夹都对应一个ID,文件内容被表示为一串关键词的集合!这样的数据结构叫正向索引!,倒排索引,(7)倒排索引 在倒排索引中关键词变成了主键,每个关键词对应一系列文件,每一个文件都出现了要搜索的关键词,这样用户在搜索某一个关键词的的时候,排序程序就能在倒排列表中找到这个关键词对应的文件! 详细请看图: 关键词,排名,初始子集确定后需要对子集中的页面内容进行相关性计算,链接权重计算、用户点击行为计算,从而确定页面的排名。 影响排名的因素主要有以下几个方面一、页面内容相关性 二、链接权重 三、用户行为,一、页面相关性 是指页面内容与用户所查询的关键词在意义
17、上的接近程度,主要由关键词匹配度、关键词密度、关键词分布及关键词的权重标签等决定。 (1)关键词匹配度关键词匹配度是指页面中的内容与用户所查询的关键词之间的匹配程度,主要由两个因素决定: 页面内容中是否包含关键词。 关键词在页面中出现了多少次,即页面中有多少个关键词。,(2)关键词密度 为了有效防止网站所有者恶意操控搜索结果,搜索引擎根据关键词词频与网页总词汇量的比例(即关键词密度值)来衡量页面中某关键词的词频是否合理。 (3)关键词分布 关键词分布即关键词在页面中出现的位置。关键词在页面中不同位置上出现会对页面的相关性带来一定的影响。 左上-右上-左-右-左下-右下 关键词从左向右相关性一次
18、递减,(4)关键词的权重标签 在网页,网页制作者利用不同的HTML标签使页面中相关的内容实现不同的视觉效果(如字体的样式、字号、颜色等),灵活地运用各种HTML标签还有助于提高页面相关性。 在页面权重分配里,按照标签在作用,可以把HTML标签分为“权重标签”与“非权重标签”两大类。权重标签是指会影响页面权重的标签,常见的权重标签包括、等;而非权重标签常见的有、等。 假设下表中是搜索引擎对某些标签权重值的定义,则对于一个内容是“搜索引擎优化”的页面,针对“搜索引擎优化”这个关键词,标签权重值= 标签权重值+标签权重值,即60。,页面相关性总结:页面相关性=关键词匹配值+关键词密度值+关键词分布值
19、+标签权重值,二、链接权重链接主要分为内部链接和外部链接两种某一页面得到的链接越多,从一定程度上反映了该页面越重要,链接权重值就越高。 绝大部分网页都会有一个“入度”与“出度”,根据网页的入度数量及提供入度的页面权重值来计算页面链接的权重(导入链接的数量和导入链接的质量) 导入链接的质量:取决于源页面(链接所在的页面)的权重,假设图是页面之间的关系图,其中V1、V2、V3为网页,箭头方向代表页面贡献链接或从其他页面中得到的链接。以网页V2为例,V2对V1、V3各贡献了一个链接,而得到了V1的链接。,三、用户行为搜索引擎在完成页面基本权重计算以后,就可以向用户展示初步的排序结果。但这个排序结果不
20、一定能让大部分用户满意,因此还要结合其他因素对该排序结果进行改进。 用户对搜索结果的点击行为是衡量页面相关性的因素之一,是完善排序结果、提高排序结果质量的重要补充,属于外部不可操控因素。 用户对搜索结果的点击(点击率) 用户在网站上的停留时间(平均停留时间) 用户在网站浏览的页面的数量(平均访问页面数) 网站的跳出率(只访问了一个页面就离开的访客占总访客的比值。)跳出率越低越好。小于80%,页面排序总结: 综上所述,搜索引擎通过计算页面相关性、链接权重值及用户行为等方面的得分,得到页面的总权重值;然后,再按照页面的总权重值从高到低进行排序,并把这个经过排序的列表返回给用户,即:页面权重值=页面
21、相关性值+链接权重值+用户行为得分,5.排名过滤以及调整 排名过滤主要是针对于那些靠作弊手段,有作弊嫌疑的网站进行调整!虽然按照前面的工作最后就算出来的这些网站权重和相关性非常的高,但是搜索引擎在最后一步也会把这些网站给过滤掉的!6. 排名显示的效果 主要显示的是:原始页面的标题标签,说明标签,等数据! 注意:有的网站是搜索引擎需要调用动态生成的页面摘要,而不是调用页面本身的说明!,7 搜索引擎缓存的作用: 搜索引擎会把用户经常搜索的一些词记录下来,会把这些搜索过排名记录储存在搜索引擎的缓存当中,当由用户再一次搜索这个词的时候,搜索引擎会直接调用缓存中的内容!这样缩短了搜索反映时间,大大提高了排名效率!,