1、野狼技术-优优 2012年5月22日,http:/,野狼工作室三钻淘宝店,目录,2、搜索引擎搜索原理 搜索引擎与目录 搜索引擎面临的困境 搜索结果展示格式 搜索原理与蜘蛛程序 链接原理 用户浏览习惯 高级搜索指令,1、SEO简介 什么是SEO? SEO产生的背景和未来 为什么做SEO?,3、竞争研究与关键词 为什么研究关键词? 关键词选择 关键词竞争程度分析 核心关键词和长尾词 三类关键词 预估流量与价值 快速网站诊断,4、网站结构优化 友好的网站设计 避免蜘蛛陷阱 物理结构与链接结构 清晰导航 Robots文件 网址规范 内部链接与权重分配,5、页面优化 页面标题 文档结构 描述标签和关键
2、词标签 正文中的关键词 H标签和ALT、精简代码 锚点与导出链接 W3C验证标准黑体与斜体,6、外部链接建设 外部链接意义 链接分析技术 什么链是好链? 链接查询 外部链接原则 链接诱饵,7、业务运营分析 运营分析 编辑业务 网络推广 技术开发,8、工具和术语 工具 术语,1、SEO简介,什么是SEO?,Search Engine Optimization 简称:SEO 。中文:搜索引擎优化。,SEO产生的背景和未来,堆,搜,推,SEO诞生,WEB1.0,WEB2.0,为什么要做SEO?,JSP,ASP,PHP,等服务器端脚本的使用,,互联网发展历程,1,信息检索习惯。 2,希望被人看。 3,
3、互联网营销配合SEM。 4,掠取用户。 5,竞争胜出。,2,搜索引擎搜索原理,搜索引擎与目录,真正的搜索引擎指的是由蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库中挑选出符合搜索关键词要求的页面。蜘蛛的爬行、页面的收录以及排序都是自动处理。,网站目录则是一套人工编辑的信息分类,区别,搜索引擎和目录两者各有优劣,搜索引擎,网站目录,2,搜索引擎搜索原理,搜索引擎面临的困境,页面抓取需要快而全面,海量数据存储,索引处理快速有效,具可扩展性,链接关系的计算、正向索引、倒排索引等,查询处理快速准确,判断用户意图以及人工智能,比如搜索
4、“苹果”,用户到底是想了解苹果这个水果?还是苹果电脑?还是电影苹果的信息?没有上下文,没有对用户个人搜索习惯的了解,就完全无从判断。,搜索引擎目前正在致力于基于用户搜索习惯及历史数据的了解上,判断搜索意图,返回更相关的结果的研究。,2,搜索引擎搜索原理,主流搜索引擎和结果展示,各方群雄共挣天下,每个人都有自己的一招,最新数据,百度已突破85%市场占有率,2,搜索引擎搜索原理,主流搜索引擎和结果展示,搜索结果显示格式,凤巢,传统竞价,2009年4月20日, 全球最大的中文搜索引擎百度正式推出搜索推广专业版, 即此前受到业界广泛关注的“凤巢”推广系统。 2009年12月1日, 百度按照原定计划全面
5、启用搜索营销专业版(即凤巢系统), 凤巢将全面接管百度所有的推广位置,而原有的搜索营销经典版(即竞价排名)将从此告别历史舞台。 百度方面表示,搜索营销专业版作为新一代搜索推广管理平台, 能够帮助企业捕获更多商业机会,赢得更多客户,并有效提升推广效果。,2,搜索引擎搜索原理,主流搜索引擎和结果展示,个性展示尝试,经典搜索结果列表,整合搜索结果,缩进列表(Indented Listing),全站链接(Sitelinks),迷你全站链接(Mini Sitelinks),One-box,富摘要(Rich Snippet),面包屑导航,说明文字中的链接,2,搜索引擎搜索原理,搜索原理与蜘蛛程序,搜索引擎
6、的工作过程大体上可以分成三个阶段:1) 爬行和抓取 搜索引擎蜘蛛通过跟踪链接访问网页,获得页面 HTML 代码存入数据库。2) 预处理 索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。3) 排名 用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。,常见蜘蛛,搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot),2,搜索引擎搜索原理,搜索原理与蜘蛛程序,跟踪链接,最简单的爬行遍历策略分为两种: 一是深度优先,二是广度优先,深度优先,广度优先,吸引蜘蛛,虽然理论上蜘蛛能爬行和抓取所有页面,但实际上不能
7、也不会这么做。SEO 人员要想自己的更多页面被收录,就要想方设法吸引蜘蛛来抓取。既然不能抓取所有页面,蜘蛛所要做的就是尽量抓取重要页面。哪些页面被认为比较重要呢?有几方面影响因素: 网站和页面权重。质量高、资格老的网站被认为权重比较高,这种网站上的页面被爬行的深度也会比较高,所以会有更多内页被收录。页面更新度。蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样,说明页面没有更新,蜘蛛也就没有必要经常抓取。如果页面内容经常更新,蜘蛛就会更加频繁地访问这种页面,页面上出现的新链接,也自然会被蜘蛛更快跟踪,抓取新页面。导入链接。无论是外部链接还是同一个网站的内部链接,要
8、被蜘蛛抓取就必须有导入链接进入页面,否则蜘蛛根本没有机会知道页面的存在。高质量的导入链接也经常使页面上的导出链接被爬行深度增加。与首页点击距离。一般来说网站上权重最高的是首页,大部分外部链接是指向首页,蜘蛛访问最频繁的也是首页。离首页点击距离越近,页面权重越高,被蜘蛛爬行的机会也越大。,3,竞争研究与关键词,搜索原理与蜘蛛程序,排名,搜索词处理,文件匹配,初始子集的选择,相关性计算,排名过滤及调整,排名显示,搜索缓存,Google PR,PR 值计算公式是: PR(A) = (1-d) + d(PR(t1)/C(t1) + . +PR(tn)/C(tn) A 代表页面A PR(A)则代表页面A
9、 的PR 值 d 为阻尼指数。通常认为d=0.85 t1.tn 代表链接向页面A 的页面t1 到tn C 代表页面上的导出链接数目。C(t1)即为页面t1 上的导出链接数目,2,搜索引擎搜索原理,搜索原理与蜘蛛程序,用户怎样浏览和点击搜索结果,页面浏览最主要的研究方法是视线跟踪(eye-tracking),使用特殊的设备跟踪用户目光在结果页面上的浏览及点击数据。 就是专门做这方面实验及统计的公司。2005 年初, 联合 和did- 两家公司进行了一次很著名的视线跟踪实验,实验数据于2005 年6 月发表,提出在SEO 业界很有名的金三角图像,也有人称为F 型浏览图像。,2,搜索引擎搜索原理,搜
10、索原理与蜘蛛程序,搜索引擎命令,搜索词放在双引号中,减号 -,星号 *,inurl:,inanchor:,intitle:,如 :intitle:搜索引擎优化,allintitle:,filetype:,site:,linkdomain:,related:,综合使用高级搜索指令,inurl: inurl:links,allinurl:+links,linkdomain:dunsh.org -linkdomain:,3,竞争研究与关键词,为什么研究关键词(意义),确保目标有人搜索,不能想当然。 达到一定数量级,降低优化难度,过热词难度大,如“新闻”,“律师”,“服务”,寻找有效浏量,搜索多样性,
11、发现新机会,“律师”、“北京律师”、“北京刑事律师”,思维局限性 和头脑风暴,3,竞争研究与关键词,关键词选择原则,内容相关,搜索次数多 竞争小,主关键词不可太宽泛,商业价值,主关键词也不可太特殊,“特效减肥茶”与“刘德华”,需要参考大量数据来参考,“购物”与第八奇迹,律师、北京律师、北京刑事律师、 北京新街口律师,“液晶电视原理”、“液晶电视图片”、 “液晶电视价格”、“液晶电视打折”、 “液晶电视促销”,3,竞争研究与关键词,关键词竞争程度分析(Pass),搜索结果数,Intitle结果数,竞价结果数,竞争对手情况,竞价价格,页内排名数量,现在竞价费用是这个表中的10倍以上,3,竞争研究与
12、关键词,核心关键词,选择关键词的第一步就选择网站的核心关键词,头脑风暴,同事、朋友,词被搜索的次数,竞争对手,工具,确定关键词的途径:,引擎的搜索建议,引擎的相关搜索,3,竞争研究与关键词,核心关键词,风暴准则,http:/,你的网站能为用户解决什么问题? 用户遇到这些问题会搜索什么关键字? 如果你自己是用户,寻找这些问题你会怎么搜索? 用户在寻找你的产品时,会搜索什么词?,3,竞争研究与关键词,长尾词,长尾理论,长尾理论是著名的连线杂志主编在2004年开始在连线杂志发表的系列文章,以及后来出版的长尾这本书中具体阐述的。 CA得出这个长尾理论是基于研究亚马逊书店、搜索引擎Google,以及网上
13、录像带出租网站Netflix等的消费数据。简单地说, 长尾理论指的是当商品储存、流通,展示的场地和渠道足够宽广,商品生产成本急剧下降,以至于个人都可以进行生产, 并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖都会有人买。 这些需求和销量不高的产品加起来所达到的总销售额可以和热门产品的销售额不相上下,有时候甚至比热门产品的销售额更大。,头,种类不多 销量很大 尾,销量不大 种类很多,3,竞争研究与关键词,长尾词,搜索长尾词,在SEO领域 较长的 、比较具体的、 搜索次数不多的词 都称为长尾词,如何选定长尾词?,3,竞争研究与关键词,三类关键词,导航类关键词,交易类关键词,
14、信息类关键词,“QQ登陆” “京东官方网站” “支付宝帮助中心”,“电视机网上购买” “Dell电脑价格” “索爱手机打折”,“苹果电脑怎么样?” “在线支付流程” “诺基亚手机图片”,3,竞争研究与关键词,预估流量与价值(pass),确定目标排名,预估流量,预估搜索流量价值,3,竞争研究与关键词,网站快速设置(pass),管理员工具,Robots文件检测,首选域设置,http:/ 参考标准,来看一个现实的案例,,4,网站结构优化,避免蜘蛛陷阱,FLASH,Session ID,各种专跳,注意因素,框架结构,动态URL,JAVASCRIPT 链接,要求登录,强制使用Cookies,4,网站结构
15、优化,物理及链接结构,扁平式。适合小站 页面权重高,树形式。适合大站 逻辑清晰 好维护,物理结构,链接结构,H为网站首页,C1和C2是分类首页,p1和p2是分类C1下产品页面, P3、P4、是分类C2下产品,首页链接向所有分类首页 (2) 首页一般不直接链向产品页面,除了几个需要特殊推广的产品,如P3. (3) 所有分类首页链向其他分类首页,一般以网站导航形式体现。 (4) 分类首页都链向网站首页。 (5) 分类首页链向本分类下产品页面 (6) 分类首页一般不链接向其他分类的产品页面 (7) 产品页都链向所有分类首页,一般以网站导航形式出现。 (8) 产品页面都链向网站首页,一般以网站导航形式
16、出现。 (9) 产品页面可以链向同一个分类的其他产品页面。 (10) 产品页面一般不链接向其他分类的产品页面。 (11) 在某些情况下,产品页面可以用适当的关键词链接向其他分类的产品页,如P2链接向 P3,4,网站结构优化,清晰导航,尽量采用文字导航,点击距离及扁平化,参考因素,锚点包含关键字,面包屑导航,避免页脚推挤,现在在哪里?将要去何处?,4,网站结构优化,禁止收录和网址规范,Robots.txt文件,禁止收录机制,NoFollow 的使用,URL规范优化参考标准,静态化的必要性探讨,URL越短越好,避免太多参数,目录层次尽量少,URL具有描述性,URL中包含关键词,连词符使用,目录形式
17、还是文件形式,4,网站结构优化,内部链接及权重分配(pass),重点内页,非必要页,链接及权重要论述的问题,大二级分类,翻页过多,单一入口还是多入口,相关产品链接,锚点文字分布及变化,深层次分类,分类隔离,5,页面优化,文档结构与页面标题优化,独特不重复,准确相关,标题的优化应该注意的几点,字数限制,简练通顺 不要堆砌,关键词出现在最前面,吸引点击,组合三两个关键词,公司或者品牌名称,连词符使用,例:索尼数码相机-手机数码-XX商城,一般要小于32个中文,反例:Untitled document,标题党,不要使用没有意义的词,反例:“顾客是我们的上帝” “公司欢迎您”,Noodp标签使用,文档
18、基本结构,5,页面优化,文档关键词标签和说明标签,关键词,说明,针对内容设置关键词,简明有用 语义通顺,5,页面优化,正文中的关键词,词频和密度,前50100个词,关键词变化形式,关键词组邻近度,词组的拆分出现,语义分析,分类页面说明文字,3-6次,“第八奇迹特产促销” “第八奇迹特产” “特产促销”,Work, worker,workers,“SEO方法” “SEO” “方法”,第一段第一句,“课程” 相关语义“讲义,学生,理论,实践,方法”,分类页设置难度大,设置正文关键词注意的细节,5,页面优化,H标签、ALT 和精简代码,H标签 H1H6 的权重分配,ALT 文字,精简代码,H标签在显
19、示上通常是黑体,但其语义与黑体完全不同,不要在页面 上滥用,一般情况下一个页面H1只出现一次。 Eg: 新疆葡萄干,尽量符合W3C标准,尽量不要使用嵌,套特别是Table嵌套,Css样式独立 文件化,先引入样式 后引入脚本,页面执行脚本放在页面的最下面。尽量 疏剪外部文件,去掉不比较的注释。,5,页面优化,锚点文字与导出链接,锚点文字,导出链接,黑体斜体,锚文字是告诉搜索引擎去向的主要依据之一。锚文字不能集中出现在导航 或者页脚中,应该分布在正文段落中。,导入到本站链接,提高网站的关联度。导入到权威站点的链接,提高网站权重。,起到粘合词 和增加关键词权重的作用,单不要滥用,沙盒效应,奖与罚。资
20、格。页面抄袭和重复会造到惩罚,新站很少更新会被扔入沙盒。原创会得到奖赏,增加权重和排名。,6,外部链接建设,外部链接建设的意义,相关性,权重及信任度,收录,孤岛存在的站点好无意义,如果 央视、华尔街日报的网站上有你的链接 那么即使你是一个新站 你的权重也会迅速攀升,没有收录 就不会被搜索到 更谈不上排名。而外部链接能够增加搜索 引擎对你的网站的收录。,一个最有名的Google炸弹 说明外部链接的重要性,6,外部链接建设,链接分析技术(pass),链接分析技术是一个十分复杂的累积比较计算的过程,需要参考的数据也很多 。链接分析主要从下面几个方面着手。,反向连接的数目。 反向连接页面本身的重要性。
21、 反向连接增加的速度。 反向链接所有网站的内容来源。 反向连接所在页的内容是否相关。 反向链接的文字。 反向连接锚文字前后临近的文字。 连接在页面的位置。 外部连接所在的域名历史 外部连接的域名是否被转手 反向链接所在页第一次被收录的日期。 反向连接所在页内容是否发生变化。 用户点击后在目标网站停留多长时间。,6,外部链接建设,什么链接是好链接?,好的外部链接应该具有哪些条件,1点击流量,2.单向链接最好的外部链接是对方站长主动急于的单项链接,不需要链接回去。两个网站互相交换链接,如友情链接,权重要比单向链接低得多。3.自发及编辑好的链接是对方站长资源自发提供的,而且通常是站长的编辑行为,也就
22、是说在文章中提到某个概念时,认为你的页面是最好、最权威的,所以链接到你的页面。这种有编辑意义的链接才是真正意义上的投票。4.内容相关性寻找外链来源时,内容相关性非常重要。5.锚文字锚文字中出现目标关键词是最好的外部链接,在搜索引擎排名算法中有很大比重。但锚文字也不能过于集中。否则刻意优化的痕迹太明显,往往会导致惩罚。所以在很能的情况下,来自重要页面的链接尽量使用目标关键词做锚文字。权重不太高的页面,适当混合各种各样的锚文字,6,外部链接建设,什么链接是好链接?,好的外部链接应该具有哪些条件,6.链接位置页脚、左侧或右侧导航中的广告部分是最常见的买卖链接和交换链接的位置。搜索引擎通过对页面分块,
23、可以鉴别出这些位置的链接,降低其投票权重。最好的外部链接出现在正文中,因为只有在正文中是罪有可能带编辑意义的自发链接。7.域名权重及排名发出链接的域名注册时间、PR值及网站首页目标关键词排名如何,都直接影响链接的效果。8.页面权重及排名除了整体权重和排名,发出链接的页面权重及排名能力也是需要注意的地方。9.导出的链接数目页面上到处链接越多,每个链接所能分得的权重就越少。10.页面更新及快照,如果页面在搜索结果中的快照狠心,说明页面经常被搜索引擎蜘蛛重新抓取。加入这样的链接能很快被搜索蜘蛛检测到。,6,外部链接建设,什么链接是好链接?,好的外部链接应该具有哪些条件,11.网站整体健康情况网站首页
24、PR值?主要分类页面是否获得相应的比首页第一级得pr值?是否被开放目录、雅虎等收录?网站规模?主要关键词及长尾关键词排名情况?是否被惩罚的迹象?12.来自好邻居交换链接时把垃圾网站、色情、赌博等违法内容网站排除在外。13.来自edu,org等域名edu、org域名的权重之所以比普通域名的权重高主要是因为这类网站上垃圾内容比较少,这些网站由于与其他政府、教育、科研机构有关系,本身获得高质量外部链接的机会比商业网站高得多。所以得到edu,org域名的链接对自身的排非常有好处,6,外部链接建设,反向链接查询指令,link: link:-site:,linkdomain: -site:,domain:
25、 -site:,domain:,6,外部链接建设,外部链接原则(pass),难度越大 价值越高,内容是根本 内容为王 链接为后,内容相关性 关注同行评论,链接来源广泛,深度链接,锚文字分散自然,平稳持续增加,质量高于数量,6,外部链接建设,链接诱饵,新闻诱饵资源型链接诱饵争议性话题线上工具插件利益吸引幽默搞笑,7,业务运营分析,SEO相关,运营分析,转化率=订单提交成功数/访问次数。,到达率=到达单品页的访问次数/所有访问次数,提袋率=放入购物车的次数/到达单品页的访问次数。结算率=订单成功提交的次数/放入购物车的次数。订单转化率=到达率x提袋率x结算率。,简易算法,编辑业务,推广业务,技术开发,站内关联度,8,工具和术语,请您启用搜索引擎!,结束,谢谢!,