收藏 分享(赏)

搜索下拉框的采集方法.ppt

上传人:HR专家 文档编号:6066183 上传时间:2019-03-26 格式:PPT 页数:13 大小:1.81MB
下载 相关 举报
搜索下拉框的采集方法.ppt_第1页
第1页 / 共13页
搜索下拉框的采集方法.ppt_第2页
第2页 / 共13页
搜索下拉框的采集方法.ppt_第3页
第3页 / 共13页
搜索下拉框的采集方法.ppt_第4页
第4页 / 共13页
搜索下拉框的采集方法.ppt_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、,搜索下拉框的采集方法,电商二部 张浩玉,第1页,目 录,第2页,Excellent Solution And Euipment For Mine,1.在网页中找到真实网址,第3页,Excellent Solution And Euipment For Mine,通常采集关键词的办法是直接对要采集的部分审查元素或者查看源代码找到对应部分前后唯一的代码进行前后截取。但是经过试验这种办法并不适用于必应和阿里巴巴的搜索下拉框。我们要做的就是找到下拉框部分存在的真实网址,下面介绍两种方法,如果大家在使用过程中发现任何不对的地方,请及时提出,以免影响大家的工作,谢谢!,第4页,Excellent Sol

2、ution And Euipment For Mine,首先介绍第一种,找到打开必应浏览器,在搜索框中搜索一个产品词汇,比如:rod mill,点击搜索,出现如下界面,注意:使用时先不要将下拉框点击出来,也就是不要点击rod mill后边的空白部分。,1.在网页中找到真实网址,第5页,Excellent Solution And Euipment For Mine,接着按F12,找到其中的Network(从左往右数第四个):,1.在网页中找到真实网址,第6页,Excellent Solution And Euipment For Mine,1.在网页中找到真实网址,这时候需要点击rod mil

3、l后边的空白部分,使其出现下拉框,也就是我们需要采集的部分,这时候我们会看到,在下方会出现一个http:/ Solution And Euipment For Mine,1.在网页中找到真实网址,点击http:/ Solution And Euipment For Mine,1.在网页中找到真实网址,下面找几种不同的产品查找网址中的规律,方便批量采集 rod mill http:/ jaw crusherhttp:/ “bq=” “qry=” 以及后边的编码部分 首先我像往常一样,删除后边的编码部分,可是这时候发现页面会没有内容,所以后边的部分,先不删除,而且经过测试,不同的产品后边使用相同的

4、编码都能出现下拉框中的词,所以这一部分可以现在看来是可以通用的,大家如果出现问题,请及时提出哦 网址测试的经过就不一一列举了,总之经过反复测试:我们只需更改 “qry=“后边的单词(如果大家发现更好更简单的办法请及时提出来哦)便能得到我们想要的结果。接着就是合成网址,下面的步骤跟一般的采集方法就是一样的了,找到唯一的标签。,第9页,Excellent Solution And Euipment For Mine,2.Fiddler,下面是安利阶段:Fidder Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fi

5、ddler的数据(指cookie,html,js,css等文件,这些都可以让你胡乱修改的意思)。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了一个用户友好的格式。下面是使用这个软件找到真实网址的方法: (1)使这个软件处于零状态,关闭左下角capturing功能,单击即可。,第10页,Excellent Solution And Euipment For Mine,2.Fiddler,(2)以阿里巴巴为例子,打开阿里巴巴网站,搜索一个产品,比如 jaw crusher,这时候在此点击左下角的位置,使其开始工作,然后点击jaw crusher 后边的空白部

6、分,使其出现下拉框,这时候fidder会抓取数据,出现下图:,第11页,Excellent Solution And Euipment For Mine,2.Fiddler,(3)这时候我们会看到,第一个网址中,出现了keywords字样,点击这个网址,点击右边Inspectors中的Raw,我们可以看到首行出现一个网址,也就是GET后边的网址,第12页,Excellent Solution And Euipment For Mine,2.Fiddler,(4)打开这个网址,我们会看到一页代码,我们想要的关键词就在他们中间,找下拉框中的词进行搜索,我们可以发现他们是由唯一的标签进行包裹的。接着就是关于批量采集,经测试,我们只需要换掉,http:/ 这个网站中,keyword后边的单词即可(大家发现不对的地方请及时提出啊。我这是自己总结的,可能测试不到位,大家谅解,谢谢大家!),最后就是合成网址的过程,与一般的采集方式是一样的。PS:此软件也适用于必应。,第13页,Excellent Solution And Euipment For Mine,以上都是我自己总结的,不是正规教程,可能出现BUG,至于采集的方法,我也经过了多次测试,如果大家发现有不对的地方请及时提出来,以免影响 大家的正常工作!谢谢大家!如果有不懂的地方或者建议请及时联系我哦!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报