1、 八爪鱼云采集网络爬虫软件八爪鱼产品使用手册目录1 关于八爪鱼 .12 Cookie (更多内容详见 Cookie 视频) .12.1 Cookie 诞生 .12.2 Cookie 概述 .12.3 Cookie 工作原理 .13 Xpath、Html .23.1 Xpath、Html 概念 .23.2 Html 结构 .23.3 Html 标签、元素、节点 .33.4 Html 常见标签 .33.5 Html 常见属性 .43.6 Xml、Xpath、Html 关系和区别 .44 常见问题 .55 常见软件操作教程 .6八爪鱼云采集网络爬虫软件5.1 采集单个网页 .75.2 采集单个列表页
2、面 .75.3 单网页表格信息采集 .75.4 采集单网页列表详细信息 .75.5 采集分页列表 .75.6 采集分页列表详细信息 .75.7 采集分页列表+ajax 延时设置 .75.8 单个文本输入及各种登录方式采集 .75.9 Cookie 登录 .75.10 文本循环输入 .75.11 循环切换下拉框 .75.12 xpath 入门 1 .75.13 xpath 入门 2 .75.14 一二页重复循环采集 .7关于八爪鱼八爪鱼大数据,通过自主创新研发,以分布式云平台架构为产品核心,帮助客户通过在极短的时间内,通过简单操作即可获取想要的数据,并以结构八爪鱼云采集网络爬虫软件化数据展示,为
3、企业数据挖掘与数据分析提供基础数据源。于 2015 年 1 月,获得国家重点软件企业上市公司“拓尔思”投资。Cookie (更多内容详见 Cookie 视频)Cookie 诞生当某个用户打开浏览器发出页面请求时,web 服务器只是进行简单相应,然后就关闭与该用户的连接。所以当用户每发起一个打开网页请求到 web 服务器的时候,无论是否是第一次打开同一个网页,web 服务器都会把这个请求当作第一次来对待,那这样的缺陷可想而知,比如每次打开登录页面的时候都需要输入用户名、密码。为了弥补这个缺陷,Cookie 应运而生。Cookie 概述Cookie 就是服务器暂时存放在你计算机上的一笔资料,好让服
4、务器来辨认你的计算机。当你在浏览网站的时候,web 服务器会先送出小小资料放在你的计算机上,cookie 会帮你在网站上所打的文字(如用户名、密码)和其他一些操作都记录下来。当下次你再打开同一个网站。web 服务器会先看看有没有它上次留下的 cookie 资料,有的话就会依据 cookie 的内容来判断使用者,送出特定的网页内容给你。八爪鱼云采集网络爬虫软件Cookie 工作原理Xpath、HtmlXpath、Html 概念Xpath:是一种路径查询语言,简单的说就是利用一个路径表达式找到我们需要的数据位置。 Html:超文本标记语言,是用来描述网页的一种语言。主要用于控制数据的显示和外观。H
5、TML 文档也被称为网页。八爪鱼云采集网络爬虫软件Xpath 专用于 xml 中沿着路径查找数据用的,但是八爪鱼采集器内部有一套针对 Html 的 Xpath 引擎,使得直接用 Xpath 就能精准的查找定位网页里面的数据。Html 结构完整的 HTML 文件至少包括 标签、 标签、标签和标签,并且这些标签都是成对出现的,开头标签为,结束标签为,在这两个标签之间添加内容。通过这些标签中的相关属性可以设置页面的背景色、背景图像等。八爪鱼云采集网络爬虫软件Html 标签、元素、节点八爪鱼云采集网络爬虫软件Html 常见标签八爪鱼云采集网络爬虫软件Html 常见属性八爪鱼云采集网络爬虫软件Xml、X
6、path、Html 关系和区别Xml 和 Html 之间既有相似之处,又有很大区别。Xml 包含数据和对数据的描述,主要用来交换数据。Html 也包含了数据和对数据的描述,但只是针对描述网页这种用途,Html 结构看起来和 Xml 类似,但并不严格遵循 Xml 标准,可以看做不标准的 Xml。Xpath 是专门针对 Xml 设计的,在复杂结构化数据中查找信息的语言,而我们的网页实质上是 Html 的文档,那如何对网页执行 Xpath 查询呢?八爪鱼采集器内部有一套针对 Html 的 Xpath 引擎,使得直接用 Xpath 就能精准的查找定位网页里面的数据。八爪鱼云采集网络爬虫软件常见问题Q:
7、八爪鱼采集器有免费版吗?A:八爪鱼采集器免费版所有功能都可以使用。Q:规则市场下载的文件是.otd 为后缀的文件,如何打开?A:.otd 文件是八爪鱼采集器的规则文件(类似于 ppt 模板),下载后使用八爪鱼采集器运行即可采集数据,但必须安装八爪鱼采集器才能打开。免费下载八爪鱼采集器Q:八爪鱼采集器能采集匿名账户信息吗?A:如果你没有权限查看匿名的数据就不可以,八爪鱼可以代替人工更加自动和智能的收集数据,但不会协助你收集你没有权限浏览的数据,比如别人的密码等隐私数据。Q:八爪鱼采集器能采集别人的后台数据吗?A:不能采集,后台数据需要有后台访问权限,正规的采集软件不会提供此类侵权服务。但您可以采集自己的后台数据。Q:八爪鱼能采集 QQ 号码、邮箱、电话号码之类的吗?