1、第十六讲:正则表达式,讲师:杨兴 e-mail: http:/ 简单模式 复杂模式 常用模式,正则表达式基础,为什么使用正则表达式 在这之前曾有过字符验证例子,其中验证字符的代码非常繁琐冗长。有了正则表达式,验证程序的代码变得简洁而更强大,代码运行的速度更快。为了判断某个字符串是否符合某种格式,使用正规表达的最为合适。通常,人们在表单数据发送到服务器之前,都需要进行数据合法性验证。例如,客户所填写的电子邮件地址格式是否正确等。使用正则表达式可以使程序代码简单高效 。,正则表达式基础,使用RegExp对象 RegExp是JavaScript提供的一个对象,用来完成有关正则表达式的操作和功能,每一
2、条正则表达式模式对应一个RegExp实例。JavaScript使用RegExp对象封装与正则表达式相关的功能和操作,每一个该对象的实例对应着一条正则表达式。和其他对象一样,在使用之前必须取得其引用或新建一个对象实例。创建一个RegExp实例语法如下:,var regObj = new RegExp( “pattern” ,” flags ” );,参数说明: pattern:必选项,正则表达式的字符串。 flags:可选项,是一些标志组合。,正则表达式基础,在标志组合中,“g”表示全局标志。设定时将搜索整个字符串,以找匹配的内容,每一次新的探索都从RegExp对象的lastIndex标记的字符
3、起,否则只搜索到第一个匹配的内容。“i”表示忽略大小写标志,若设置该项,则在搜索匹配项时忽略大小写,否则将区别大小写。以上所述是创建正则表达式对象的方式之一,另一种创建方式如下:,var regObj = /pattern/flags;,参数的意义和第一种方式一样,但这种方式不能用引号将pattern和flags括起来。正则表达式的使用非常简单,只要用一个test方法就行了,如下所示。,regObj.test( string );,正则表达式基础,regObj表示正则表达式对象,是一个RegExp对象实例。string为源字符串,即将在其中进行匹配操作的字符串。test方法返回一个布尔值,表明
4、是否已经在源串中找到了正则表达式所定义的模式。 下面举一个例子来说明。,01 02 var reg = /.o./g; / 寻找字符o前后接任意字符组成的有三个字符的字符串 03 var str = “How are you?“ / 源串 04 var result = new Array(); / 用于接收结果 05 while( reg.exec(str) != null ) / 执行匹配操作,如果找到匹配则继续找下一项 06 07 result.push( RegExp.lastMatch ); / 添加结果 08 09 alert( result ); / 输出找到的匹配项 10 ,简
5、单模式,元字符 元字符是正则表达式最为简单的情况。它指的是与字符序列相匹配,例如范例16-1中的正则表达式filter。其简单的查找语句said中是否存在“一枪爆头”这个语句,这个语句中没有其他有特别含义的字符 。,01 02 var filter = /一枪爆头/g; / 将受限制的词句组成正则表达式 03 var said = “他被人一枪爆头了“; / 将接受检查的语句 04 if( filter.test( said ) ) / 如果被检查语句中存在受限词句 05 06 alert( “该语句中有限制级词语,系统已经过滤!“ ); / 显示警告 07 08 else / 否则 09 1
6、0 alert( said ); / 输出原话 11 12 ,简单模式,量词 量词就是指定某个特定模式出现的次数。分为简单量词、贪婪量词、惰性量词和支配量词几种。目前IE浏览器并没有实现这些特性,下面简单的介绍这几种量词。 贪婪量词,它是首先匹配整个字符串,如果不匹配,则去掉最后一个字符,然后再比较。如果仍然不匹配,则继续去掉最后一个字符再比较,如此一直下去,直到找到匹配或者字符串的字符被取完为止。 惰性量词是先看字符串中的第一个字符是不是匹配。如果不匹配,就读入下一个字符,将这两个字符连接成一个字符串。如果还是不匹配,则继续从字符串添加字符直到发现匹配或找完整个字符串为止。,简单模式,支配量
7、词,它只尝试整个字符串的匹配,如果不能匹配,则不再尝试,也就说它只比较一次。 具体的方法见如下的例子。,05 06 ,获取cookie的值,21 22 23 24 25 26 用户名合法性检测程序 27 28 29 规则:数字或英文字符串+数字 30 31 32 33 34 ,复杂模式,分组 前面用简单模式可以找整个表达式的结果,但是如果要找的是表达式内的子表达,或者找的是目标字符串中重复出现子串,则仅仅依靠前面的简单模式的知识是绝对无法实现的。 为了解决上面的问题,正则表达式引入分组的概念。它的语法是“(pattern)”,也就是用括号括起一些字符、字符类或量词,它是一个组合项或子匹配,可统
8、一操作。下面是一个简单的分组的例子。,复杂模式,01 02 var showStr=“; /定义一个变量,并赋空值 03 var str = “this word is OKOKOKOKokokokok!“; /给变量赋初值 04 var searchStr = /(OK)2/gi; /分组的正则表达式 05 var result= str.match(searchStr); /查找匹配 06 for (var i = 0; i ,候选 候选就是用“|”来表示的模式或关系,它表示的是在匹配时可以匹配“|”的左边或右边。这个“|”相当于“或”。这个功能一般用在检验某个指定的字符串是否存在。下面是
9、一个简单的候选的例子。,复杂模式,01 02 var str1 = “I like red and black“;/ 给字符串赋初值 03 var str2 = “she likes black“; / 给字符串赋初值 04 var result = /(red|black)/; /候选正则表达式 05 reStr=result.test(str1); /用test方法检查字符串是否存在 06 alert(result.test(str2); /返回的值为bool型,即true或flase,这里返回的是true 07 alert(reStr) /返回true 08 ,非捕获性分组 非捕获性分组
10、是指将目标字符串分组合成一个可以统一操作的组合项,只是不会把它作为子匹配来捕获,匹配的内容不编号也不存储在缓冲区,这个功能适合用在对非捕获性分组方法在必须进行组合、但又不想对组合的部分进行缓存的情况下有用。下面是一个简单的非捕获性分组的例子。,复杂模式,01 02 function locate() 03 04 var str=“we want to search for the words:discount and discover“; 05 var regex=/dis?:count|cover)/g /查找字符的正则表达式 06 var array=regex.exec(str); /第
11、一次匹配 07 var msg=“字符所在的位置是:t“ 08 if(array) 09 10 msg+=array.index+“t“; /取得所查找的字符的位置 11 12 array=regex.exec(str); /第二次匹配 13 if(array) 14 15 msg+=array.index+“t“; /取得所查找的字符的位置 16 17 alert(msg); /显示信息 18 19 locate(); 20 ,复杂模式,前瞻 前瞻是指对所要匹配的字符作一些限定条件。比如在检查用户输入的是否为电子邮箱时,其中有一个特殊的符号,这就算是一个限定 。前瞻又分正向前瞻和负向前瞻 正
12、向前瞻是指在目标字符串的对应位置处要有指定的某一特殊的值。不过这个值不作为匹配结果处理,当然也不会存储在缓冲区内。 负向前瞻则和正向相反,是在指定的位置不能有指定的值,它的处理结果也不作为匹配结果处理,也不会存储在缓冲区内。,常用模式,验证电子邮件 正确格式的电子邮件地址如,它必须符合以下几个条件。电子邮件地址中同时含有“”和“.”字符;字符“”后必须有字符“.”,且中间至少间隔一个字符;字符“”不为第一个字符,“.”不为最后一个字符。所有的电子邮件都是这样的。 根据上述条件,可构造验证电子邮件地址的正则表达式如下所示:/(a-zA-Z0-9_-)+(a-zA-Z0-9_-)+(.a-zA-Z
13、0-9_-)+/ 下面是具体的实现过程。,复杂模式,02 04 function check(obj) 05 06 var emailUrl = obj.email.value 07 var regex=/(a-zA-Z0-9_-)+(a-zA-Z0-9_-)+(.a-zA-Z0-9_-)+/; /构造正则表达式进行检验 08 if (!regex.exec(emailUrl) /取得用户的输入 09 10 alert(“您输入的格式有误,可能您好忘记了符号或是点号!请重新输入“); 11 obj.m_email.focus() /取得焦点 12 13 else 14 15 alert(“输入正确!“); /通过验证 16 return true; /提交表单 17 18 20 23 24 验证电子邮件地址合法性 25 26 27 28 29 ,