.Net设计 发表于 2009-2-12 10:04:21

正则表示式的相关介绍

字符描述:
        \:将下一个字符标记为特殊字符或字面值。
                例如"n"与字符"n"匹配。"\n"与换行符匹配。序列"\\"与"\"匹配,"\("与"("匹配。
        ^ :匹配输入的开始位置。
        $ :匹配输入的结尾。
        * :匹配前一个字符零次或几次。例如,"zo*"可以匹配"z"、"zoo"。
        + :匹配前一个字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。
        ? :匹配前一个字符零次或一次。例如,"a?ve?"可以匹配"never"中的"ve"。
        .:匹配换行符以外的任何字符。
(pattern) 与模式匹配并记住匹配。
匹配的子字符串可以从作为结果的 Matches 集合中使用 Item ...取得。
如果要匹配括号字符(和 ),可使用"\(" 或 "\)"。
        x|y:匹配 x 或 y。
                例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zoo" 或 "food"。
        {n}:n 为非负的整数。匹配恰好n次。
                例如,"o{2}" 不能与 "Bob 中的 "o" 匹配,但是可以与"foooood"中的前两个o匹配。
        {n,} :n 为非负的整数。匹配至少n次。
                例如,"o{2,}"不匹配"Bob"中的"o",但是匹配"foooood"中所有的o。"o{1,}"等价于"o+"。"o{0,}"等价于"o*"。
        {n,m} :m 和 n 为非负的整数。匹配至少 n 次,至多 m 次。
                例如,"o{1,3}" 匹配 "fooooood"中前三个o。"o{0,1}"等价于"o?"。
        :一个字符集。与括号中字符的其中之一匹配。
                例如,"" 匹配"plain"中的"a"。
        [^xyz] :一个否定的字符集。匹配不在此括号中的任何字符。
                例如,"[^abc]" 可以匹配"plain"中的"p".
        :表示某个范围内的字符。与指定区间内的任何字符匹配。
                例如,""匹配"a"与"z"之间的任何一个小写字母字符。
        [^m-z] :否定的字符区间。与不在指定区间内的字符匹配。
                例如,""与不在"m"到"z"之间的任何字符匹配。
        \b :与单词的边界匹配,即单词与空格之间的位置。
                例如,"er\b" 与"never"中的"er"匹配,但是不匹配"verb"中的"er"。
        \B :与非单词边界匹配。"ea*r\B"与"never early"中的"ear"匹配。
        \d :与一个数字字符匹配。等价于。
        \D :与非数字的字符匹配。等价于[^0-9]。
        \f :与分页符匹配。
        \n :与换行符字符匹配。
        \r :与回车字符匹配。
        \s :与任何白字符匹配,包括空格、制表符、分页符等。等价于"[ \f\n\r\t\v]"。
        \S :与任何非空白的字符匹配。等价于"[^ \f\n\r\t\v]"。
        \t :与制表符匹配。
        \v :与垂直制表符匹配。
        \w :与任何单词字符匹配,包括下划线。等价于""。
        \W :与任何非单词字符匹配。等价于"[^A-Za-z0-9_]"。
        \num :匹配 num个,其中 num 为一个正整数。引用回到记住的匹配。
                例如,"(.)\1"匹配两个连续的相同的字符。
        \n:匹配 n,
                其中n 是一个八进制换码值。八进制换码值必须是 1, 2 或 3 个数字长。
                例如,"\11" 和 "\011" 都与一个制表符匹配。"\0011"等价于"\001" 与 "1"。
                八进制换码值不得超过 256。否则,只有前两个字符被视为表达式的一部分。
                允许在正则表达式中使用ASCII码。
        \xn:匹配n,其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。
                例如,"\x41"匹配"A"。"\x041"等价于"\x04" 和 "1"。允许在正则表达式中使用 ASCII 码。

我们就举个例子来说明正则表达式。
比如,
        我们想要对用户输入的电子邮件进行校验,那么,什么样的数据才算是一个合法的电子邮件呢?
        我可以这样输入:test@yesky.com,当然我也会这样输入:xxx@yyy.com.cn,
        但是这样的输入就是非法的:xxx@@com.cn或者@xxx.com.cn,等等,
        所以我们得出一个合法的电子邮件地址至少应当满足以下几个条件:
                1. 必须包含一个并且只有一个符号"@"
                2. 第一个字符不得是"@"或者"."
                3. 不允许出现"@."或者.@
                4. 结尾不得是字符"@"或者"."
        所以根据以上的原则和上面表中的语法,
        我们很容易的就可以得到需要的模板如下:
        = "^\w+((-\w+)|(\.\w+))*\@+((\.|-)+)*\.+$"

收集:
        1.匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
        2.匹配中文字符的正则表达式: [\u4e00-\u9fa5]
        3.匹配双字节字符(包括汉字在内):[^\x00-\xff]
                应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
                String.prototype.len=function()
                {
                        return this.replace([^\x00-\xff]/g,"aa").length;
                }
        4.匹配空行的正则表达式:\n[\s| ]*\r
        5.匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
        6.匹配首尾空格的正则表达式:(^\s*)|(\s*$)
                应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:
                String.prototype.trim = function()
                {
                        return this.replace(/(^\s*)|(\s*$)/g, "");
                }
        7.匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

.Net设计 发表于 2009-2-12 10:10:04

比如说在vs.net中 winform提供了一个MaskedTextBoxt 文本控件,他里面的Mask的属性集合提供了正则表达式的应用

忆嘉 发表于 2009-2-12 10:56:53

好帖,正要找点相关资料
介绍开头加些简单介绍
如正则用途,如何方便工作等更好

.Net设计 发表于 2009-2-12 12:18:03

用到的很多,例如web上的身份和资料验证都是通过客户端验证,就像论坛一样(当然论坛还应用到ajax编程技术),当然也有服务器端验证,在.net环境下都能实现这样的功能
页: [1]
查看完整版本: 正则表示式的相关介绍