JavaScript正则表达式

NOTE: 在正则表达式中,许多标点符号具有特殊的含义。它们是:

^ $ . * + ? = ! : | \ / ( ) [ ] { }

 

正则表达式的直接量字符

字符匹配
字母数字字符 自身
\0 NUL字符(\u0000)
\t 制表符(\u0009)
\n 换行符(\u000A)
\v 垂直制表符(\u000B)
\f 换页符(\u000C)
\r 回车(\u000D)
\xnn 由十六进制数nn指定的拉丁字符,例如,\x0A等价于\n
\uxxxx 由十六进制xxxx指定的Unicode字符,例如,\u0009等价于\t
\cX 控制字符^X。例如,\cJ等价于换行符\n

 

正则表达式的字符类

字符匹配
[...] 位于括号之内的任意字符
[^...] 不在括号之中的任意字符
. 除换行符和其他Unicode行终止符之外的任意字符
\w 任意ASCII单字字符,等价于[a-zA-Z0-9_]
\W 任意非ASCII单字字符,等价于[^a-zA-Z0-9_]
\s 任何Unicode空白符 空格 制表符 换页符
\S 任何非Unicode空白符的字符,注意\w和\S不同
\d 任意ASCII数字,等价于[0-9_]
\D 除了ASCII数字之外的任何字符,等价于[^0-9_]
[\b] 退格直接量(特例)

 

正则表达式的重复字符

字符含义
{n,m} 匹配前一项至少n次,但是不能超过m次
{n,} 匹配前一项n次,或更多次
{n} 匹配前一项恰好n次
? 匹配前一项0次或1次,也就是说前一项是可选。等价于{0,1}
+ 匹配前一项1次或多次,等价于{1,}
* 匹配前一项0次或多次,等价于{0,}

 

正则表达式的选择、分组和引用字符

字符含义
| 选择。匹配的是该符号左边的子表达式或右边的子表达式
(...) 组合。将几个项目组合为一个单元,这个单元可由*、+、?和|等符号使用,而且还可以记住和这个组合匹配的字符以供此后的引用使用
(?:...) 只组合。把项目组合到一个单元,但是不记忆与该组匹配的字符
\n 和第n个分组第一次匹配的字符相匹配。组是括号中的子表达式(可能是嵌套的)。组号是从左到右计数的左括号数,以(?:形式分组的组不编码

 

正则表达式的锚字符

字符含义
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
\b 匹配一个词语的边界。简而言之,就是位于字符\w和\W之间的位置,或位于字符\w和字符串的开头或结尾之间的位置(但注意,[\b]匹配的是退格符)
\B 匹配非词语边界的位置
(?=p) 正前向声明,要求接下来的字符都与模式p匹配,但是不包括匹配中的那些字符
(?!=p) 反前向声明,要求接下来的字符不与模式p匹配

 

正则表达式的标志

 

字符含义
i 执行不区分大小写的匹配
g 执行一个全局匹配。简而言之,即找到所有匹配,而不是在找到第一个之后就停止
m 多行模式,^匹配一行的开头或字符串的开头,$匹配一行的结尾或字符串的结尾

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。