linux内的正则表达式

POSIX标准将正则表达式分为两类
    >基本正则表达式
    >扩展正则表达式
    大部分linux应用和工具仅支持基本的正则表达式。

    ============基本的正则表达式元字符集合及其意义============
    *   匹配0个或多个
    .   匹配任意一个字符
    ^   匹配开头
    $  匹配结尾
    []  匹配字符集合
    \   转义字符
    \<\>    精确匹配符号
    \{n\}   匹配前面字符出现n次
    \{n,\}  匹配前面的字符出现至少n次
    \{n,m\} 匹配前面的字符n-m次
    ==========================================================

    匹配空行:^$
    \<\>表示精确匹配符号
        \<the\>表示匹配the这个单词,而不匹配包含the字符的单词,如then,them,there,another等

    awk,perl等linux工具还支持正则表扩展出来的字符
    =============扩展正则表达式===============================
    ?   匹配0个或1个在其之前的那个普通字符
    +   匹配1个或多个在其之前的那个普通字符
    ()  表示一个字符集或用在expr中
    |   表示‘或‘,匹配一组可选的字符
    ==========================================================

    通配符
        bash shell本身不支持正则表达式,支持的是shell命令和工具
        shell支持通配符
    =============通配符=======================================
    *   任意位的任意字符
    ?   任意一个字符
    []  表示范围
    {}  一组表达式组合,这些表示是‘或‘的关系
    ^   表示取反

    例子:
        ls -l *.awk         以.awk结尾的文件
        ls -l 0?.pem            以0开头,后面跟一个字符,且后缀是.pem的文件
        ls -l [a-h]*.awk        以[a-h]开头的.awk文件
        ls -l [a-h]*.[^awk]*        以[a-h]开头,且后缀不是awk的文件
        ls -l {[a-h]*.awk,0?.pem}   以0开头,后面跟一个字符,且后缀是.pem的文件 或者 以[a-h]开头的.awk文件
    ==========================================================

    POSIX 
        为了保持不同国家的字符编码的一致性,POSIX(Portable Operating System Interface)增加了特殊的字符类,以[:classname]的格式给出,grep命令支持POSIX字符类。
    ==============POSIX=======================================
    类名          意义
    [:upper:]       [A-Z]
    [:lower:]       [a-z]
    [:digit:]       [0-9]
    [:alnum:]       [0-9a-zA-Z]
    [:space:]       空格或Tab
    [:alpha:]       [a-zA-Z]
    [:cntrl:]       ctrl键
    [:graph:]或[:print:] 表示ASCII码33-126之间的字符
    [:xdigit:]      十六进制数字[0-9a-fA-F]
    ==========================================================

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。