php中的字符串和正则表达式

一、字符串类型的特点

    1、PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作。

   1: <?php
   2: echo substr("123456",2,4);  //输出345
   3: echo substr(123456,2,4);    //输出345
   4: echo hello;                 //先查找hello常量,若没找到,将hello看做字符串使用
   5: ?>

    2、字符串可以作为“数组”,是字符的集合。

   1: <?php
   2: $str = "www.ido321.com";
   3: echo $str[0];
   4: echo $str[1];
   5: echo $str[2];
   6: ?>

          但是字符串不是真的数组,不能使用数组的函数.如count($str)不会返回字符串长度。PHP引擎无法区分字符和数组,产生二义性。自PHP4起,已经用花括号替代方括号。

   1: <?php
   2: //为保证向后兼容,方括号仍然可以使用
   3: $str = "www.ido321.com";
   4: echo $str{0};
   5: echo $str{1};
   6: echo $str{2};
   7: ?>

    3、双引号变量解析

          在PHP中,当用双引号或者定界符定义字符串时,其中的变量会被解析。

   1: <?php
   2: $arr = array(‘name‘ => "dwqs",‘add‘ => "www.ido321.com");
   3: echo "$arr[name]";  //可以解析,但是在方括号中不能使用引号
   4: //echo "$arr[‘name‘]";  错误
   5: echo "{$arr[‘name‘]}";  //可以解析,用花括号包含元素,name不带引号也是可以的
   6:  
   7: //假设存在对象$square
   8: echo "$square->width"; //可以解析
   9: echo "$square->width00 cent"; //不可以解析,用花括号解决
  10: echo "{$square->width}width00 cent"; //可以解析
  11: ?>

 

二、字符串输出函数


三、常用的字符串格式函数


   PS:PHP的字符串处理函数大部分不对源字符串做修改,而是返回新的字符串

 

四、正则表达式

        正则表达式描述了一种字符串匹配的模式,通过这个模式在特定的函数中对字符串进行匹配、查找、替换和分隔等操作,由原子、元字符和模式修正符三部分组成的文字模式。

        在PHP中,有两套正则的处理函数库:PCRE和POSIX。前者以preg_前缀命名,与Perl兼容;后者以ereg_前缀命名。二者功能相似,但PCRE的效率略高。

        与Perl语言兼容的正则表达式处理函数:

1、语法

            1.1  定界符:在与Perl兼容的正则函数中使用模式时,必须给模式加上定界符。除了字母、数字和反斜线(\)之外的任何字符都可以作为定界符号

   1: <?php
   2: //以下正则合法
   3: echo $m1 = ‘/<\/\w+/‘;
   4: echo $m2 = ‘|(\d{3})-\d|Sm‘;
   5: echo $m3 = ‘!^(?i)php[34]!‘;
   6: echo $m4 = ‘{^\s+(\s+)?$}‘;
   7: ?>

             1.2  原子:原子包含了普通字符,如字母、数字;非打印字符,如空格、回车;特殊字符和元字符,如引号、*、+等,必须用”\”进行转义;自定义原子表,如[apj]、[a-z];通用字符类型,如\d、\D。

   1: <?php
   2: //下面二者等价,匹配e-mail
   3: $mail1 = ‘/^[0-9a-zA-Z]+@[0-9a-zA-Z]+(\.[0-9a-zA-Z]+){0,3}$/‘;
   4: $mail2 = ‘/^\w+@\w+(\.\w+){0,3}$/‘;
   5: ?>

              1.3  元字符:用于构建正则表达式的具有特殊含义的字符。Perl可以使用各种元字符来搜索匹配,如*、+、?.常见的元字符如下

1.4  模式修正符:在正则的定界符之外使用,扩展正则在匹配、替换等方面的功能。

     2.与Perl兼容的正则表达式函数

         2.1  preg_match(string pattern,string subject[,array matches]):用于对字符串的查找和匹配。参数说明:

                pattern是正则,subject是需要处理的字符串,可选的matches用于保存于pattern的各个子模式的匹配结果,matches[0]保存了与pattern匹配的整体内容,matches[1]保存了pattern中第一个小括号中匹配的内容,以此类推。

   1: <?php
   2: header("content-type:text/html;charset=utf8");
   3: $pattern = ‘/(http):\/\/(www)\.([^\.\/]+)\.(com|net|org)/i‘;
   4: $subject = "我的博客:http://www.ido321.com";
   5: if(preg_match($pattern, $subject,$matches)){
   6:     echo "搜索的URL是:".$matches[0]."<br/>";  //数组第1个元素保存整个匹配结果
   7:     echo "URL中的协议是:".$matches[1]."<br/>";//数组第2个元素保存第1个字表达式
   8:     echo "URL中的主机是:".$matches[2]."<br/>";//数组第3个元素保存第2个字表达式
   9:     echo "URL中的域名是:".$matches[3]."<br/>";//数组第4个元素保存第3个字表达式
  10:     echo "URL中的顶域是:".$matches[4]."<br/>";//数组第5个元素保存第4个字表达式
  11: }
  12: ?>

结果

    preg_match_all()与preg_match()函数类似,不同的是前者会一直匹配到字符串末尾,后者在第一次匹配后就停止匹配。

             2.2  preg_grep(string pattern,array iput):匹配数组中的元素,返回与正则匹配的数组单元。参数说明:

                     pattern是正则,input是需要匹配的数组。

   1: <?php
   2: $arr = array(‘Linux RedHat9.0‘,‘Apache2.2.9‘,‘MySQL5.0.51‘,‘PHP5.2.6‘,‘LAMP‘,‘100‘);
   3: $version = preg_grep(‘/^[a-zA-Z]+(\d|\.)+$/‘,$arr);
   4:  
   5: //输出:Array([1]=>Apache2.2.9 [2]=>MySQL5.0.51 [3]=>PHP5.2.6)
   6: print_r($version); 
   7: ?>

             2.3  preg_replace(mixed pattern,mixed replacement,mixed subject[,int limit]):字符串替换。说明:

                     该函数会在subject中搜索与pattern的匹配项,并用replacement替换。limit用于限制匹配的次数,即替换的次数。

   1: <?php
   2: $pattern = ‘/<[\/\!]*?[^<>]*?/is‘;
   3: $text = ‘这个文本有<b>粗体</b>和<u>带有下划线</u>以及<i>斜体</i>‘;
   4: echo preg_replace($pattern,"",$text);  //将所有HTML标记替换为空
   5: echo preg_replace($pattern,"",$text,2); //值替换前2个HTML标记
   6: ?>

              2.4  preg_split(string pattern,string subject[,int limit[,int flags]]):对字符串进行分割。说明:

                     函数返回一个数组。数组元素包含subject中与pattern匹配作为边界所分割的字符串,limit含义见2.3,flags含义请参考文档。

   1: <?php
   2: //按任数量的空格分割字符串
   3: $kerwords = preg_split("/[\s,]+/","hypertext language,programming");
   4:  
   5: //输出:Array([0]=>hypertext [1]=>language,[2[=>programming)
   6: print_r($kerwords);
   7: ?>

来源:http://www.ido321.com/612.html

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。