php的strip_tags,htmlspecialchars,htmlentities,stripslashes,addslashes解释
php函数蛮多的,要完整的每个函数都理解深刻是个挺有挑战性的事情。
strip_tags,htmlspecialchars,htmlentities,stripslashes,addslashes这几个函数我想就需要专门的强化一下。
第一个函数:strip_tags,去掉 HTML 及 PHP 的标记
注意:本函数可去掉字串中包含的任何 HTML 及 PHP 的标记字串。若是字串的 HTML 及 PHP 标签原来就有错,例如少了大于的符号,则也会传回错误。而本函数和 fgetss() 有着相同的功能。fgetss是从文件中读取文件,并去掉html和php标记。
我们看一个例子:
- $str=‘
- 博客小子,BlogGuy,wayswang" />
- <link rel="alternate" title="BlogGuy" href="rss.php" type="application/rss+xml" />
- <link rel="stylesheet" href="templates/default/style.css" type="text/css" media="all" />
- <link rel="stylesheet" href="include/code.css" type="text/css" media="all" />
- <script type="text/javascript">
- var postminchars = parseInt("
- ‘;
- echo(strip_tags($str,100));
返回的结果是
可见虽然去除了html代码,但是空格格式之类的并没有去掉。
网上找到一个函数,但是我个人不是很满意,权作记录。
- unction cutstr_html($string, $sublen)
- {
- $string = strip_tags($string);
- $string = preg_replace (‘/\n/is‘, ‘‘, $string);
- $string = preg_replace (‘/ | /is‘, ‘‘, $string);
- $string = preg_replace (‘/ /is‘, ‘‘, $string);
- preg_match_all("/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/", $string, $t_string);
- if(count($t_string[0]) - 0 > $sublen) $string = join(‘‘, array_slice($t_string[0], 0, $sublen))."…";
- else $string = join(‘‘, array_slice($t_string[0], 0, $sublen));
- return $string;
- }
第二个函数:htmlspecialchars, 将特殊字元转成 HTML 格式
详细说本函数会转化一下字符
- $str=‘
- BlogGuy" />&&<"
- ‘;
- echo(htmlspecialchars($str));
BlogGuy" />&&<"
可见,本函数只转换以上4个字符,其他html标记是不转换的。所以康盛的uchome里面提供了另外一个函数可以选择
- //取消HTML代码
- function shtmlspecialchars($string) {
- if(is_array($string)) {
- foreach($string as $key => $val) {
- $string[$key] = shtmlspecialchars($val);
- }
- } else {
- $string = preg_replace(‘/&((#(\d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/‘, ‘&\\1‘,
- str_replace(array(‘&‘, ‘"‘, ‘<‘, ‘>‘), array(‘&‘, ‘"‘, ‘<‘, ‘>‘), $string));
- }
- return $string;
- }
第三个函数:htmlentities,将所有的字元都转成 HTML 字串
可能你还在遗憾htmlspecialchars只能处理4个html标记,现在你不要遗憾了,htmlentities是转化全部字符。不可无不强大,但是在我看来意义不大。
- $str=‘
- BlogGuy" />&&<##博客小子"
- ‘;
- echo(htmlentities($str));
返回结果
选择的理由是什么呢?
看源代码完全不知所云嘛!
第四个函数:stripslashes与addslashes本是一对,addslashes是使用反斜线引用字符串,stripslashes是还原addslashes引用的字符串。
该函数一般都是数据库查询之前就需要处理的必要步骤,该字符串为了数据库查询语句等的需要在某些字符前加上了反斜线。这些字符是单引号(‘)、双引号(")、反斜线(\)与 NUL(NULL 字符)。
看看例子吧
- $str=‘
- BlogGuy" />&&<##博客小子\\\"
- ‘;
- echo(addslashes($str));
结果
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。