正则表达式清除Html

正则表达式,去除所有HTML标签

protected void Page_Load(object sender, EventArgs e)
    {
        //string regexstr = @"<[^>]*>";    //去除所有的标签
        //@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除
         
        // string regexstr = @"<img[^>]*>";   //去除图片的正则
       // string regexstr = @"<(?!br).*?>";   //去除所有标签,只剩br
        // string regexstr = @"<table[^>]*?>.*?</table>";   //去除table里面的所有内容
        string regexstr = @"<(?!img|br|p|/p).*?>";   //去除所有标签,只剩img,br,p
   
        str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
    }

正则表达式获取HTML中的Img

(src\s?=\s?["|‘‘|\s]?)(\S+/)(\S+\.[^"^‘‘^ ]+)

正则表达式中.代表换行以外任意字符,正则表达式匹配任意字符(包括换行)

([\s\S]*) 

 一直在用的正则表达式工具 Regex Match tracer

 

  

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。