Java Matcher类 replaceAll 捕获组使用及使用符号$引用捕获组
String action = null;
String pluginid = null;
String pattern = "/(\\w+)_(\\w+)_(\\w+).html(.*)";
Pattern p = Pattern.compile(pattern, 2 | Pattern.DOTALL);
Matcher m = p.matcher(url);
if (m.find()) {
action = m.replaceAll("$2");
pluginid =m.replaceAll("$3");
return new String[]{action,pluginid};
}else{
return null;
}
}
Java 正则表达式中的捕获组 Mathcer 类的捕获组相关方法
先来看看Matcher 类的捕获组及相关方法
如里要解析一个HTML标签<textare>里面的内容如:
<textarea class="textarea" id="testid">经历了千千万万个轮回,我们相互寻觅似曾相识却又擦肩而过,不要怀疑今生一见就为什么对你如此痴迷。</textarea>
中的“经历了千千万万个轮回,我们相互寻觅似曾相识却又擦肩而过,不要怀疑今生一见就为什么对你如此痴迷。”
private String getTestarea(String text){
Pattern p1=Pattern.compile("<textarea .*?>(.*?)</textarea>");
Matcher m1=p1.matcher("<textarea class=\"textarea\" id=\"testid\">经历了千千万万个轮回,我们相互寻觅似曾相识却又擦肩而过,不要怀疑今生一见就为什么对你如此痴迷。</textarea>");
String result=null;
if(m1.find()){
result=m1.group();
System.out.println(result);
result=m1.group(1);
System.out.println(result);
}
}
对应结果为:
<textarea class="textarea" id="testid">经历了千千万万个轮回,我们相互寻觅似曾相识却又擦肩而过,不要怀疑今生一见就为什么对你如此痴迷。</textarea>
经历了千千万万个轮回,我们相互寻觅似曾相识却又擦肩而过,不要怀疑今生一见就为什么对你如此痴迷。
可以看到使用用java 正则表达式的捕获组很容易的就得到了标签<textarea>中的内容
在模式串“<textarea .*?>(.*?)</textarea>” 中的(.*?)对应捕获组1,即m1.group(1),整一个匹配串对应捕获组0,即m1.group() 与m1.group(0)一至,如果有多少个模式串中有多少个()情况以上面的类似大家可能网上搜索一下。上面提到了Matcher类的方法这里顺便讲一下find和matchers方法的区别
Matcher类 find 和matchers方法的区别
Matcher m1=p1.matcher("123456");
m1.find();
System.out.println(m1.start());//0
System.out.println(m1.end());//6
如果不是整个要匹配的字符串和模式对应结果,如下
Matcher m1=p1.matcher("qq123ww123ee123");
m1.find();
System.out.println(m1.start());//2
System.out.println(m1.end());//5
m1.find();
System.out.println(m1.start());//7
System.out.println(m1.end());//10
而matchers方法是对整个匹配串与模式串进行比较,符合结果为true否则为false。
使用符号$对捕获组进行引用
String action = null;
String pluginid = null;
String pattern = "/(\\w+)_(\\w+)_(\\w+).html(.*)";
Pattern p = Pattern.compile(pattern, 2 | Pattern.DOTALL);
Matcher m = p.matcher(url);
if (m.find()) {
action = m.replaceAll("$2");
pluginid =m.replaceAll("$3");
return new String[]{action,pluginid};
}else{
return null;
}
}
group
(g). The first number after the
$ is always treated as part of the group reference. Subsequent numbers are incorporated into g if they would form a legal group reference. Only the numerals ‘0‘ through ‘9‘ are considered as potential components of the group reference. If the second
group matched the string "foo", for example, then passing the replacement string
"$2bar" would cause "foobar" to be appended to the string buffer. A dollar sign ($) may be included as a literal in the replacement string by preceding it with a backslash (\$). 郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。