/**
* 清除所有微博短链接
*
* @param s
* 文本
* @return 清除所有链接后的文本,返回内容中会多一些空格,请注意
*/
public static String clearWeiboShortUrl(String s) {
// 如果要清除的链接有多个的话,还需要清除为了清除多个链接而补充的空格,不然内容中会多出空格来
if (null != s) {
// 各大微博链接
// http://163.fm/XY9AT9z
// http://url.hexun.com/1JX44
// http://yicai.net/WMK8r
// http://t.cn/79H8OR
// http://t.itc.cn/79H8OR
// http://url.cn/79H8OR
// Matcher matcher =
// Pattern.compile("(http://(url|t).cn/)").matcher(s);
// 各大微博链接不一致,修改域名任意
Matcher matcher = Pattern.compile("(http://[\\w.]+/)").matcher(s);
int count = 0;
while (matcher.find()) {
count++;
// System.out.println(matcher.group());
}
// int count =
// Pattern.compile("(http://(url|t).cn)").matcher(s).groupCount();
if (count > 0) {
if (count > 1) {
s = s.replace("http://", " http://");
}
// /后面字符在这[A-Za-z0-9_]之内,都会被匹配
// String regex = "(http://(url|t).cn/\\w+)";
// /后面字符在这[A-Za-z0-9_]之内,只会匹配0~10次
// String regex = "(http://(url|t).cn/\\w{0,10})";
// 域名任意,/后面字符在这[A-Za-z0-9_]之内,只会匹配0~10次
String regex = "(http://[\\w.]+/\\w{0,10})";
s = s.replaceAll(regex, "");
}
}
return s;
}