JAVA学习第六十五课 — 正则表达式

正则表达式:主要应用于操作字符串,通过一些特定的符号来体现

举例:

QQ号的校验

6~9位,0不得开头,必须是数字

String类中有matches方法

matches(String regex)
告知此字符串是否匹配给定的正则表达式

regex,就是给定的正则表达式

public static void checkQQ() {
		
		//第一位是数字1-9,第二位以后是0-9,除去第一位数剩下数字位数范围是5到8位
		String regex = "[1-9][0-9]{5,8}";//正则表达式
		String qq = "123459";
		boolean flag = qq.matches(regex);
		System.out.println(qq+" : "+flag);
	}

PS:正则表达式虽然简化了书写,但是代码的阅读性极差

符号意义

正则表达式难就难在符号太多。

预定义字符类
. 任何字符(与行结束符可能匹配也可能不匹配)
\d 数字:[0-9]
\D 非数字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
字符类
[abc] abc(简单类)
[^abc] 任何字符,除了 abc(否定)
[a-zA-Z] az AZ,两头的字母包括在内(范围)
[a-d[m-p]] ad mp[a-dm-p](并集)
[a-z&&[def]] def(交集)
[a-z&&[^bc]] az,除了 bc[ad-z](减去)
[a-z&&[^m-p]] az,而非 mp[a-lq-z](减去)

边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾

Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n
X{n,} X,至少 n
X{n,m} X,至少 n 次,但是不超过 m

Logical 运算符
XY X 后跟 Y
X|Y XY
(X) X,作为捕获组

Back 引用
\n 任何匹配的 nth 捕获组

<span style="white-space:pre">	</span>public static void check() {
		
	<span style="white-space:pre">	</span>String string = "aoooooz";
	<span style="white-space:pre">	</span>String regex = "ao{4,}z";//正则表达式
	<span style="white-space:pre">	</span>boolean flag = string.matches(regex);
	<span style="white-space:pre">	</span>System.out.println(string+" : "+flag);
<span style="white-space:pre">	</span>}

常见功能

1.匹配 2.切割 3.替换 4.获取

匹配:用的是String类中的matches方法

	public static void check() {
		
		//匹配手机号码是否正确
		String tel = "18753377511";
		//第一位是1,第二位是3或5或8
		//String regex = "1[358][0-9]{9}";
		String regex = "1[358]\\d{9}";
		//字符串中\,代表转义,所以再加上一个"\"将"\"转义
		boolean flag = tel.matches(regex);
		System.out.println(tel+" : "+flag);
	}


切割:就是以前用的String类中的split(String regex)方法,以前用的是" ",空格一般的非特殊符号,都可看作规则

空格

public static void check() {
		//以空格为分割,切割,空格可能出现多次
		String str = "a   b  c     d e f";
		String regex = " +";//空格出现1次或者多次
		String[] line = str.split(regex);
		for(String i : line){
			System.out.println(i);
		}
	}
点,PS:点本身在正则表达式中是特殊符合
String str = "a.b.c.d.e..f";
		String regex = "\\.+";//\.转义后还是.,所以再加一个		String[] line = str.split(regex);

以叠词为分割

正则用()来封装成组

所以叠词就可以表示为,.代表任意字符,(.)封装成组,(.)\\1,代表余下都和第一组相同

String str = "a@@@b####c...dtttef";
		String regex = "(.)\\1+";//
		String[] line = str.split(regex);

组:((A)(B(C))),共有几组,哪几组

以左括号数,

((A)(B(C))) 1

(A)     2

(B(C))     3

(C)         4

无括号就是第0组


替换:

replaceAll(String regex, String replacement)
使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。

replaceFirst(String regex, String replacement)
使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。

public static void check() {
		//把叠词变为一个字符
		String str = "abgggggcffffdggggs";
		String regex = "(.)\\1+";//
		str = str.replaceAll(regex, "$1");
		System.out.println(str);
	}

PS:美元符号在其他参数中,可以对前一个参数中的已有的正则规则的获取

	public static void check() {
		//18753377511 -> 187****7511
		String str = "18753377511";
		String regex = "(\\d{3})\\d{4}(\\d{4})";
		System.out.println(str);
		str = str.replaceAll(regex, "$1****$2");
		System.out.println(str);
	}

获取

正则本身就是一个对象

Pattern类

指定为字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的模式用于创建 Matcher 对象,依照正则表达式,该对象可以与任意字符序列匹配。执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。

//将正则的规则进行对象的封装
//Pattern p = Pattern.compile("a*b");
//通过正则对象的matcher方法字符串相关联,获取对字符串操作的匹配器对象Matcer
//Matcher m = p.matcher("aaaab");
//通过Matcher匹配器对象的方法对字符串进行操作
//boolean b = m.matches();

Matcher类

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。