Java正则表达式时不时的用一下,虽然可以解决问题,总是没有完全弄明白其中的一些接口的含义。本文熟悉了相关的几个常见接口。
匹配(全匹配)
- 直接匹配
String content = "hello world 1, hello world 2, hello world 3, hello world 100.";
//false: 下面是字符串与正则表达式全匹配
Pattern.matches("hello world (\\d+)", content);
- 预编译
public class App {
private static final Pattern PATTERN = Pattern.compile("hello world (\\d+)");
public static void main(String[] args) {
String content = "hello world 1, hello world 2, hello world 3, hello world 100.";
Matcher matcher = PATTERN.matcher(content);
System.out.println(matcher.matches());
//false: 没有全匹配
}
}
捕获组(部分匹配)
捕获组是使用()
的方式进行捕获,一个Pattern可以同时有多个捕获组。例如,在表达式((A)(B(C)))
,有四个这样的组:
- ((A)(B(C)))
- (A)
- (B(C))
- (C)
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。
还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。
- 捕获实例
matcher.find()
public class App {
//除了表示全部匹配内容的group(0)之外,还有2个分组,分别是(world (\\d+))和(\\d+)
private static final Pattern PATTERN = Pattern.compile("hello (world (\\d+))");
public static void main(String[] args) {
String content = "hello world 1, hello world 2, hello world 3, hello world 100.";
Matcher matcher = PATTERN.matcher(content);
if (matcher.find()) {
for (int i = 0; i <= matcher.groupCount(); i++) {
System.out.println(matcher.group(i));
}
}
}
}
- 输出
hello world 1 #group 0(表示全部匹配)
world 1 #group 1 (world (\\d+))
1 #group 2 (\\d+)
匹配多个(while (matcher.find()))
public class App {
private static final Pattern PATTERN = Pattern.compile("hello (world (\\d+))");
public static void main(String[] args) {
String content = "hello world 1, hello world 2, hello world 3, hello world 100.";
Matcher matcher = PATTERN.matcher(content);
// 找到所有匹配字符串
while (matcher.find()) {
// 输出所有的匹配组
for (int i = 0; i <= matcher.groupCount(); i++) {
System.out.println(matcher.group(i));
}
}
}
}
- 输出
hello world 1
world 1
1
hello world 2
world 2
2
hello world 3
world 3
3
hello world 100
world 100
100
网友评论