Pattern编译正则表达式,Matcher执行匹配操作,通过compile()和matcher()方法实现文本查找与提取,结合find()、group()等方法可解析邮箱、日期等结构化信息。

在Java中处理正则表达式,Pattern 和 Matcher 是核心工具类,位于 java.util.regex 包中。它们提供了比字符串原生方法更强大、灵活的文本匹配与提取能力。
1. Pattern:编译正则表达式
Pattern 类表示一个已编译的正则表达式。它不能通过构造函数创建实例,而是使用静态方法 compile() 来生成对象。
常见用法:
-
Pattern.compile("\\d+"):匹配一个或多个数字 -
Pattern.compile("[a-zA-Z]+"):匹配一个或多个字母 - 支持标志位,如忽略大小写:
Pattern.compile("abc", Pattern.CASE_INSENSITIVE)
2. Matcher:执行匹配操作
通过 Pattern.matcher(CharSequence input) 方法获取 Matcher 实例,用于对目标字符串进行实际的匹配操作。
立即学习“Java免费学习笔记(深入)”;
常用方法包括:
- matches():判断整个字符串是否完全匹配正则
- find():查找字符串中是否有子串匹配(可多次调用)
- group():获取匹配到的子串内容
- start() 和 end():返回匹配的起始和结束索引
- replaceAll(String replacement):替换所有匹配项
3. 实际使用示例
以下是一个提取文本中所有邮箱地址的例子:
import java.util.regex.*;
public class RegexExample {
public static void main(String[] args) {
String text = "联系我:user1@example.com 或 admin@site.org";
String regex = "\\b[a-zA-Z0-9._%-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}\\b";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
System.out.println("找到邮箱: " + matcher.group());
System.out.println("位置: " + matcher.start() + "-" + matcher.end());
}
}
}
输出结果会列出两个匹配的邮箱及其位置。
4. 分组与捕获
使用括号 () 可以定义分组,便于提取特定部分。
例如,从日期字符串中提取年月日:
String dateStr = "今天是2024-04-05";
Pattern p = Pattern.compile("(\\d{4})-(\\d{2})-(\\d{2})");
Matcher m = p.matcher(dateStr);
if (m.find()) {
System.out.println("年: " + m.group(1)); // 2024
System.out.println("月: " + m.group(2)); // 04
System.out.println("日: " + m.group(3)); // 05
}
基本上就这些。掌握 Pattern 与 Matcher 的基本流程——编译、匹配、查找、提取——就能应对大多数文本处理需求。关键是理解正则语法和匹配行为之间的关系。不复杂但容易忽略细节,比如转义字符要写成双反斜杠。










