答案:Java中通过Pattern和Matcher类实现正则匹配与提取,支持全匹配、查找、分组提取等操作。1. 使用Pattern.compile()编译正则,matcher.matches()判断全匹配,matcher.find()查找子串,group()获取结果;2. 用括号()定义捕获组提取特定内容,如日志中的时间、IP;3. String的matches()方法可快捷进行全匹配校验;4. 常用符号包括^、$、\d、\w、\s、*、+、?、{n,m}等,正确使用可处理多数文本需求,需注意边界测试。

在Java中使用正则表达式进行字符串匹配和提取,主要依赖于java.util.regex包中的两个核心类:Pattern 和 Matcher。通过它们可以实现文本的匹配、查找、替换和分割等操作。
1. 基本用法:Pattern 和 Matcher
要使用正则表达式,首先需要将正则模式编译成一个Pattern对象,然后通过该对象创建一个Matcher,用于对目标字符串进行匹配操作。
- Pattern.compile(regex):编译正则表达式字符串为Pattern对象。
- pattern.matcher(input):创建Matcher对象,用于匹配输入字符串。
- matcher.matches():判断整个字符串是否完全匹配正则。
- matcher.find():查找字符串中是否有子串匹配正则(常用于提取)。
- matcher.group():获取匹配到的内容。
示例:判断手机号是否合法
String phone = "13812345678";
String regex = "^1[3-9]\\d{9}$"; // 匹配以1开头,第二位是3-9,共11位数字
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(phone);
if (matcher.matches()) {
System.out.println("手机号格式正确");
} else {
System.out.println("手机号格式错误");
}
2. 提取信息:使用分组(group)
正则表达式可以通过括号()定义“捕获组”,用于提取字符串中的特定部分。
立即学习“Java免费学习笔记(深入)”;
示例:从日志中提取时间与IP地址
String log = "2023-10-05 14:23:11 [INFO] User login from 192.168.1.100";
String regex = "(\\d{4}-\\d{2}-\\d{2})\\s(\\d{2}:\\d{2}:\\d{2}).*?(\\d+\\.\\d+\\.\\d+\\.\\d+)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(log);
if (matcher.find()) {
String date = matcher.group(1); // 日期
String time = matcher.group(2); // 时间
String ip = matcher.group(3); // IP地址
System.out.println("日期:" + date);
System.out.println("时间:" + time);
System.out.println("IP:" + ip);
}
3. 快捷方式:String 类的 matches() 方法
对于简单的全匹配场景,可以直接使用字符串的matches()方法,它内部会自动编译并匹配。
String email = "user@example.com";
boolean isValid = email.matches("\\w+@\\w+\\.\\w+");
System.out.println(isValid ? "邮箱格式正确" : "邮箱格式错误");
注意:此方法只能做全匹配,不能提取内容。
4. 常见正则符号说明
- ^:行开始
- $:行结束
- \\d:数字(0-9)
- \\w:字母、数字、下划线
- \\s:空白字符(空格、制表符等)
- *:前一项出现0次或多次
- +:前一项出现1次或多次
- ?:前一项出现0次或1次
- {n,m}:前一项出现n到m次
- (...):捕获组,用于提取
基本上就这些。掌握Pattern、Matcher配合分组使用,就能应对大多数文本处理需求。正则写好后建议多测试边界情况,避免误匹配。不复杂但容易忽略细节。











