Scanner和Pattern结合可高效解析文本:Scanner读取格式化数据,Pattern定义正则规则;通过useDelimiter设置分隔符或findInLine提取匹配内容,适用于日志分析、配置解析等场景。

在Java中处理文本输入时,Scanner 和 Pattern 是两个非常实用的工具。Scanner 能够从字符串、文件或标准输入中读取格式化数据,而 Pattern 则用于定义正则表达式规则,配合 Scanner 可以精确提取所需内容。合理使用这两个类,能高效解析结构化或半结构化的文本数据。
Scanner 的基本用法
Scanner 是 java.util 包中的类,用于解析原始类型和字符串。它支持多种输入源,比如 System.in、File 或 String。
创建 Scanner 实例很简单:
Scanner sc = new Scanner(System.in); // 从控制台读取
Scanner scStr = new Scanner("123 abc 45.6"); // 从字符串读取
默认情况下,Scanner 使用空白字符作为分隔符。你可以调用 nextInt()、nextDouble()、next() 等方法按类型读取数据:
立即学习“Java免费学习笔记(深入)”;
int num = sc.nextInt(); String word = sc.next(); double d = sc.nextDouble();
结合 Pattern 自定义分隔符
Scanner 允许你通过 Pattern 设置自定义分隔符,这在处理特殊格式文本(如逗号、分号、多个空格等)时特别有用。
例如,解析一个由逗号分隔的字符串:
Scanner sc = new Scanner("apple,banana,orange");
sc.useDelimiter(Pattern.compile(","));
while (sc.hasNext()) {
System.out.println(sc.next());
}
输出结果为每行一个水果名。useDelimiter 方法接受一个 Pattern 对象,你可以写更复杂的正则表达式来匹配分隔符。
常见场景:
- 用 "\\s+" 匹配任意空白(比默认更好控制)
- 用 "[,;\\s]+" 匹配逗号、分号或空格
- 用 "\\W+" 匹配所有非单词字符作为分隔符
用 Pattern 提取特定格式内容
Scanner 还提供了 findInLine 和 findWithinHorizon 方法,它们接收 Pattern 参数,在输入中查找符合正则表达式的子串。
比如,从一段文本中提取所有整数:
String text = "I have 3 apples and 15 oranges.";
Scanner sc = new Scanner(text);
Pattern pattern = Pattern.compile("\\d+");
while (sc.findInLine(pattern) != null) {
MatchResult result = sc.match();
System.out.println("Found number: " + result.group());
}
这里 findInLine 尝试在当前行中找到匹配项,match() 返回最近一次匹配的结果。这种方式适合提取嵌入在文本中的结构化信息,如日期、邮箱、ID 等。
实际应用建议
在真实项目中,Scanner + Pattern 常用于日志分析、配置文件解析或用户输入校验。以下是一些经验提示:
- 记得在使用完 Scanner 后关闭它(尤其是读文件时),避免资源泄漏
- 对复杂分隔符优先使用 Pattern.compile 预编译正则,提升性能
- 如果输入格式不稳定,加上 hasNextXXX 判断再取值,防止 NoSuchElementException
- 对于大文件,考虑 BufferedReader 配合 Pattern 更高效;Scanner 更适合中小规模格式化输入
基本上就这些。Scanner 和 Pattern 结合使用,让 Java 的文本解析既灵活又简洁。掌握它们的关键在于理解分隔机制和正则表达式的配合方式。不复杂但容易忽略细节。










