0

0

Java 文件读取中跳过注释、空行与节标题的正确实现方法

心靈之曲

心靈之曲

发布时间:2026-03-14 17:35:03

|

916人浏览过

|

来源于php中文网

原创

Java 文件读取中跳过注释、空行与节标题的正确实现方法

本文详解如何在 Java 中使用 Scanner 读取文本文件时,准确过滤以 // 开头的注释行、空行及形如 [Section] 的节标识行,并正确解析 CSV 格式的工具数据。

本文详解如何在 java 中使用 scanner 读取文本文件时,准确过滤以 `//` 开头的注释行、空行及形如 `[section]` 的节标识行,并正确解析 csv 格式的工具数据。

在实际开发中,读取配置或数据类文本文件(如带注释和分组标记的 CSV)时,常需跳过非有效数据行——包括注释(如 // 或 #)、空行以及 INI 风格的节头(如 [ElectricTool data])。原始代码中 if (!lineOfText.startsWith("/") && !lineOfText.startsWith("[") || lineOfText.isEmpty()) 存在逻辑错误与语义偏差

  • startsWith("/") 只能匹配以单个 / 开头的行,而示例中注释为 //;
  • 逻辑运算符优先级导致条件等价于 (!A && !B) || C,但实际需求是「非空且既不以 // 开头、也不以 [ 开头」——即应使用 && 连接所有保留条件,而非 ||;
  • 未处理 [Section] 行中的空格或大小写变体,也缺乏对多行注释的鲁棒性。

✅ 正确做法是:先排除空行,再用正则精准识别需跳过的行模式。推荐使用 java.util.regex.Pattern 定义清晰规则:

// 跳过:空行、以 // 开头的注释行、以 [ 开头的节声明行(支持前后空格)
Pattern ptrnSkip = Pattern.compile("^\s*(?://|\[).*$|^\s*$");

该正则含义:

  • ^\s*:行首任意空白;
  • (?://|\[):非捕获组,匹配 // 或 [;
  • .*$:后续任意字符至行尾;
  • |^\s*$:或纯空白行(含空字符串);
  • 整体覆盖 // comment、[Section]、[Metadata]、` ` 等典型场景。

完整健壮实现如下(含资源自动关闭、字段解析与日志反馈):

BiLin AI
BiLin AI

免费的多语言AI搜索引擎

下载

立即学习Java免费学习笔记(深入)”;

public void readToolData() {
    Frame myFrame = new Frame();
    FileDialog fileName = new FileDialog(myFrame, "Select the file to load", FileDialog.LOAD);
    fileName.setDirectory("/");
    fileName.setVisible(true);

    if (fileName.getDirectory() != null && fileName.getFile() != null) {
        String filePath = fileName.getDirectory() + fileName.getFile();
        System.out.printf("Selected file: %s%n", filePath);

        File fileData = new File(filePath);
        Pattern ptrnSkip = Pattern.compile("^\s*(?://|\[).*$|^\s*$");
        Pattern ptrnDelim = Pattern.compile("\s*,\s*"); // 智能分割:逗号+可选空格

        try (Scanner scnrFile = new Scanner(fileData)) {
            while (scnrFile.hasNextLine()) {
                String line = scnrFile.nextLine().trim();

                // ✅ 关键过滤:仅处理非空、非注释、非节头的有效数据行
                if (ptrnSkip.matcher(line).matches()) {
                    System.out.printf("Skipped: "%s"%n", line);
                    continue;
                }

                System.out.printf("Processing: "%s"%n", line);
                try (Scanner scnrLine = new Scanner(line).useDelimiter(ptrnDelim)) {
                    // 假设每行固定8字段:name, code, borrowed, onLoan, cost, weight, rechargeable, power
                    if (scnrLine.hasNext()) {
                        String name = scnrLine.next().trim();
                        String code = scnrLine.next().trim();
                        int borrowed = Integer.parseInt(scnrLine.next().trim());
                        boolean onLoan = Boolean.parseBoolean(scnrLine.next().trim());
                        int cost = Integer.parseInt(scnrLine.next().trim());
                        int weight = Integer.parseInt(scnrLine.next().trim());
                        boolean rechargeable = Boolean.parseBoolean(scnrLine.next().trim());
                        String power = scnrLine.next().trim();

                        Tool tool = new Tool(name, code, borrowed, onLoan, cost, weight, rechargeable, power);
                        this.storeTool(tool);
                    }
                } catch (InputMismatchException | NoSuchElementException e) {
                    System.err.printf("Parse error in line "%s": %s%n", line, e.getMessage());
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("File not found: " + e.getMessage());
        }
    } else {
        System.out.println("No file selected.");
    }
}

? 关键注意事项

  • 永远优先使用 try-with-resources:确保 Scanner 在异常或正常结束时自动关闭,避免资源泄漏;
  • 避免 nextLine() 后直接 nextXXX() 导致的换行符残留问题:本例中每行独立解析,无此风险;
  • 字段解析需防御性编程:添加 try-catch 捕获 NumberFormatException/InputMismatchException,防止单行格式错误导致整个读取中断;
  • 生产环境建议升级方案:对于复杂 CSV(含引号、换行、转义),应使用专业库如 Apache Commons CSV 或 OpenCSV,它们内置 RFC4180 兼容解析,远超手动正则的可靠性。

通过上述重构,程序将严格按预期跳过所有 // 注释、[Section] 标题及空行,仅解析有效数据行,同时具备可维护性与健壮性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

241

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

150

2025.10.17

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.3万人学习

Java 教程
Java 教程

共578课时 | 82.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号