
本文详解如何通过遍历比对实现文件中非负整数的去重读取与数组填充,重点修复因布尔标志变量作用域错误导致的重复判定失效问题,并提供健壮、可复用的实现方案。
本文详解如何通过遍历比对实现文件中非负整数的去重读取与数组填充,重点修复因布尔标志变量作用域错误导致的重复判定失效问题,并提供健壮、可复用的实现方案。
在 Java 中从文件读取整数并填充至数组时,若需保留唯一值(去重),核心逻辑在于:每读取一个有效整数,需遍历已存入数组的元素进行比对;仅当未发现相同值且数组未满时,才执行写入。然而,原代码中 boolean ID = false 被声明在方法顶部,导致其状态在多次循环中持续累积——一旦某次检测到重复,ID 变为 true 后便无法自动重置,后续所有数字均被误判为重复,最终仅填充 11 个元素(实际应为 10 个唯一值)。
关键修复点在于:将 ID 声明移至 while 循环内部,确保每次处理新数字前其初始值均为 false。以下是修正后的完整实现:
private static int read(String inFileName, int[] list) {
int size = 0;
Scanner inFile = null;
int trash = 0;
int uniqueCount = 0;
int dupeCount = 0;
int lineCount = 0;
try {
inFile = new Scanner(new File(inFileName));
while (inFile.hasNext()) {
lineCount++;
boolean isDuplicate = false; // ✅ 每轮重置标志位
try {
int val = inFile.nextInt();
if (val < 0) {
trash++;
continue;
}
// 遍历已存元素,检查是否已存在
for (int i = 0; i < size; i++) {
if (list[i] == val) {
isDuplicate = true;
dupeCount++;
break; // 找到即退出,提升效率
}
}
// 仅当非重复且数组有空间时写入
if (!isDuplicate && size < list.length) {
list[size] = val;
size++;
uniqueCount++;
}
} catch (InputMismatchException e) {
trash++;
inFile.nextLine(); // 清除非法行,避免死循环
}
}
System.out.printf("Lines processed: %d | Unique: %d | Duplicates: %d | Invalid/Negative: %d%n",
lineCount, uniqueCount, dupeCount, trash);
} catch (FileNotFoundException e) {
System.err.println("Error: File '" + inFileName + "' not found.");
return 0;
} finally {
if (inFile != null) inFile.close();
}
return size;
}✅ 关键改进说明:
- isDuplicate 在每次循环开始时初始化,确保判定逻辑独立、准确;
- break 提前终止内层循环,避免冗余比较;
- 使用 printf 格式化输出,增强可读性;
- finally 块中关闭 Scanner,防止资源泄漏;
- 错误处理更严谨:FileNotFoundException 使用 System.err 输出,区分错误与普通日志。
⚠️ 注意事项:
立即学习“Java免费学习笔记(深入)”;
- 该方案时间复杂度为 O(n²),适用于小规模数据(如题中 ≤20 个数)。若文件极大,建议改用 HashSet
缓存已见值,将查找优化至 O(1) 平均时间; - 数组长度由用户指定,需确保 list.length ≥ 预期唯一数个数,否则会静默截断;
- 负数和非整数内容统一归为“trash”,可根据需求扩展为跳过、记录或抛出自定义异常。
综上,正确管理局部变量的作用域是保障逻辑正确性的基础。本实现兼顾清晰性、健壮性与教学示范性,可直接集成至主程序中调用。










