0

0

简易文件搜索器实战_File递归遍历文件夹与字符串匹配练习

P粉602998670

P粉602998670

发布时间:2026-02-12 17:46:02

|

704人浏览过

|

来源于php中文网

原创

绝大多数情况下应使用file.listfiles(),但必须先判dir.isdirectory()&&dir.canread(),再判children!=null,否则符号链接、权限不足等场景会返回null导致nullpointerexception。

简易文件搜索器实战_file递归遍历文件夹与字符串匹配练习

File.list() 还是 File.listFiles()?别掉进空指针陷阱

直接说结论:绝大多数情况下,该用 File.listFiles(),但必须先判空、再判是否为目录——否则一碰符号链接、权限不足或已删除路径,listFiles() 就返回 null,后续调用直接 NullPointerException

常见错误现象是程序在某些子目录突然崩溃,报错堆栈里只看到 java.lang.NullPointerException,没线索。其实八成是这里没防护。

  • File.list() 返回 String[],对不存在/无权限目录返回 nulllistFiles() 返回 File[],同样返回 null,不是空数组
  • 必须写成:if (dir.isDirectory() && dir.canRead()) { File[] children = dir.listFiles(); if (children != null) { ... } }
  • Windows 下遇到重定向符号链接(如 Junction)可能返回 null,Linux 下遇到挂载点权限变化也一样

递归遍历时怎么避免死循环?软链接和循环挂载是真坑

Java 的 File API 本身不区分硬链、软链、挂载点,递归时如果遇到自己指向自己的软链接(比如 /home/user/project -> /home/user/project),或者跨设备挂载的循环路径(如 /mnt/backup → /home 又被挂回),就会无限深入,直到栈溢出或文件句柄耗尽。

最稳妥的做法不是“检测链接”,而是记录已访问路径的规范路径(getCanonicalPath()),用 Set<string></string> 缓存防重。

  • 每次进入目录前,先调用 dir.getCanonicalPath(),检查是否已在 visited 集合中
  • 不要用 getAbsolutePath(),它不解析符号链接,无法识别循环
  • 注意 getCanonicalPath() 可能抛 IOException(如路径不存在),需捕获处理
  • 性能影响很小,一次哈希查表,比反复 stat 开销低得多

字符串匹配用 String.contains() 还是 Pattern?看场景别硬套正则

搜索文件名或内容时,90% 的需求只是“包含某几个字”或“以某前缀开头”,这时候用 Pattern 不仅慢,还容易因未转义 .* 等字符导致误匹配甚至拒绝服务(ReDoS)。

Music Muse
Music Muse

Create professional music with Music Muse's AI song generator.

下载

只有明确需要模糊匹配(如 “log_202[3-5]_*.txt”)或跨行搜索内容时,才值得上正则。

  • 文件名匹配优先用 fileName.startsWith("log_")fileName.contains("error")
  • 内容搜索若只需简单子串,用 line.indexOf(keyword) >= 0matches() 快 3–5 倍
  • 真要用正则,务必预编译:private static final Pattern PATTERN = Pattern.compile(Pattern.quote(keyword)),避免每次新建
  • 读取大文件时,别把整文件 load 到内存再 match,用 BufferedReader 逐行 scan

为什么搜索结果顺序总“不对”?File.listFiles() 不保证顺序

很多人发现搜索结果一会儿按字母排、一会儿乱序,以为是 bug。其实 File.listFiles() 的返回顺序完全取决于底层文件系统(ext4、NTFS、APFS)和 JVM 实现,JDK 文档白纸黑字写着:“no guarantee is made as to the order”。想稳定排序,必须自己做。

尤其当你要做“找最近修改的前 10 个日志”或“按名称分页显示”时,顺序不可控会直接导致逻辑错乱。

  • 排序前务必确认数组非 null,否则 Arrays.sort() 直接 NPE
  • 按名称排序:Arrays.sort(files, Comparator.comparing(File::getName))
  • 按修改时间倒序:Arrays.sort(files, (a, b) -> Long.compare(b.lastModified(), a.lastModified()))
  • 注意 lastModified() 精度在 FAT32 上只有 2 秒,在某些 NAS 上可能更粗,别拿它做精确去重

递归 + 排序 + 安全防护这三块,漏掉任何一块,看似能跑通的小工具,上线后早晚在某个边缘路径上卡死或错漏。特别是路径规范和空值判断,写一次少 debug 三天。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

708

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

243

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

705

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

806

2023.08.22

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

399

2023.09.04

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

351

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

326

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

508

2023.08.03

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号