filepath.Walk 是最稳妥的递归遍历方式,自动处理符号链接、权限错误和路径拼接;需手动过滤隐藏文件,回调中返回 filepath.SkipDir 可跳过目录,而 os.ReadDir 更轻量但仅非递归。

用 filepath.Walk 递归遍历目录最稳妥
Go 标准库的 filepath.Walk 是专为递归遍历设计的,它自动处理符号链接、权限错误、路径拼接等边界情况,比手写递归更可靠。它会按深度优先顺序访问每个文件/子目录,并把路径和 os.FileInfo 传给回调函数。
常见错误是误以为 filepath.Walk 会跳过隐藏文件(如 .git)——它不会,所有条目都会进入回调;若需过滤,必须在回调里手动判断 info.Name() 是否以 . 开头。
- 回调函数签名必须是
func(path string, info os.FileInfo, err error) error - 若回调返回非
nil错误,遍历会立即中止(除非是filepath.SkipDir) - 想跳过某个目录(比如
node_modules),在回调中检测到后直接return filepath.SkipDir - 注意:如果目标路径本身不存在或无读取权限,
filepath.Walk会直接返回该错误,不会进回调
用 os.ReadDir(Go 1.16+)做非递归遍历更轻量
os.ReadDir 返回 []fs.DirEntry,只读取单层目录内容,不触发任何递归逻辑,性能好、内存占用低,适合“列出当前目录下所有文件名”这类场景。
它和已废弃的 os.Readdir 的关键区别在于:os.ReadDir 不保证返回的条目已按名称排序,且 DirEntry 的 Info() 方法是惰性调用——只有真正需要文件元信息(如大小、修改时间)时才触发系统调用,避免不必要的开销。
立即学习“go语言免费学习笔记(深入)”;
- 若只需文件名,用
entry.Name()即可,无需调用entry.Info() - 若需判断是否为目录,优先用
entry.IsDir(),比entry.Info().IsDir()更快 - 注意:它不解析符号链接,
IsDir()对软链接返回false,即使链接指向一个目录 - 旧版 Go(os.Readdir,但要留意它返回的是
[]os.FileInfo,每次调用都强制读取全部元数据
手写递归容易踩的坑:循环引用与并发安全
自己用 os.ReadDir + 递归调用实现遍历看似简单,但有两个典型问题:一是遇到符号链接构成的循环路径(如 A → B → A),会导致无限递归栈溢出;二是若在 goroutine 中并发遍历不同子树,共享的变量(如计数器、结果切片)未加锁会引发数据竞争。
- 防循环引用:维护一个已访问路径的
map[string]bool,每次进入新路径前先检查是否已存在(注意用filepath.EvalSymlinks归一化路径) - 并发遍历时,避免直接向全局切片
append;推荐用带缓冲 channel 收集结果,或用sync.Mutex保护写操作 - 递归深度过深时(如超 1000 层),可能触发 goroutine 栈耗尽;此时应改用显式栈(
stack := []string{root})+ for 循环模拟递归 - 别在递归函数里用
defer关闭文件句柄——os.ReadDir返回的DirEntry不需要关闭,它不是文件句柄
遍历大目录时的性能敏感点
当目录包含数万以上条目时,filepath.Walk 的默认行为可能变慢,因为它的回调是同步串行执行的,且每次都要构造完整路径字符串。实际压测中,纯 I/O 时间占比反而不高,大量开销来自字符串拼接和频繁的系统调用封装。
- 用
os.ReadDir+ 显式栈替代filepath.Walk,可减少约 20–30% 总耗时(实测 Linux ext4 上 50w 文件) - 避免在回调中反复调用
filepath.Join;可预先计算好父路径,用path + "/" + name拼接(确保路径不含尾部/) - 若只需统计数量或校验存在性,完全没必要调用
info.Size()或info.ModTime()——这些字段在DirEntry.Info()内部仍需一次stat系统调用 - Windows 上注意长路径限制(>260 字符),必要时启用
\\?\前缀,但这要求路径必须是绝对路径且不能含相对符(..)
filepath.Walk 就够了;只有对延迟或内存极其敏感,或者需要精细控制遍历策略(比如按文件类型分流处理),才值得投入精力手写优化版本。路径归一化、符号链接处理、错误恢复这三块,最容易在交接或重构时被忽略。










