最直接方式是用 Path("dir").rglob("*.py") 获取所有.py文件;需加 is_file() 过滤目录,用 "venv" not in p.parts 排除虚拟环境,大小写无关时可用 p.suffix.lower() == ".py"。

用 pathlib.Path 递归获取所有 .py 文件,最直接的方式是使用 rglob() 方法。
用 rglob() 匹配 .py 文件
rglob() 是 Path 对象的内置方法,支持通配符、自动递归遍历子目录,语义清晰且无需手动处理路径拼接或循环逻辑。
- 写法简洁:
Path("your_dir").rglob("*.py") - 返回的是生成器,内存友好;如需列表可转为
list() - 匹配的是文件名(含扩展名),不区分大小写?注意:默认区分大小写(
.py不会匹配.PY)
只保留普通文件(排除目录)
rglob("*.py") 可能返回同名目录(极少见但合法),稳妥起见建议过滤出真正的文件:
- 用
is_file()判断:[p for p in Path("src").rglob("*.py") if p.is_file()] - 也可链式调用:
list(Path("src").rglob("*.py"))再过滤,但推荐一步到位
忽略特定目录(如 __pycache__ 或 venv)
rglob() 本身不支持排除路径,但可通过条件过滤实现:
- 检查路径中是否包含敏感段:
if "__pycache__" not in str(p) and "venv" not in str(p) - 更健壮的方式是用
parts检查路径组件:if "__pycache__" not in p.parts and "venv" not in p.parts - 组合示例:
[p for p in Path("src").rglob("*.py") if p.is_file() and "venv" not in p.parts]
补充:大小写无关匹配(如需兼容 .PY、.Py)
rglob() 不支持正则或 ignore-case,但可以分两次查再去重:
list(Path("src").rglob("*.py")) + list(Path("src").rglob("*.PY")) + list(Path("src").rglob("*.Py"))- 或统一转小写判断:
[p for p in Path("src").rglob("*") if p.is_file() and p.suffix.lower() == ".py"](稍慢但灵活)










