
本文介绍如何改造原有的单目录递归扫描函数,使其支持接收路径数组作为输入参数,一次性扫描多个根目录,并保持原有递归、过滤、目录/文件分类等全部功能。
在实际开发中,常需批量扫描多个不相关的目录(如 ./src、./tests、./assets),而原 scanFiles() 函数仅接受单一字符串路径,每次调用只能处理一个目录。为提升灵活性与复用性,我们可将其升级为支持数组输入的增强版本——即当传入 $directories 为字符串时仍兼容原逻辑,但更推荐统一使用数组形式,以明确语义并避免类型歧义。
以下是重构后的完整实现(已做健壮性增强):
public static function scanFiles($directories, $recursive = true, $listDirs = false, $listFiles = true, $exclude = '') {
$arrayItems = [];
// 兼容旧调用:若传入字符串,自动转为单元素数组
if (is_string($directories)) {
$directories = [$directories];
}
// 确保输入为数组且非空
if (!is_array($directories) || empty($directories)) {
return $arrayItems;
}
foreach ($directories as $directory) {
// 跳过空路径或非字符串路径
if (!is_string($directory) || trim($directory) === '') {
continue;
}
// 验证目录存在且可读
if (!is_dir($directory) || !is_readable($directory)) {
trigger_error("Warning: Directory '{$directory}' does not exist or is not readable.", E_USER_NOTICE);
continue;
}
$handle = opendir($directory);
if (!$handle) {
continue;
}
while (false !== ($file = readdir($handle))) {
// 默认排除项:. / .. / .svn / .git / .md / Thumbs.db / .DS_Store / .html
$skip = preg_match("/(^(([\.]){1,2})$|(\.(svn|git|md))|(Thumbs\.db|\.DS_STORE|\.html))$/iu", $file);
$skipByExclude = false;
if ($exclude && !empty($exclude)) {
$skipByExclude = (bool) preg_match($exclude, $file);
}
if (!$skip && !$skipByExclude) {
$fullPath = $directory . DS . $file;
if (is_dir($fullPath)) {
if ($recursive) {
// 递归扫描子目录(注意:此处传入的是单个子目录字符串,非数组)
$arrayItems = array_merge(
$arrayItems,
self::scanFiles($fullPath, $recursive, $listDirs, $listFiles, $exclude)
);
}
if ($listDirs) {
$arrayItems[] = $fullPath;
}
} else {
if ($listFiles) {
$arrayItems[] = $fullPath;
}
}
}
}
closedir($handle);
}
return $arrayItems;
}✅ 使用示例:
// 扫描多个根目录
$paths = ['src', 'tests', 'assets/css'];
$allFiles = MyScanner::scanFiles($paths, true, false, true, '/^vendor|node_modules$/');
// 仍兼容旧写法(自动转换)
$single = MyScanner::scanFiles('legacy-folder');⚠️ 注意事项:
立即学习“PHP免费学习笔记(深入)”;
- DS 常量需提前定义(如 defined('DS') || define('DS', DIRECTORY_SEPARATOR););
- 正则 $exclude 参数应为合法 PCRE 模式,建议使用定界符包裹(如 '#/vendor/#i'),避免注入风险;
- 递归调用中,子目录路径始终为字符串,确保递归逻辑不受影响;
- 函数内部增加了路径存在性、可读性校验及错误提示,避免静默失败;
- 返回结果为一维扁平数组,如需按源目录分组,可在调用层自行封装。
通过本次改造,scanFiles() 不仅满足了多目录并行扫描的核心需求,还提升了健壮性与向后兼容性,可直接集成至各类资源发现、静态分析或构建工具链中。










