最常用方式是比对文件MD5值,需先检查file_exists()和is_readable();大文件应改用hash_file('sha256'),并结合filesize()、格式解析及流式校验综合判断损坏。

PHP如何用md5_file()校验文件完整性
最常用也最直接的方式,就是比对文件的 MD5 值。只要源文件没被篡改或损坏,重新计算出的 md5_file() 结果应与原始记录完全一致。
注意:md5_file() 读取整个文件内容计算哈希,对大文件(如 >500MB)会明显阻塞、吃内存,且不适用于流式或分块上传未完成的文件。
- 确保文件存在且可读:调用前先用
file_exists()和is_readable()检查,否则md5_file()返回false,容易误判为“损坏” - 避免时区或 umask 干扰:哈希只依赖文件字节流,和权限、时间戳无关,这点很干净
- 示例用法:
$expected = 'a1b2c3...'; // 预存的正确 MD5 $actual = md5_file('/path/to/file.dat'); if ($actual === false || $actual !== $expected) { echo "文件可能损坏或不存在"; }
大文件场景下改用hash_file('sha256', ...)
MD5 理论上已不推荐用于安全校验(碰撞风险),且 PHP 默认开启的 md5_file() 在超大文件时可能触发内存限制(memory_limit)或超时(max_execution_time)。这时换用 hash_file() 更稳妥,它底层支持流式读取,对内存更友好。
-
hash_file('sha256', $path)比md5_file()稍慢,但抗碰撞性强,适合关键文件(如安装包、固件) - 若文件路径含中文或特殊字符,需确保传入的是 UTF-8 编码的字符串;Windows 下路径反斜杠要转义或用正斜杠
- 遇到
hash_file(): Failed to open stream错误,大概率是路径错误或 open_basedir 限制,不是文件损坏本身
判断“损坏”不能只靠哈希——还要检查基本文件状态
哈希匹配只能说明“字节未变”,但无法识别以下情况:文件系统级损坏(如 ext4 journal 异常)、磁盘坏道导致读取随机失败、文件被截断但末尾恰好凑出相同哈希(极小概率但存在)。
立即学习“PHP免费学习笔记(深入)”;
- 用
fopen($path, 'rb')+fread()尝试读取开头和结尾各几 KB,观察是否报failed to read from stream或返回长度异常 - 对比
filesize()是否与预期大小一致:若明显偏小(比如下载中断),哈希可能仍“巧合匹配”,但文件实际不可用 - 对图片、PDF、ZIP 等格式,可调用对应扩展做轻量解析验证:例如
getimagesize()对图像返回false,zip_open()打开失败,都比纯哈希更能反映“功能级损坏”
上传过程中实时校验:别等文件写完再算哈希
用户上传大文件时,如果等到 move_uploaded_file() 完成后再调用 hash_file(),就失去了拦截损坏上传的机会。更优做法是在接收阶段边写边算。
- 用
fopen(..., 'ab')追加写入临时文件,同时用hash_init('sha256')+hash_update_stream()流式更新哈希值 - 避免把整个 POST body 读进内存:用
php://input或$_FILES的临时路径配合fopen('php://input', 'rb')分块处理 - 务必在最后校验
hash_final()结果,并与前端传来的X-Expected-SHA256Header 或表单字段比对——这样能发现网络传输中的比特翻转
md5_file() 返回值。











