phpspreadsheet 是读取 excel 的唯一稳定方案,需用 composer 安装、php 7.4+ 运行,大文件应设 setreaddataonly(true),注意日期、类型判断、编码及上传路径安全。

用 PhpSpreadsheet 读取 Excel 最稳,别碰 PHPExcel
PHP 官方已弃用 PHPExcel,它不维护、不兼容 PHP 8+,且内存泄漏严重。现在唯一靠谱的选择是它的继任者 PhpSpreadsheet —— 它是纯 PHP 实现、支持 .xlsx 和 .xls(需额外扩展)、能处理公式和样式。
安装方式:composer require phpoffice/phpspreadsheet。注意:不要手动下载 ZIP 或用老旧的 require_once 引入一堆文件,Composer 自动加载才是正解。
- 如果项目还在用 PHP 7.2 以下,
PhpSpreadsheet会报错 —— 它最低要求 PHP 7.4 -
.xls(Excel 97–2003)默认不支持,需额外装phpoffice/phpspreadsheet的依赖markbaker/complex和markbaker/matrix,但更建议让前端统一导出.xlsx - 大文件(>5MB)直接
load()容易 OOM,得用IOFactory::load()+setReadDataOnly(true)跳过样式和公式
读取时卡死或内存爆掉?关掉样式和公式解析
默认行为是把字体、边框、公式结果全读进内存,一个 10MB 的表格可能吃掉 500MB 内存。真实业务里,90% 场景只需要数值。
正确做法是在加载前设置只读数据:
立即学习“PHP免费学习笔记(深入)”;
use PhpOffice\PhpSpreadsheet\IOFactory;
$reader = IOFactory::createReader('Xlsx');
$reader->setReadDataOnly(true); // 关键!
$spreadsheet = $reader->load('data.xlsx');
-
setReadDataOnly(true)不影响数字、字符串、日期值,但跳过所有单元格样式、合并单元格信息、公式本身(只读计算结果) - 如果要读日期,记得调用
$cell->getFormattedValue(),否则返回 Excel 底层序列号(如 44562),不是2022-01-01 - 用
$spreadsheet->getActiveSheet()->toArray()一次性转数组最方便,但整表加载仍占内存;逐行遍历可用getRowIterator()+getCellIterator()流式处理
中文乱码、空值识别错、数字变科学计数?检查单元格类型和编码
Excel 里看似“文本”的单元格,PHP 可能识别成 numeric 类型;而中文列名或内容乱码,通常不是编码问题(Excel 本身是 UTF-16),而是 PHP 输出或数据库写入环节没设好字符集。
- 读取前加
mb_internal_encoding('UTF-8')没用 ——PhpSpreadsheet内部已处理 Unicode,乱码大概率出在你 echo 到浏览器或插入 MySQL 时 - 空单元格默认返回
null,但有些模板会填入空字符串''或空白符,建议用trim((string)$cell->getValue()) === ''统一判空 - 数字被转成科学计数法(如
1.23456789E+12),是因为 PHP 自动转了 float。解决方法:对数字列,用$cell->getDataType() === \PhpOffice\PhpSpreadsheet\Cell\DataType::TYPE_NUMERIC判断后,改用$cell->getCalculatedValue()或强制格式化为字符串
从上传临时文件读取失败?路径和权限比想象中敏感
$_FILES['file']['tmp_name'] 是临时路径,PhpSpreadsheet 能直接读,但常见错误是路径拼错、扩展名硬编码、或没检查上传是否成功。
- 别写死
load('upload.xlsx'),必须用$_FILES['file']['tmp_name'],且先确认$_FILES['file']['error'] === UPLOAD_ERR_OK - 扩展名不能只看
$_FILES['file']['name']后缀,用户可伪造。应配合finfo_open(FILEINFO_MIME_TYPE)验证 MIME 类型是否为application/vnd.openxmlformats-officedocument.spreadsheetml.sheet(xlsx)或application/vnd.ms-excel(xls) - Linux 下如果 Apache/Nginx 用户无权读临时目录(比如
/tmp被noexec挂载),会报Could not open ... for reading!—— 此时需改用move_uploaded_file()先移到可读目录再 load
Excel 解析真正的复杂点不在读,而在“怎么定义哪列是手机号、哪列允许为空、怎么把身份证号当字符串而非数字”。这些规则没法靠库自动猜,得自己写校验逻辑,而且越晚做越难补救。











