PHP读取Excel必须用PhpSpreadsheet,PHPExcel已停维护;需显式映射表头、清洗空格、校验字段、分批处理大文件,并做好错误记录与事务控制。

PHP 读取 Excel 文件必须用 PhpSpreadsheet,别碰 PHPExcel
旧版 PHPExcel 已停止维护,composer 安装会失败或报 Class 'PHPExcel_IOFactory' not found。现在唯一靠谱的选择是 PhpSpreadsheet(phpoffice/phpspreadsheet),它兼容 PHP 7.2+,支持 .xlsx、.xls、.csv,且内存占用更可控。
安装命令:
composer require phpoffice/phpspreadsheet
- 如果项目没用 Composer,别手动下载源码——自动加载和依赖管理会出问题
- Windows 下若提示
zip extension is not loaded,需在php.ini中启用extension=zip -
PhpSpreadsheet默认不读取单元格样式/公式结果,只读值;如需显示公式计算后的值(比如“=A1+B1”显示为数字),得用$cell->getCalculatedValue(),但性能会下降
导入 Excel 时字段映射必须显式定义,不能靠表头顺序硬编码
班级通信录常见字段如:学号、姓名、性别、手机号、家长电话、家庭住址。Excel 表头可能写成“学生姓名”“联系电话(家长)”甚至中英文混用,直接按列索引($row[0], $row[1])极易错位。
正确做法是先读第一行作为键名,再用 array_combine() 构建关联数组:
立即学习“PHP免费学习笔记(深入)”;
$header = $worksheet->rangeToArray('A1:'.$worksheet->>getHighestColumn().'1')[0];
$dataRows = $worksheet->rangeToArray('A2:'.$worksheet->getHighestColumn().$worksheet->getHighestRow());
foreach ($dataRows as $row) {
$record = array_combine($header, $row);
// 后续插入数据库时用 $record['姓名']、$record['手机号'] 等
}
- 注意:Excel 表头若有空格或全角字符(如“姓名 ”),会导致键名不匹配,建议用
trim()和str_replace()清洗 - 如果 Excel 多个 sheet,需用
$spreadsheet->getSheetByName('名单')指定,别默认用第一个 - 空行会被读成全
null的数组,插入前要加array_filter($row, 'strlen')过滤
批量插入通信录数据前,务必做字段校验和去重,否则脏数据直接进库
Excel 导入最常踩的坑不是读取失败,而是把“张三”输成“张 三”、手机号带空格、“男 ”多一个空格、学号填成文本格式导致后续查询失效。
- 手机号统一用
preg_replace('/\D/', '', $phone)去除非数字字符,再判断长度是否为 11 - 学号若为纯数字但 Excel 自动转成科学计数法(如
123456789012显示为1.23457E+11),需在读取时强制设为字符串:$cell->getStyle()->getNumberFormat()->setFormatCode(\PhpOffice\PhpSpreadsheet\Style\NumberFormat::FORMAT_TEXT) - 用
INSERT IGNORE INTO或先SELECT COUNT(*) WHERE stu_id = ?防止重复导入同一学生 - 错误行要记录行号和原因(如“第5行:手机号格式错误”),不能只抛异常中断整个导入
大文件(>5MB 或 >1000 行)导入必须分批 + 设置超时,否则 504 或内存溢出
默认 PHP 配置扛不住整表一次性载入,PhpSpreadsheet 加载 1000 行 xlsx 就可能吃掉 128MB 内存。线上环境必须控制节奏。
- 用
$worksheet->getRowIterator($startRow, $endRow)分段读取,比如每 200 行一批 - 每批处理完调用
gc_collect_cycles()主动触发垃圾回收 - CLI 模式下加
set_time_limit(0);Web 模式下改 Nginxfastcgi_read_timeout和 PHPmax_execution_time - 别在循环里反复 new
PDO实例,复用连接,用beginTransaction()+commit()包裹整批插入
真正难的不是读 Excel,是让导入过程可中断、可追溯、可回滚。比如记录已处理行号到临时表,下次断点续传;或者生成导入日志文件供人工核查。这些细节,比选哪个库重要得多。











