PHP strtotime()不支持中文或乱码日期字符串,需先检测编码、转码、替换中文为英文格式,或用DateTime::createFromFormat()精确解析;严重乱码时提取数字字段并校验。

PHP strtotime() 解析含中文/乱码字符串失败
直接传入带中文日期的字符串(如 "2024年5月20日" 或 UTF-8 但被误判为 GBK 的乱码串)给 strtotime(),结果返回 false 或错误时间戳。这不是函数 bug,而是它只支持英文格式("2024-05-20"、"May 20, 2024")和部分 ISO 格式,对中文、乱码零兼容。
- 先用
mb_detect_encoding($str, ['UTF-8', 'GBK', 'BIG5'], true)检查原始字符串真实编码,别信文件声明或 HTTP header - 若检测出是
GBK但字符串显示为乱码(如"2024锟斤拷5锟斤拷20锟斤拷"),说明它本是 GBK 编码,却被当 UTF-8 解析了 —— 需先iconv('GBK', 'UTF-8//IGNORE', $str)转正 - 若确认是 UTF-8 但含中文,不能硬喂
strtotime(),得先用str_replace()或正则把中文字符替换成对应英文或标准分隔符
用 DateTime::createFromFormat() 精确匹配中文日期格式
比 strtotime() 更可控:你告诉它“这个字符串长这样”,它就按规则解析,不猜、不依赖 locale。关键在格式字符串写对,且输入必须严格匹配。
- 中文年月日需用字面量:格式串写成
'Y年n月j日',对应字符串"2024年5月20日";注意n(无前导零月)和j(无前导零日)不能写成m/d - 如果字符串混有空格或全角符号(如
"2024年 5月 20日"),格式串里对应位置也得加全角空格或用\s(但createFromFormat不支持正则,只能字面匹配) - 解析失败时返回
false,不是异常,记得检查:$date = DateTime::createFromFormat('Y年n月j日', $str); if (!$date || $date->format('Y年n月j日') !== $str) { throw new InvalidArgumentException('日期格式不匹配'); }
乱码字符串无法修复时,用正则提取数字再拼装
当字符串严重损坏(如 "2024Ô¬5Ô¬20Ô¬" 或 "2024?5?20?"),编码已不可逆,强行转码只会更糟。此时放弃“还原原意”,转而提取可用数字字段。
- 用
preg_match('/(\d{4})[^\d]*(\d{1,2})[^\d]*(\d{1,2})/', $str, $matches)抓年、月、日三组数字,忽略中间乱码 - 校验数值合理性:
$matches[1] >= 1970 && $matches[1] ,$matches[2]在 1–12,$matches[3]在 1–31 - 拼成标准格式再进
DateTime:$ymd = sprintf('%04d-%02d-%02d', $matches[1], $matches[2], $matches[3]); $date = new DateTime($ymd);
时区与 date_default_timezone_set() 的隐性影响
即使字符串成功转成 DateTime 对象,输出或比较时若没设时区,可能因服务器默认时区(如 Europe/London)导致时间偏移,看着像“又乱了”。
立即学习“PHP免费学习笔记(深入)”;
- 解析前统一设时区:
date_default_timezone_set('Asia/Shanghai');,或在构造时显式指定:$date = new DateTime($ymd, new DateTimeZone('Asia/Shanghai')); - 避免用
date()直接格式化对象,改用$date->format('Y-m-d H:i:s'),它尊重对象自带时区 - 跨系统传时间戳时,确认双方都按 UTC 存储和解析 —— 乱码问题常和时区混用一起爆发,容易误判











