优先用 YEAR()/MONTH() 等离散函数替代 DATE_FORMAT 用于 WHERE/GROUP BY,仅在 SELECT 展示层使用;高频过滤应建生成列加索引;跨库统一用 ISO 8601 格式。

MySQL 里用 DATE_FORMAT 还是转成字符串再拼接?
在 MySQL 中,DATE_FORMAT 是唯一原生日期格式化函数,没有 TO_CHAR 或 FORMAT。它底层调用 C 的 strftime,性能尚可,但每行都触发函数计算,无法走索引——如果 WHERE 条件里写 DATE_FORMAT(create_time, '%Y-%m') = '2024-01',全表扫描基本跑不掉。
常见错误是拿它做分组依据:比如 GROUP BY DATE_FORMAT(order_time, '%Y-%m'),虽然能跑,但比先用 YEAR(order_time) 和 MONTH(order_time) 拆解再组合慢 15%~25%,尤其数据量超百万时更明显。
- 能用
YEAR()/MONTH()/DAY()等离散函数替代的,优先拆解 - 格式化仅用于展示层(如 SELECT 输出),别塞进 WHERE、GROUP BY、ORDER BY
- 需要高频按年月过滤?建生成列:
ALTER TABLE orders ADD COLUMN ym CHAR(7) STORED AS (DATE_FORMAT(order_time, '%Y-%m')),再加索引
PostgreSQL 的 TO_CHAR 为什么比 MySQL 快一点?
PostgreSQL 的 TO_CHAR 是用 C 实现的,支持更多模板(如 'FMMonth YYYY' 自动去空格),且对常量模板做了轻量缓存。实测在 100 万行数据上格式化为 'YYYY-MM-DD',比 MySQL DATE_FORMAT 快约 8%~12%。
但它依然不能下推到索引——除非你配合表达式索引。例如:CREATE INDEX idx_orders_ym ON orders ((TO_CHAR(order_time, 'YYYY-MM')));,之后 WHERE TO_CHAR(order_time, 'YYYY-MM') = '2024-01' 就能命中索引。
- 模板字符串必须完全一致,
'YYYY-MM'和'yyyy-mm'是两个不同模板,缓存不共享 - 避免在
TO_CHAR里嵌套其他函数,比如TO_CHAR(order_time + INTERVAL '1 day', 'YYYY-MM-DD'),会失去模板缓存优势 - 如果只取年份或季度,直接用
EXTRACT(YEAR FROM order_time)更快,也支持索引
SQL Server 的 FORMAT 函数要慎用
SQL Server 的 FORMAT 是 .NET String.Format 的包装,每次调用都要跨 CLR 边界,开销远高于原生函数。在 50 万行数据上格式化日期,比 PostgreSQL TO_CHAR 慢 3 倍以上,比 MySQL DATE_FORMAT 慢 2.5 倍。
瑞宝通B2B系统使用当前流行的JAVA语言开发,以MySQL为数据库,采用B/S J2EE架构。融入了模型化、模板、缓存、AJAX、SEO等前沿技术。与同类产品相比,系统功能更加强大、使用更加简单、运行更加稳 定、安全性更强,效率更高,用户体验更好。系统开源发布,便于二次开发、功能整合、个性修改。 由于使用了JAVA开发语言,无论是在Linux/Unix,还是在Windows服务器上,均能良好运行
它唯一优势是文化感知(如自动本地化星期名、月份名),但代价是不可预测的延迟和内存分配压力。线上 OLTP 场景中,看到 FORMAT(create_date, 'd', 'zh-CN') 出现在 SELECT 列表里,基本可以判定是性能瓶颈点。
- 纯 ISO 格式(如
'yyyy-MM-dd')一律改用CONVERT(VARCHAR, create_date, 120),快 5~8 倍 -
FORMAT不支持统计信息,优化器无法估算结果集大小,易导致执行计划劣化 - 从 SQL Server 2022 开始,
STRING_AGG+CONVERT组合在聚合场景下更稳,别为了“写得像 C#”而选FORMAT
跨数据库迁移时最常踩的坑
开发在 PostgreSQL 写了 TO_CHAR(created_at, 'DD/MM/YYYY'),上线前发现 MySQL 不认,临时改成 DATE_FORMAT(created_at, '%d/%m/%Y')——看起来一样,但时区行为不同:PostgreSQL 默认按 session timezone 解析输入,MySQL DATE_FORMAT 对输入时间不做时区转换,只格式化已存在的 datetime 值。
另一个隐形陷阱是 null 处理:TO_CHAR(NULL, 'FM999') 返回 NULL;FORMAT(NULL, 'N0') 在 SQL Server 中抛异常;DATE_FORMAT(NULL, '%Y') 在 MySQL 中返回 NULL。三者对空值的容忍度不一致,联表查询时容易漏数据。
- 统一用 ISO 8601 格式(
'YYYY-MM-DD HH24:MI:SS'类)降低差异,各库都支持且语义明确 - 格式化逻辑尽量提到应用层,数据库只负责存储和精确计算,别让它干“美工”的活
- 如果必须数据库格式化,建视图封装,并在注释里写明该函数在目标库的等效写法










