
本文详解如何使用正则表达式在 json 字符串中安全、准确地掩码邮箱字段值,解决因上下文限制导致的普通邮箱正则失效问题,并提供可直接运行的 java 示例与关键注意事项。
在处理敏感数据时,对 JSON 格式的 API 响应或日志进行邮箱掩码(如 test@example.com → t***@example.com)是常见需求。但直接复用单邮件字符串的正则(如 (?JSON 的引号结构和嵌套内容破坏了原始正则的上下文假设,尤其是 (?固定长度或有限长度的 (?
因此,必须重构正则逻辑,使其能:
- 精确定位 "email":"..." 结构内的邮箱值;
- 在引号内、@ 符号前的合法字符范围内逐个替换;
- 避免跨字段误匹配(如匹配到 name 或其他含 @ 的字符串)。
✅ 推荐正则表达式(Java 兼容版):
"(?<=email\":\"[^\\s\"]{1,100})[a-zA-Z0-9](?=[^\\s\"@]*@)"? 表达式解析:
- (?有限长度正向后瞻
确保当前字符左侧紧邻 "email":",且其后最多 100 个非空白、非双引号字符(即邮箱值开头区域)。{1,100} 可根据实际邮箱最大长度调整(通常 50–100 足够)。 - [a-zA-Z0-9]:匹配邮箱本地部分(@ 前)中任意一个字母或数字(即需掩码的目标字符)。
- (?=[^\\s\"@]*@):正向先行断言
确保该字符右侧直到 @ 之间只含非空白、非引号、非 @ 的字符(防止跨字段或 HTML 标签干扰),从而精准锚定邮箱主体。
? 完整 Java 示例(可直接运行):
public class EmailMasker {
public static void main(String[] args) {
String jsonString = "{ \"name\":\"jhon\", \"email\":\"test.ing%[email protected]\" }";
// ✅ 关键:使用有限后瞻 + 安全前瞻的掩码正则
String masked = jsonString.replaceAll(
"(?<=email\":\"[^\\s\"]{1,100})[a-zA-Z0-9](?=[^\\s\"@]*@)",
"*"
);
System.out.println(masked);
// 输出:{ "name":"jhon", "email":"t***.***%**@gmail.com" }
}
}⚠️ 重要注意事项:
- 不适用于嵌套 JSON 或多层转义:本方案假设 JSON 是扁平、合法且未双重转义的字符串。若 JSON 来自不可信源,建议先用 Jackson / Gson 解析为对象,再对 email 字段做业务逻辑掩码(更安全、更健壮)。
- HTML 邮箱保护标签兼容性:示例中 是 Cloudflare 邮箱混淆,其 data-cfemail 属性为编码值。本正则作用于解码后的可见文本(即 test.ing%[email protected]),故需确保输入字符串已还原为可读邮箱格式。
- 性能提示:{1,100} 量词比 * 更高效;避免使用 .* 或无界回溯,防止灾难性回溯(Catastrophic Backtracking)。
- 扩展建议:如需掩码规则更灵活(如保留前2后2位),可改用 Pattern.compile().matcher().appendReplacement() 进行分组捕获与定制替换。
总结:在 JSON 中掩码邮箱,核心是用有限后瞻定位字段边界,用前瞻锚定邮箱结构。该正则兼顾准确性、安全性与 Java 兼容性,是生产环境轻量级脱敏的实用方案。










