
Java里用hashCode()直接映射URL会撞车吗
会,而且非常容易。Java的Object.hashCode()是32位有符号整数,最多21亿个值,但URL数量远超这个量级,短时间生成几百条就可能重复。更麻烦的是,它不保证跨JVM、跨版本一致,本地测试正常,上线后哈希值突变,跳转全错。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 别用
String.hashCode()或Objects.hash()直接当短码——它们不是为唯一性设计的 - 改用确定性哈希算法,比如
MessageDigest.getInstance("SHA-256"),取前8字节再转十六进制,冲突概率降到可忽略 - 如果追求极简且能接受少量碰撞(比如内部工具),至少加一层数据库唯一约束+重试逻辑,不能只靠哈希“赌运气”
Base64编码后怎么去掉+、/和=这些URL不友好字符
标准Base64用+、/作符号,=作填充,但它们在URL路径里要被编码成%2B之类,难看还可能被某些代理截断。你得用URL安全变种(RFC 4648 §5)。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 别手写替换——容易漏掉边界情况(比如末尾多个
=) - 用
Base64.getUrlEncoder().withoutPadding().encodeToString(byte[]),JDK 8+原生支持 - 如果还在用JDK 7,引入
commons-codec,调用Base64.encodeBase64URLSafeString(byte[]) - 注意:URL安全Base64输出只含
A-Z、a-z、0-9、-、_,长度和原Base64一致,无需额外截断
短码长度定6位够不够?要不要存原始URL的MD5做索引
6位URL安全Base64有62⁶ ≈ 568亿种组合,理论够用;但实际要考虑业务增长、缓存失效、批量导入等场景。单纯靠长度预估风险很低,但没索引查得慢。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 短码字段必须建唯一索引——这是防重复插入的最后防线
- 原始URL的MD5(或SHA-256)也建议存,并建索引,用于快速判重:“这条长链接缩过没?”
- 别把MD5当主键或短码来源——它只是辅助索引,真正跳转靠短码查,避免哈希长度和短码逻辑耦合
- 如果QPS高,加一层Redis缓存:
short_code → long_url,TTL设短点(比如1小时),减轻DB压力
Spring Boot里怎么让/abc123直接302跳转到原始URL
不是所有路径都要进Controller——静态资源、健康检查等会干扰。必须精准匹配短码格式,且不能影响其他路由。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 用
@GetMapping("/{shortCode:^[a-zA-Z0-9_-]{4,8}$}"),正则限定长度和字符集,排除误匹配 - Controller里先查缓存,查不到再查DB,查不到返回404(别302到首页或错误页)
- 跳转用
response.sendRedirect(longUrl),别用redirect:前缀——后者走Spring MVC重定向链路,多一次解析开销 - 记得设
HttpServletResponse.SC_MOVED_TEMPORARILY(302)而非301——方便后期调试和修改目标地址
最常被忽略的是缓存头:短码跳转响应里别带Cache-Control: public,否则CDN可能缓存错误跳转。默认不设即可,浏览器不会缓存302。










