url.parse解析无scheme的url时不会报错但host为空,需手动补全scheme;pathescape用于路径中文编码,queryescape用于查询参数;rawquery与query()不自动同步;fragment需手动提取解析。

url.Parse 解析失败却没报错?检查 scheme 是否缺失
Go 的 url.Parse 对格式极其严格:没有 scheme(如 http://、https://)或 // 开头,它会把整个字符串当路径处理,返回的 *url.URL 中 Host 为空、Path 却塞了全部内容——看起来“成功”,实则解析失效。
常见错误现象:url.Parse("example.com/path") 返回 Host=="",后续调 u.Query().Get("k") 总是空,因为查询参数根本不在 RawQuery 里。
- 正确写法必须带 scheme:
url.Parse("https://example.com/path?k=v") - 若输入是纯域名+路径(如用户输入框),手动补
https://再解析;别用url.ParseRequestURI,它要求绝对 URI 且不接受相对路径 - 注意
url.Parse不校验域名合法性,url.Parse("http:///path")也能过,但Host是空字符串
query.Values().Encode() 编码后中文乱码?别漏掉 url.PathEscape
url.Values 的 Encode() 方法只对查询参数值做 application/x-www-form-urlencoded 编码,它默认使用 UTF-8,但不会对路径段(path segment)里的中文做任何处理——如果把中文直接拼进 Path,请求大概率 400 或 404。
使用场景:构建 API 路径如 /api/user/张三,或带中文参数的下载链接。
立即学习“go语言免费学习笔记(深入)”;
- 路径中的中文必须用
url.PathEscape单独编码:"/user/" + url.PathEscape("张三") -
url.Values.Encode()只用于RawQuery部分,例如url.Values{"name": []string{"张三"}}.Encode()→name=%E5%BC%A0%E4%B8%89 - 不要混用:
url.PathEscape和url.QueryEscape底层都调url.escape,但转义规则不同(斜杠是否保留),不能互相替代
url.URL 结构体里 RawQuery 和 Query() 返回值为什么不一样?
RawQuery 是原始未解析的查询字符串(如 "a=1&b=2"),而 Query() 返回的是已解码的 url.Values 映射。两者不是实时同步的:修改 Query() 返回值不会自动更新 RawQuery,反之亦然。
性能影响:每次调 u.Query() 都会重新解析 RawQuery,若高频读取且 URL 查询串大,会有小开销。
- 想改查询参数并生成新 URL,应操作
u.Query()后再赋回:q := u.Query(); q.Set("t", "123"); u.RawQuery = q.Encode() - 直接改
u.RawQuery(如字符串拼接)会导致u.Query()下次调用时解析出错,尤其含重复键或非法编码时 -
url.Values是map[string][]string,Get()只取第一个值,All()才拿到全部;别误以为Get()能合并多值
net/url 不支持解析 fragment(# 后部分)?得手动切
url.Parse 会把 fragment(即 # 后内容)存进 Fragment 字段,但它**完全不解析**这部分:不会拆 query、不会解码、不会进 Query()。很多前端路由或单页应用用 # 传参,后端用 Go 解析时容易漏掉。
容易踩的坑:以为 url.Parse("https://a.b/c#k=v") 后能用 u.Query().Get("k") 拿到值——实际为 ""。
- fragment 必须手动提取:
frag := strings.TrimPrefix(u.Fragment, "?"),再用url.ParseQuery(frag)解析 - 注意 fragment 编码方式和 query 不同:空格是
%20而非+,url.ParseQuery能正确处理 - 服务端通常不该依赖 fragment,它是客户端行为;但若对接旧系统或埋点需求,就得自己多这一刀
URL 解析真正麻烦的从来不是语法,而是 scheme、path、query、fragment 四块边界模糊时的手动归位——尤其当输入来源不可控,比如用户粘贴、日志截断、第三方接口返回残缺地址。










