Go字符串底层是UTF-8字节流,len()返回字节数而非字符数;字符串不可变,所有“修改”实为新建;高频拼接用strings.Builder,改中文字符需[]rune转换。

字符串长度和遍历:别再用 len() 数中文字符了
Go 字符串底层是 UTF-8 字节流,len("你好") 返回的是 6(每个中文占 3 字节),不是你想要的“2 个字符”。直接用索引或 for i := 0; i 遍历,遇到中文会切出乱码字节,甚至 panic。
- 要获取真实字符数:用
utf8.RuneCountInString(s)或len([]rune(s)) - 安全遍历每个 Unicode 字符(包括 emoji、中文):必须用
for _, r := range s(自动按 rune 拆分) - 需要带索引的字符位置?转成
[]rune再循环:rs := []rune(s); for i, r := range rs { ... },但注意这会分配新内存
查找与判断:大小写、空串、边界情况全得想清楚
strings.Contains("GOLANG", "go") 返回 false —— 它严格区分大小写。别急着 strings.ToLower 全转小写再查,某些 Unicode 字符(比如土耳其语的 i)会出错。
- 忽略大小写的正确姿势:用
strings.ContainsFold(),它做了 Unicode 归一化,语义更准 -
strings.Split("a,,b", ",")返回[]string{"a", "", "b"},中间那个空字符串容易导致index out of range;如需过滤,用strings.FieldsFunc(s, func(r rune) bool { return r == ',' })或手动len(part) > 0判断 -
strings.TrimSuffix("foo.tar.gz", ".gz")只剥一层后缀,不会继续剥.tar;真要多层清理,得自己写循环
修改与拼接:字符串不可变,不是“改”,是“造新”
你不能写 s[0] = 'H',Go 会编译报错。所有“修改”操作本质都是构造新字符串 —— 这既是安全保证,也是性能隐患的源头。
- 单次替换/截取:放心用
strings.ReplaceAll()、strings.TrimSpace()等,它们返回新串,原串不动 - 高频拼接(比如日志聚合、模板渲染):禁用
+循环,改用strings.Builder,先Grow()预估容量,再反复WriteString() - 想改某个字符?必须走
[]rune转换路径:rs := []rune(s); rs[1] = 'x'; s = string(rs);千万别用[]byte改中文,会破坏 UTF-8 编码
格式化与类型转换:别让 fmt.Sprintf 混进热路径
fmt.Sprintf("%s:%d", name, age) 写起来爽,但它要解析格式字符串、做反射、分配临时对象 —— 在高并发或高频调用场景(比如 HTTP 中间件打日志),开销明显高于纯字符串拼接。
立即学习“go语言免费学习笔记(深入)”;
- 简单连接 + 类型已知:优先
strconv.Itoa()转数字,再用Builder拼 - 需要对齐、精度控制(如
%6.2f)、或结构体调试输出:fmt.Sprintf仍是首选 - 用户输入清洗后比较?别直接
==,先strings.TrimSpace()+strings.EqualFold(),兼顾空白和大小写
最常被跳过的细节是:所有 strings 函数都不改原串,也不关心你传进来的是不是 nil 字符串指针 —— 它们只处理 string 类型值。如果你在函数里接收 *string,记得先解引用再操作,否则可能 panic 或逻辑错位。










