strings.TrimSpace只去除ASCII空白符,不处理中文全角空格;需用unicode.IsSpace或正则\s\u3000清理;截取中文须转[]rune避免乱码;批量替换优先Replacer;大量拼接用strings.Builder。

strings.TrimSpace 为什么没去掉中文空格?
strings.TrimSpace 只识别 ASCII 空格、制表符、换行等(\t\n\v\f\r ),对全角空格( )、中文标点、零宽字符完全无效。
- 若需清理中英文混合空白,先用
strings.Map过滤 Unicode 空白类字符:cleaned := strings.Map(func(r rune) rune { if unicode.IsSpace(r) { return -1 } return r }, s) - 更稳妥的做法是用正则:
regexp.MustCompile(`[\s\u3000]+`).ReplaceAllString("", s)(\u3000是全角空格) - 注意
strings.TrimSpace不修改原字符串,返回新字符串——Go 字符串不可变是根本前提
如何安全地截取中文字符串而不乱码?
直接用 s[0:5] 按字节切会破坏 UTF-8 编码,导致乱码。必须按 rune 切。
- 转成
[]rune再切:runes := []rune(s); sub := string(runes[0:min(5, len(runes))]) - 但大字符串频繁转
[]rune有性能开销;高频场景可用utf8string库或手写遍历计数 - 别用
len(s)判断“长度”——那是字节数;中文字符占 3 字节,len("你好") == 6,而len([]rune("你好")) == 2
strings.ReplaceAll 和 strings.Replacer 哪个更快?
批量替换时,strings.Replacer 明显更快,尤其当替换规则 ≥ 3 条或字符串较长时。
-
strings.ReplaceAll每次调用都从头扫描,多次调用 = 多次遍历 -
strings.NewReplacer("a", "x", "b", "y", "c", "z")预编译为状态机,一次扫描完成全部替换 - 注意:
Replacer不支持正则,只做字面量替换;且替换是无序的(不会递归应用结果) - 若只需单次简单替换,用
ReplaceAll更直觉;别为省几微秒过早优化
拼接大量字符串,+、fmt.Sprintf、strings.Builder 哪个合适?
小量拼接(≤ 3 次)用 + 完全没问题;动态大量拼接必须用 strings.Builder。
立即学习“go语言免费学习笔记(深入)”;
-
+在编译期可优化为单次分配,但运行时每次+都产生新字符串,O(n²) 分配开销 -
fmt.Sprintf带格式解析和反射开销,比纯拼接慢 3–5 倍,仅在需格式化时用 -
strings.Builder底层复用[]byte,WriteString零拷贝,Grow可预估容量避免扩容 - 示例:
var b strings.Builder b.Grow(1024) b.WriteString("hello") b.WriteString(name) s := b.String()










