Go语言中如何正确地按Unicode字符（rune）遍历字符串

心靈之曲

发布时间：2025-10-23 09:28:33

225人浏览过

来源于php中文网

原创

Go语言中如何正确地按Unicode字符（rune）遍历字符串

在go语言中，字符串是utf-8编码的字节序列。直接通过索引`str[i]`访问会得到单个字节而非unicode字符（rune）。要正确地按unicode字符遍历字符串，应使用`for...range`循环。该循环会自动解析utf-8编码，每次迭代返回字符的起始字节位置和对应的`rune`值，是处理多字节字符的推荐方法。

理解Go语言字符串与Rune

Go语言中的字符串是不可变的字节序列，其内部采用UTF-8编码存储Unicode字符。这意味着一个Unicode字符可能由一个或多个字节组成。当我们尝试使用传统的for i := 0; i

使用for...range循环遍历Rune

Go语言为解决这一问题提供了专门的for...range循环机制，它能够正确地按Unicode字符（rune）遍历字符串。当for...range用于字符串时，它会自动处理UTF-8解码，并在每次迭代中返回两个值：

pos (int)：当前rune在字符串中的起始字节位置。
char (rune)：当前解析出的Unicode字符。rune是Go语言中int32的别名，用于表示一个Unicode码点。

这种方式确保了即使字符串中包含多字节字符，我们也能正确地获取并处理每一个完整的Unicode字符。

以下是一个使用for...range循环遍历包含多字节字符字符串的示例：

立即学习“go语言免费学习笔记（深入）”；

MusicLM

谷歌平台的AI作曲工具，用文字生成音乐

下载

package main

import "fmt"

func main() {
    s := "日本語" // 包含日文的字符串
    fmt.Println("遍历字符串:", s)

    // 使用 for...range 循环按 rune 遍历
    for pos, char := range s {
        fmt.Printf("字符 '%c' (rune值: %U) 始于字节位置 %d\n", char, char, pos)
    }

    fmt.Println("\n直接按字节遍历（不推荐用于rune处理）:")
    // 对比：直接按字节遍历
    for i := 0; i < len(s); i++ {
        fmt.Printf("字节位置 %d: 值 %d ('%c')\n", i, s[i], s[i])
    }
}

运行上述代码，您将看到如下输出：

遍历字符串: 日本語
字符 '日' (rune值: U+65E5) 始于字节位置 0
字符 '本' (rune值: U+672C) 始于字节位置 3
字符 '語' (rune值: U+8A9E) 始于字节位置 6

直接按字节遍历（不推荐用于rune处理）:
字节位置 0: 值 229 ('å')
字节位置 1: 值 165 ('¥')
字节位置 2: 值 181 ('µ')
字节位置 3: 值 229 ('å')
字节位置 4: 值 156 ('œ')
字节位置 5: 值 172 ('¬')
字节位置 6: 值 230 ('æ')
字节位置 7: 值 150 ('–')
字节位置 8: 值 138 ('Š')

从输出中可以看出：

for...range循环正确地识别了三个日文字符，并返回了它们的rune值和起始字节位置。例如，“日”字符的起始字节位置是0，而“本”字符的起始字节位置是3，这表明“日”字符占用了3个字节。
直接按字节遍历时，str[i]返回的是原始的字节值，当尝试将其格式化为字符时，可能会显示乱码或不正确的字符，因为它没有考虑UTF-8的多字节编码特性。

注意事项与总结

Go字符串的本质：牢记Go字符串是UTF-8编码的字节序列。这意味着len(str)返回的是字节数，而不是字符数。要获取字符数，可以转换为[]rune类型再获取长度：len([]rune(str))。
rune的用途：rune类型是处理Unicode字符的正确方式。在Go中，当您需要处理单个Unicode字符时，例如在文本分析、字符匹配或字符串操作中，都应该使用rune。
性能考量：for...range循环在内部执行UTF-8解码，这比简单的字节索引操作会带来轻微的性能开销。但在绝大多数情况下，这种开销是微不足道的，并且为了代码的正确性和可读性，强烈推荐使用for...range来遍历rune。只有在极度性能敏感且确定字符串只包含单字节字符的场景下，才可能考虑直接按字节遍历。

总之，在Go语言中，处理字符串中的Unicode字符时，始终优先使用for...range循环。它提供了一种简洁、安全且符合Go语言哲学的方式来遍历字符串中的rune，避免了直接操作字节可能导致的编码问题。

如何在 Go 中安全、规范地执行任意 shell 命令字符串

Go 语言中 goroutine 通过无缓冲通道实现完美交替执行的原理详解

高效拼接字节数组：避免重复分配，重用预分配缓冲区

Go 语言中 Goroutine 通过无缓冲通道实现精确交替执行的原理详解

Go 进程重启后无法响应 Ctrl+C 的根本原因与解决方案

相关标签:

go go语言编码字节 ai 日本 for 字符串 char int 循环 Go语言 len ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Golang下载Google Drive公共文件：重定向与URL编码的挑战下一篇：Go Goroutines与协程：深入理解并发模型差异与实现机制

作者最新文章

Pinterest 裁员约 15%，探索采用开源 AI 模型降低开发成本

2026-01-29 16:12

如何用 Python 实现一个支持浮点结果的简易大小写敏感计算器

2026-01-29 16:20

Intel显卡战未来！官方确认：XeSS 3多帧生成下月支持B580

2026-01-29 16:25

猫眼电影如何添加电影收藏

2026-01-29 16:51

如何在 Jupyter Notebook 中正确导入自定义类

2026-01-29 16:53

恋小帮搜索话术怎么找

2026-01-29 16:57

如何在运行时通过全限定类名动态反序列化 JSON 并调用 save 方法

2026-01-29 16:59

脉脉怎么开会员-脉脉会员开通方法

2026-01-29 17:00

电脑端如何下载安装网易云音乐客户端

2026-01-29 17:07

美团外卖怎么用

2026-01-29 17:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

298

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1502

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

624

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

633

2024.03.22