深入理解Go语言字符串：遍历字符（Rune）与字节的实践指南

霞舞

发布时间：2025-12-04 17:15:22

218人浏览过

来源于php中文网

原创

深入理解Go语言字符串：遍历字符（Rune）与字节的实践指南

本文旨在详细阐述go语言中字符串的内部表示（utf-8编码）以及如何正确地遍历字符串切片中的每个字符串并打印其单个字符。我们将区分字节与字符（rune）的概念，并通过示例代码演示使用`for...range`语句进行字符级迭代的正确方法，同时对比直接访问字节可能带来的误解，帮助开发者高效、准确地处理go语言中的文本数据。

Go语言字符串与UTF-8编码基础

在Go语言中，字符串是不可变的字节序列。它默认采用UTF-8编码来表示Unicode字符。这意味着：

ASCII字符：例如 'a', 'Z', '1' 等，占用一个字节。
非ASCII字符：例如中文、日文、特殊符号等，可能占用两个到四个字节。

因此，一个Go字符串的len()函数返回的是其字节长度，而非字符数量。直接通过索引str[i]访问字符串时，获取到的是位于该索引位置的字节，而不是一个完整的字符（rune）。

常见误区：直接索引与字节访问

初学者在尝试遍历字符串中的单个字符时，常会遇到以下代码模式：

func main() {
    strslice := make([]string, 4, 5)
    strslice[0] = "hello"
    strslice[1] = "go"
    strslice[2] = "lang"
    strslice[3] = "whatsup"
    // 错误示例：试图通过len(strslice[i])控制外部循环，并直接打印字符串
    for i := 0; i < len(strslice[i]); i++ { // 这里的len(strslice[i])会导致索引越界或逻辑错误
        fmt.Printf("slice is %c \n", strslice[i]) // %c 格式化符期望一个rune或byte，而非整个字符串
    }
}

这段代码存在几个主要问题：

立即学习“go语言免费学习笔记（深入）”；

循环条件错误：len(strslice[i]) 是当前循环迭代到的字符串的字节长度，而不是 strslice 切片的长度。这会导致外部循环条件逻辑混乱，甚至在 i 增加时尝试访问不存在的 strslice[i]，从而引发运行时错误。
类型不匹配：fmt.Printf("%c \n", strslice[i]) 试图将一个完整的字符串 strslice[i] 用 %c（期望单个字符或字节）格式化输出，这通常不会得到预期的结果，甚至可能导致编译错误或运行时恐慌。
字节与字符混淆：即使我们修正了循环条件，直接通过 str[i] 访问字符串，对于包含多字节字符的字符串，str[i] 也只能获取到字符的一部分字节，而非完整的字符。

正确的字符（Rune）遍历方法

Go语言为我们提供了专门用于遍历Unicode字符（rune）的for...range循环。当对字符串使用 for...range 时，它会按序解码UTF-8字节序列，并为每次迭代提供一个Unicode代码点（rune）及其在字符串中的起始字节索引。

以下是遍历字符串切片并打印每个字符串中所有字符的正确方法：

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

package main

import "fmt"

func main() {
    strslice := make([]string, 5, 5)
    strslice[0] = "hello"
    strslice[1] = "go"
    strslice[2] = "lang"
    strslice[3] = "whatsup"
    strslice[4] = "Hello, 世界" // 包含多字节字符的字符串

    fmt.Println("--- 遍历字符串切片中的每个字符 ---")
    // 外部循环：遍历字符串切片
    for _, s := range strslice {
        // 内部循环：遍历当前字符串s中的每个字符（rune）
        for _, c := range s {
            fmt.Printf("%c ", c) // %c 格式化符可以正确打印rune
        }
        fmt.Printf("\n") // 每个字符串的字符打印完毕后换行
    }
}

输出示例：

--- 遍历字符串切片中的每个字符 ---
h e l l o 
g o 
l a n g 
w h a t s u p 
H e l l o ,   世 界

在这个示例中：

外部 for _, s := range strslice 循环遍历了 strslice 中的每一个字符串 s。
内部 for _, c := range s 循环则针对当前的字符串 s，逐个提取其Unicode字符（rune）。变量 c 的类型是 rune（实际上是 int32 的别名），代表一个Unicode代码点。
fmt.Printf("%c ", c) 能够正确地将 rune 打印为对应的字符。

区分字节与字符（Rune）的实践

为了更深入地理解字节和字符的区别，特别是当字符串包含非ASCII字符时，我们可以通过以下示例进行对比：

package main

import "fmt"

func main() {
    str := "Hello, 世界"

    fmt.Println("--- 按字节遍历字符串 ---")
    // 遍历字符串的每个字节
    for i := 0; i < len(str); i++ {
        // str[i] 获取的是第i个字节，其类型为byte (uint8)
        // 对于多字节字符，这会打印出其UTF-8编码的单个字节
        fmt.Printf("'%c' ", str[i]) 
    }
    fmt.Printf("\n")

    fmt.Println("--- 按字符（Rune）遍历字符串 ---")
    // 遍历字符串的每个Unicode字符（rune）
    for _, c := range str {
        // c 获取的是一个完整的Unicode字符（rune），类型为rune (int32)
        fmt.Printf("'%c' ", c)
    }
    fmt.Printf("\n")
}

输出示例：

--- 按字节遍历字符串 ---
'H' 'e' 'l' 'l' 'o' ',' ' ' 'ä' '¸' '' 'ç' '' '' 
--- 按字符（Rune）遍历字符串 ---
'H' 'e' 'l' 'l' 'o' ',' ' ' '世' '界'

从输出中可以清晰地看到：

当使用 str[i] 遍历时，对于 "世界" 这两个汉字，由于它们是多字节字符，str[i] 打印出了其底层的UTF-8编码字节，这些字节单独显示时可能无法形成可识别的字符（如 'ä', '¸' 等乱码）。
当使用 for _, c := range str 遍历时，程序正确地识别并打印出了完整的 "世" 和 "界" 字符。

总结与最佳实践

Go语言字符串是UTF-8编码的字节序列。 这一点是理解Go字符串操作的关键。
使用 for...range 遍历字符串是处理Unicode字符的最佳实践。 它能够正确地解码UTF-8序列，并提供完整的Unicode代码点（rune）。
len(string) 返回的是字节长度，而非字符数量。 如果需要获取字符数量，可以使用 unicode/utf8 包中的 utf8.RuneCountInString(s) 函数。
直接通过索引 str[i] 访问字符串会获取到字节。 只有当确定字符串只包含ASCII字符时，这种方式才等同于获取字符。在处理包含多字节字符的字符串时，应避免直接使用索引进行字符级操作。
rune 类型（int32 的别名）代表一个Unicode代码点。 在需要处理单个字符的场景下，例如字符判断、大小写转换等，通常会使用 rune 类型。

通过掌握这些概念和实践，开发者可以更加高效和准确地在Go语言中进行字符串处理，尤其是在面对国际化和多语言应用时。

如何在 GoWorkers 中将日志持久化到文件

Go 中如何通过包结构实现接口与请求/响应结构体的优雅组织

Go 接口无法嵌套结构体：正确组织服务与数据模型的实践方案

Go 接口内无法嵌入结构体：正确组织服务与数据模型的实践方案

如何在 Go 中通过反射动态调用任意签名的函数

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

printf用法大全

php中文网为大家提供printf用法大全，以及其他printf函数的相关文章、相关下载资源以及各种相关课程，供大家免费下载体验。

2023.06.20

fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同，printf输出到标准输出流，而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

309

2023.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1228

2024.03.22