0

0

如何在 Go 中逐字符读取文件

霞舞

霞舞

发布时间:2026-03-11 17:16:02

|

236人浏览过

|

来源于php中文网

原创

如何在 Go 中逐字符读取文件

本文介绍在 Go 中高效逐字符(rune)读取大文件的三种主流方法,重点推荐 bufio.Reader.ReadRune() 方案,并通过实测对比性能与代码简洁性,适用于 JSON 等流式解析场景。

本文介绍在 go 中高效逐字符(rune)读取大文件的三种主流方法,重点推荐 `bufio.reader.readrune()` 方案,并通过实测对比性能与代码简洁性,适用于 json 等流式解析场景。

在处理大型 JSON 文件等场景时,避免将整个文件加载到内存中至关重要。Go 的字符串和文本处理以 Unicode rune 为基本单位(而非字节),因此“逐字符读取”实际应理解为“逐 rune 读取”,以正确支持 UTF-8 编码的多字节字符(如中文、俄文、emoji 等)。Go 标准库提供了多种方式实现该需求,其中最直接、高效且语义清晰的是 bufio.Reader.ReadRune() 方法。

✅ 推荐方案:bufio.Reader.ReadRune()

ReadRune() 每次调用返回一个 rune、其 UTF-8 编码字节数(size)及错误。它内部自动处理 UTF-8 解码,无需手动拼接字节,API 简洁,性能优异(实测 23 MB 文件耗时仅 0.65 秒)。以下是完整示例:

package main

import (
    "bufio"
    "fmt"
    "io"
    "log"
    "os"
)

func readRuneByRune(filename string) error {
    file, err := os.Open(filename)
    if err != nil {
        return fmt.Errorf("failed to open %s: %w", filename, err)
    }
    defer file.Close()

    reader := bufio.NewReader(file)
    for {
        r, size, err := reader.ReadRune()
        if err != nil {
            if err == io.EOF {
                break // 正常结束
            }
            return fmt.Errorf("read rune failed: %w", err)
        }
        // 示例:打印字符及其 UTF-8 字节长度
        fmt.Printf("rune: %q (size: %d)\n", string(r), size)
    }
    return nil
}

func main() {
    if len(os.Args) < 2 {
        log.Fatal("usage: go run main.go <filename>")
    }
    if err := readRuneByRune(os.Args[1]); err != nil {
        log.Fatal(err)
    }
}

? 注意:ReadRune() 返回的 rune 是 int32 类型,需用 string(r) 转为可显示字符串;size 表示该 rune 在原始字节流中占用的字节数(1–4),对调试或流控有参考价值。

纳米漫剧流水线
纳米漫剧流水线

360推出的国内首个工业级AI漫剧生产平台

下载

⚠️ 其他方案对比与注意事项

  • bufio.Scanner + ScanRunes 分割器
    虽然可行(调用 scanner.Split(bufio.ScanRunes) 后循环 scanner.Scan()),但每次迭代需额外调用 scanner.Bytes() 或 scanner.Text(),引入切片分配开销,实测比 ReadRune() 慢约 3.7 倍(2.40 s vs 0.65 s),且代码更冗长,不推荐用于纯逐 rune 场景。

  • io.ReadFull / file.Read() 逐字节读取
    绝对避免:无法正确处理 UTF-8 多字节字符,会导致乱码(如将中文拆成多个无效字节),违背“逐字符”本意。

  • 内存与错误处理要点

    • ReadRune() 是流式操作,内存占用恒定(仅缓冲区大小,默认 4KB),天然适合超大文件;
    • 务必区分 io.EOF(正常结束)与其他 error(如磁盘 I/O 错误、编码损坏),不可一概而论;
    • 若需回退一个 rune(例如解析器需要 peek),可使用 reader.UnreadRune(r),但注意 UnreadRune 最多支持一次未读取。

总结

对于需要流式、低内存、正确 Unicode 支持的逐字符处理任务,bufio.Reader.ReadRune() 是 Go 中最平衡的选择:性能最优、代码最简、语义最准。它既规避了全量加载的风险,又避免了底层字节操作的复杂性,是构建高性能 JSON 流解析器、日志分析器或自定义文本处理器的理想基石。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

247

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

214

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

409

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

200

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1438

2025.06.17

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.1万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号