0

0

Golang实战:简单的CSV文件编辑器_读取写入与数据处理

P粉602998670

P粉602998670

发布时间:2026-03-06 09:45:41

|

267人浏览过

|

来源于php中文网

原创

go读csv时需手动处理utf-8 bom、校验utf-8合法性、正确处理io.eof边界、依赖csv.writer自动引号转义,四者缺一不可。

golang实战:简单的csv文件编辑器_读取写入与数据处理

读 CSV 时 encoding/csv 默认不处理 BOM,中文字段乱码怎么办

Go 的 csv.NewReader 不会自动跳过 UTF-8 BOM,如果文件以 \uFEFF 开头,第一列字段名或首行数据前会多出不可见字符,导致 header[0] 看似是 "name",实际是 "\uFEFFname",后续 map 查找失败。

  • 读取前先用 ioutil.ReadFile(Go 1.16+ 改用 os.ReadFile)加载字节,检查并截掉 BOM:
    data, _ := os.ReadFile("data.csv")
    if len(data) >= 3 && data[0] == 0xEF && data[1] == 0xBB && data[2] == 0xBF {
        data = data[3:]
    }
  • 再用 bytes.NewReader(data) 包装,传给 csv.NewReader,避免在流式读取中反复检测
  • 别依赖 strings.TrimSpace 清洗字段名——BOM 不是空白符,TrimSpace 对它无效

写 CSV 时 WriteAllwrite error: bad utf-8

错误不是编码问题,而是你传了含非法 UTF-8 字节的字符串,比如从二进制文件误读、C 语言字符串零截断残留、或某些数据库导出字段混入控制字符。Go 的 csv.WriterWriteAll 前不做 UTF-8 校验,但底层 io.WriteString 会在写入时 panic。

  • 写入前对每行每字段做轻量校验:
    import "unicode/utf8"
    func isValidUTF8(s string) bool {
        return utf8.ValidString(s)
    }
    遇到 false 就替换或丢弃,别硬写
  • 别用 strings.ToValidUTF8(不存在),Go 没提供自动修复函数;可用 strings.ToValidUTF8 是 .NET 的,Go 里得自己替换:用 bytes.ReplaceAll([]byte(s), []byte{0xFF, 0xFF}, []byte("?")) 这类粗暴方式,或引入 golang.org/x/text/transform 做安全转义
  • 注意:MySQL 导出的 CSV 若设了 CHARSET=binary,字段可能含 \x00,必须清洗,否则必炸

csv.Read 逐行读比 ReadAll 更省内存,但容易漏掉最后一行

当 CSV 文件末尾没有换行符时,csv.Reader.Read 在读完最后一行后返回 io.EOF,但此时该行数据其实已成功解析到你传入的 []string 中——很多人只检查 err == io.EOF 就跳出循环,结果丢掉最后一行。

AI神器大全
AI神器大全

AI工具集合导航站

下载
  • 正确模式是:先 err := r.Read(record),再判断 err != nil && err != io.EOF 才报错;err == io.EOFlen(record) > 0 时,这行有效,要处理
  • ReadAll 内部就是这么做的,但它把所有行全 load 到内存,10MB CSV 可能占 30MB+ 内存(Go slice 预分配 + 字符串 header 复制)
  • 逐行读时,记得复用 record 切片:
    record := make([]string, 0, 16)
    for {
        record, err := r.Read(record[:0]) // 复用底层数组
        if err != nil {
            if err == io.EOF { break }
            log.Fatal(err)
        }
        // 处理 record
    }

修改某列后写回 CSV,字段含逗号或换行符却没加引号

csv.Writer 默认只在字段含逗号、双引号、换行符时自动加双引号,但如果你手动拼接字符串(比如 fmt.Sprintf("%s,%s", a, b))再传给 Write,Writer 不会识别内部结构,直接原样写入,Excel 打开就错行。

立即学习go语言免费学习笔记(深入)”;

  • 永远用 w.Write([]string{a, b, c}),别自己拼 CSV 字符串——Writer 会按 RFC 4180 规则自动转义和包引号
  • 字段含双引号时,Writer 自动把它变成两个双引号 "",这是标准行为,别提前 replace 成 \" 或删掉,否则 Excel 解析失败
  • 如果必须手拼(极少见),至少用 strconv.Quote 包裹每个字段:
    quoted := strconv.Quote(field)
    // 注意:Quote 加的是双引号,且会转义内部双引号和控制符

CSV 看似简单,但 BOM、非法 UTF-8、EOF 边界、引号转义这四点,任意一个没兜住,下游 Excel 或数据库导入就静默失败——它们不报错,只丢数据。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

209

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

245

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

354

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

214

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

407

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

449

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

200

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1335

2025.06.17

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

19

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 5.9万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号