0

0

使用 Go 语言生成大尺寸 CSV 文件

心靈之曲

心靈之曲

发布时间:2025-10-04 11:11:50

|

306人浏览过

|

来源于php中文网

原创

使用 go 语言生成大尺寸 csv 文件

本文介绍了如何使用 Go 语言高效地生成一个指定大小的 CSV 文件,并通过示例代码演示了如何随机生成符合特定格式的数据行,并将其写入文件。该方法适用于需要模拟大数据场景,进行文件读写性能测试等应用。

生成大尺寸 CSV 文件

在进行文件读写性能测试,或者模拟大数据场景时,常常需要生成一个大尺寸的 CSV 文件。Go 语言凭借其高效的性能和简洁的语法,非常适合用于完成这项任务。

核心思路

  1. 定义数据格式: 明确 CSV 文件的每一行的数据格式,例如 prefix:username:timestamp, number。
  2. 随机生成数据: 使用 Go 语言的随机数生成器,生成符合数据格式的随机数据。
  3. 写入文件: 将生成的数据写入到文件中,直到文件达到指定的大小。
  4. 使用 bufio 优化写入: 使用 bufio 包的 Writer,可以显著提高文件写入的效率。

示例代码

以下是一个使用 Go 语言生成 10GB CSV 文件的示例代码:

package main

import (
    "bufio"
    "fmt"
    "math/rand"
    "os"
    "strconv"
    "time"
)

func main() {
    fileSize := int64(10e9) // 10GB
    filePath := "/tmp/largefile.csv" // 修改为实际路径
    f, err := os.Create(filePath)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer f.Close()

    w := bufio.NewWriter(f)
    defer w.Flush()

    prefixes := []string{"login", "logout", "register"}
    names := []string{"jbill", "dkennedy"}
    timeStart := time.Date(2012, 1, 1, 0, 0, 0, 0, time.UTC)
    timeDur := timeStart.AddDate(1, 0, 0).Sub(timeStart)
    rand.Seed(time.Now().UnixNano())
    size := int64(0)

    for size < fileSize {
        prefix := prefixes[rand.Intn(len(prefixes))]
        name := names[rand.Intn(len(names))]
        timestamp := timeStart.Add(time.Duration(rand.Int63n(int64(timeDur)))).Format("2006/01/02")
        number := strconv.Itoa(rand.Intn(100) + 1)
        line := fmt.Sprintf("%s:%s:%s, %s\n", prefix, name, timestamp, number)

        n, err := w.WriteString(line)
        if err != nil {
            fmt.Println(n, err)
            return
        }
        size += int64(n)
    }

    fmt.Printf("Successfully created file: %s, Size: %d bytes\n", filePath, size)
}

代码解释:

科威旅游管理系统
科威旅游管理系统

该软件是以php+MySQL进行开发的旅游管理网站系统。系统前端采用可视化布局,能自动适应不同尺寸屏幕,一起建站,不同设备使用,免去兼容性烦恼。系统提供列表、表格、地图三种列表显示方式,让用户以最快的速度找到所需行程,大幅提高效率。系统可设置推荐、优惠行程,可将相应行程高亮显示,对重点行程有效推广,可实现网站盈利。系统支持中文、英文,您还可以在后台添加新的语言,关键字单独列出,在后台即可快速翻译。

下载
  • fileSize := int64(10e9): 定义目标文件大小为 10GB。
  • os.Create("/tmp/largefile"): 创建文件。请注意替换为实际的文件路径。
  • bufio.NewWriter(f): 创建一个带缓冲的 Writer,提高写入效率。
  • prefixes := []string{"login", "logout", "register"} 和 names := []string{"jbill", "dkennedy"}: 定义了前缀和用户名的数组,用于随机生成数据。
  • timeStart 和 timeDur: 定义了时间范围,用于随机生成时间戳。
  • rand.Seed(time.Now().UnixNano()): 使用当前时间作为随机数种子,确保每次运行生成的随机数不同。
  • 循环生成数据: 在循环中,随机选择前缀、用户名、时间戳和数字,并将它们组合成一行数据,然后写入文件。
  • w.Flush(): 将缓冲区中的数据写入文件。
  • f.Close(): 关闭文件。

编译和运行

将代码保存为 generate_csv.go,然后使用以下命令编译和运行:

go build generate_csv.go
./generate_csv

运行后,会在 /tmp/largefile.csv (或者你指定的路径) 生成一个 10GB 的 CSV 文件。

注意事项

  • 磁盘空间: 确保有足够的磁盘空间来存储生成的文件。
  • 文件路径: 请务必修改代码中的文件路径,指向你希望保存文件的位置。
  • 内存占用 虽然使用了 bufio 进行了缓冲,但生成超大文件时仍然需要注意内存占用。如果内存有限,可以考虑分批生成数据,并定期刷新缓冲区。
  • 错误处理: 代码中包含基本的错误处理,但可以根据实际需求进行更完善的错误处理。
  • 随机数种子: 使用 time.Now().UnixNano() 作为随机数种子,可以保证每次运行生成的随机数不同。 如果需要可重复的结果,可以使用固定的种子。

总结

使用 Go 语言生成大尺寸 CSV 文件是一种高效且灵活的方法。通过合理利用 bufio 包和随机数生成器,可以轻松地生成符合特定格式的大量数据,满足各种测试和模拟需求。 通过修改代码中的参数,可以生成不同大小和格式的 CSV 文件,以适应不同的应用场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

483

2023.08.02

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

33

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

32

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

33

2026.01.31

漫画免费在线观看地址大全
漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站?本合集精选2025-2026年热门平台,涵盖国漫、日漫、韩漫等多类型作品,支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

7

2026.01.31

漫画防走失登陆入口大全
漫画防走失登陆入口大全

2026最新漫画防走失登录入口合集,汇总多个稳定可用网址,助你畅享高清无广告漫画阅读体验。阅读专题下面的文章了解更多详细内容。

11

2026.01.31

php多线程怎么实现
php多线程怎么实现

PHP本身不支持原生多线程,但可通过扩展如pthreads、Swoole或结合多进程、协程等方式实现并发处理。阅读专题下面的文章了解更多详细内容。

1

2026.01.31

php如何运行环境
php如何运行环境

本合集详细介绍PHP运行环境的搭建与配置方法,涵盖Windows、Linux及Mac系统下的安装步骤、常见问题及解决方案。阅读专题下面的文章了解更多详细内容。

0

2026.01.31

php环境变量如何设置
php环境变量如何设置

本合集详细讲解PHP环境变量的设置方法,涵盖Windows、Linux及常见服务器环境配置技巧,助你快速掌握环境变量的正确配置。阅读专题下面的文章了解更多详细内容。

0

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.4万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号