0

0

Go语言中uint64的存储与变长编码解析

DDD

DDD

发布时间:2025-10-17 11:51:05

|

758人浏览过

|

来源于php中文网

原创

Go语言中uint64的存储与变长编码解析

go语言中,uint64类型在内存中始终占用8字节存储空间。然而,在使用binary.putuvarint进行变长编码时,一个uint64值最多可能占用10字节。这并非类型存储的矛盾,而是变长编码为了保持兼容性和设计简洁性所做的权衡,通过使用最高有效位作为延续位来指示后续字节。

在Go语言中,基本数据类型的大小是明确且固定的。根据Go语言规范,uint64类型被定义为64位无符号整数,其在内存中的标准存储大小为8字节。这与处理器架构和内存对齐无关,是语言层面的保证。

例如,Go语言的类型大小保证如下:

类型 字节大小
byte, uint8, int8 1
uint16, int16 2
uint32, int32, float32 4
uint64, int64, float64, complex64 8
complex128 16

这意味着无论uint64变量存储的值是0、100还是math.MaxUint64,它在程序内存中分配的存储空间都固定是8字节。

变长编码(Varint)与binary.PutUvarint

然而,当涉及到数据的序列化或网络传输时,我们常常会遇到变长编码(Varint)的概念。Varint是一种紧凑的表示数字的方式,对于较小的数字,它会占用较少的字节,而对于较大的数字,它会占用更多的字节。Go语言标准库中的encoding/binary包提供了PutUvarint函数,用于将uint64值编码为Varint格式。

立即学习go语言免费学习笔记(深入)”;

binary.PutUvarint函数可以将一个uint64值编码到字节切片中,并返回写入的字节数。令人困惑的是,对于一个uint64值,该函数最多可能写入10个字节,而不是通常认为的8字节。

为什么Uvarint会占用更多字节?

这种差异源于Varint编码的设计原则。Varint编码通常使用每个字节的最高有效位(MSB)作为“延续位”:如果MSB为1,表示这个数字还有后续字节;如果MSB为0,表示这是数字的最后一个字节。每个字节的其余7位用于存储实际的数值数据。

对于一个64位的uint64值,它最多需要64位来表示。如果每个字节提供7位有效数据,那么理论上ceil(64 / 7) = 10个字节是足够的。这意味着最坏情况下,一个uint64值需要10个字节来编码。

Build AI
Build AI

为您的业务构建自己的AI应用程序。不需要任何技术技能。

下载

Go语言的binary包中的设计说明对此有详细解释:

// 设计说明:
// 64位值最多需要10个字节。编码可以更紧凑:
// 一个完整的64位值需要一个额外的字节来保存第63位。
// 相反,前一个字节的MSB可以用来保存第63位,
// 因为我们知道不会有超过64位。
// 这是一个微不足道的改进,可以将最大编码长度减少到9个字节。
// 然而,它会打破MSB总是“延续位”的不变性,
// 从而使格式与更大数字(例如128位)的Varint编码不兼容。

这段设计说明揭示了关键点:

  1. 最高10字节: 为了表示64位数据,并且每个字节只贡献7位有效数据(因为1位是延续位),因此需要10个字节。
  2. 设计权衡: 理论上,可以通过特殊处理(例如,让最后一个字节的MSB不作为延续位,而是作为第63位数据)将最大编码长度减少到9字节。
  3. 兼容性与不变性: 然而,Go语言的binary包选择不这样做,是为了保持一个重要的不变性:MSB始终作为延续位。这种设计使得Varint格式能够兼容更大数字的编码(如未来的128位或更多位),而不会引入特殊的边缘情况处理,从而简化了编码和解码逻辑。

示例代码

以下代码演示了uint64在内存中的大小以及binary.PutUvarint的编码行为:

package main

import (
    "encoding/binary"
    "fmt"
    "unsafe"
)

func main() {
    var val uint64 = 12345678901234567890 // 一个较大的uint64值
    var smallVal uint64 = 123             // 一个较小的uint64值

    // 1. 检查uint64在内存中的大小
    fmt.Printf("uint64类型在内存中占用 %d 字节。\n", unsafe.Sizeof(val))

    // 2. 使用binary.PutUvarint进行编码
    buf := make([]byte, binary.MaxVarintLen64) // MaxVarintLen64 为 10

    // 编码大值
    nBig := binary.PutUvarint(buf, val)
    fmt.Printf("值 %d (大值) 编码后占用 %d 字节: %x\n", val, nBig, buf[:nBig])

    // 编码小值
    nSmall := binary.PutUvarint(buf, smallVal)
    fmt.Printf("值 %d (小值) 编码后占用 %d 字节: %x\n", smallVal, nSmall, buf[:nSmall])

    // 编码最大uint64值
    maxUint64 := ^uint64(0) // math.MaxUint64
    nMax := binary.PutUvarint(buf, maxUint64)
    fmt.Printf("值 %d (MaxUint64) 编码后占用 %d 字节: %x\n", maxUint64, nMax, buf[:nMax])
}

运行上述代码,你会观察到:

  • uint64类型在内存中占用 8 字节。
  • 较大的uint64值和MaxUint64值编码后会占用10个字节。
  • 较小的uint64值编码后会占用较少的字节(例如1或2字节)。

总结

理解uint64的存储和Varint编码之间的区别至关重要:

  1. 内存存储: 在Go程序运行时的内存中,uint64类型变量始终占用固定的8字节空间。这是类型本身的特性。
  2. 序列化编码: 当使用binary.PutUvarint等函数进行数据序列化时,采用的是变长编码(Varint)。这种编码方式旨在节省存储空间,对于小数字占用字节少,对于大数字则占用字节多。
  3. 编码长度: uint64的Varint编码最大可达10字节,这是因为Varint编码每个字节的最高位用作延续位,牺牲了一位数据位,并且为了保持编码格式的通用性和兼容性,Go语言选择了这种设计。

因此,在处理uint64数据时,需要区分其在内存中的静态大小和在序列化(如文件存储、网络传输)时可能采用的动态编码大小。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

Go中Type关键字的用法
Go中Type关键字的用法

Go中Type关键字的用法有定义新的类型别名或者创建新的结构体类型。本专题为大家提供Go相关的文章、下载、课程内容,供大家免费下载体验。

234

2023.09.06

go怎么实现链表
go怎么实现链表

go通过定义一个节点结构体、定义一个链表结构体、定义一些方法来操作链表、实现一个方法来删除链表中的一个节点和实现一个方法来打印链表中的所有节点的方法实现链表。

448

2023.09.25

go语言编程软件有哪些
go语言编程软件有哪些

go语言编程软件有Go编译器、Go开发环境、Go包管理器、Go测试框架、Go文档生成器、Go代码质量工具和Go性能分析工具等。本专题为大家提供go语言相关的文章、下载、课程内容,供大家免费下载体验。

254

2023.10.13

0基础如何学go语言
0基础如何学go语言

0基础学习Go语言需要分阶段进行,从基础知识到实践项目,逐步深入。php中文网给大家带来了go语言相关的教程以及文章,欢迎大家前来学习。

700

2023.10.26

Go语言实现运算符重载有哪些方法
Go语言实现运算符重载有哪些方法

Go语言不支持运算符重载,但可以通过一些方法来模拟运算符重载的效果。使用函数重载来模拟运算符重载,可以为不同的类型定义不同的函数,以实现类似运算符重载的效果,通过函数重载,可以为不同的类型实现不同的操作。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

194

2024.02.23

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

232

2024.02.23

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

15

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.3万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号