Golang 手撕布隆过滤器（面试加分项）

冷漠man

发布时间：2026-02-05 09:40:03

399人浏览过

来源于php中文网

原创

手写布隆过滤器考察的是约束下的合理取舍能力：哈希函数选择、位图结构（uint64数组比[]byte更省内存且位操作更快）、动态扩容等。核心是理解误判率、哈希分散性与位操作边界，并从最简版本迭代实现。

golang 手撕布隆过滤器（面试加分项）

为什么不用现成的 bloomfilter 库而要手写

面试时手写布隆过滤器，考的不是你背没背过算法，而是能不能在约束下做合理取舍：比如哈希函数怎么选、位图用 []byte 还是 uint64 数组、是否支持动态扩容。很多候选人一上来就抄 github.com/yourbasic/bloom，结果被问「如果要支持 1 亿个 key，内存超了怎么办」就卡住。

手写的关键在于控制变量——先实现最简可用版本（固定容量、双哈希），再逐步加特性。面试官真正想看的是你对「误判率」「哈希分散性」「位操作边界」这些点有没有真实踩过坑。

用 `uint64` 数组比 `[]byte` 更省空间且更快

位图底层本质是 bit 级别操作。[]byte 虽然直观，但每次 set/get 都要算 index / 8 和 index % 8，还涉及掩码和移位；而 []uint64 可以直接定位到第 i/64 个元素，再用 1 做位运算，CPU 缓存更友好，实测吞吐高 15%~20%。

位图长度 = (capacity + 63) / 64（向上取整到 uint64 个数）
设位：用 bits[idx] |= 1 ，注意 offset 必须是 0~63，否则行为未定义
查位：用 (bits[idx] & (1 ，别漏括号，位运算优先级低
清空整个 filter：直接 bits = make([]uint64, size)，Go 会自动 zero-initialize

`hash64` 函数必须避免负数模运算

Go 的 int64 % n 在被除数为负时结果仍为负，直接用于位图索引会 panic 或越界。常见错误写法：h1 % m —— 如果 h1 是负的，结果可能是 -5，导致 bits[-5] 访问非法内存。

立即学习“go语言免费学习笔记（深入）”；

正确做法统一转成非负余数：

闪剪

AI数字人视频在线创作平台-AI一键成片

下载

func hashMod(h, m int64) int64 {
    return (h % m + m) % m
}

实际中建议用两个独立哈希：h1 = fnv64(key)，h2 = murmur3_64(key)，然后组合出 k 个位置：hash(i) = (h1 + i*h2) % m（i 从 0 到 k-1）。这样比用 3 个不同哈希函数更容易调试，也避免哈希间相关性太强。

误判率计算不能只看公式，得结合实际 key 分布

理论误判率 (1 - e^(-k * n / m))^k 成立前提是：哈希均匀、key 独立、m 足够大。但真实场景中，如果 key 是时间戳或递增 ID，哪怕哈希函数再好，h1 和 h2 也会呈现强线性相关，导致多个 key 扎堆在相邻几个 bucket，误判率飙升。

应对方法：

key 进来前先做一次简单混淆，比如 binary.BigEndian.PutUint64(buf, id^0xdeadbeef)
测试阶段用真实业务数据跑压测，而不是随机字符串——比如拿 10 万条订单号灌入，统计 MayContain() 返回 true 但实际不存在的比例
预留一个 FalsePositiveRate() float64 方法，内部用当前已 set 的 bit 数反推，比纯理论值更有参考性

手写布隆最难的不是逻辑，是意识到「哈希质量」和「数据特征」永远在打架。调参时别光盯着 k=3 或 k=5，先用 pprof 看看 Set() 里哪一行最热，大概率是哈希函数或位操作本身。

Go模块发布流程是怎样的_Go开源模块发布指南

如何在Golang中管理私有包权限_Golang私有仓库访问控制方法

如何使用Golang处理模块私有化_Golang私有仓库访问与依赖管理

如何在Golang中使用私有仓库_Golang模块私有源配置与访问方法

Golang开发环境中如何管理依赖_Go mod管理环境说明

相关标签:

git go github golang 为什么 asic golang github 算法

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Go语言context超时如何生效_Golang并发超时原理下一篇：Golang如何使用encoding/json进行JSON解析_Golang JSON序列化与反序列化

作者最新文章

paki小游戏免费入口快速指南_Poki小游戏免费在线秒玩入口

2026-02-04 14:59

Claude官网入口在哪里？Claude官方网站入口指引

2026-02-04 16:42

Claude官网在哪？Claude官方网站定位指南

2026-02-04 16:46

Python 文件上传与下载的实现要点

2026-02-04 17:05

ppt怎么删除文本框对象_ PPT选中删除文本框详细操作

2026-02-04 17:16

鹅鸭杀官方网站入口鹅鸭杀官网网站在线下载

2026-02-04 17:18

SQL 如何用 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 写法

2026-02-04 17:27

春晚2026节目单 2026春晚节目单完整版

2026-02-04 17:30

2026春节红包活动大全春节红包最新资讯

2026-02-04 17:37

Vivo云服务官网网址 vivo云服务官网登录

2026-02-04 17:52

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

184

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

231

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

344

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

397

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

282

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

196

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

581

2025.06.17

抖音网页版入口与视频观看指南抖音官网视频在线访问

本专题汇总了抖音网页版的入口链接、官方登录页面以及视频观看入口，帮助用户快速访问抖音网页版，提供免登录访问方式和直接进入视频播放页面的方法，确保顺利浏览和观看抖音视频。

2026.02.04

热门下载

网站特效

网站源码

网站素材

前端模板

Golang 手撕布隆过滤器（面试加分项）

为什么不用现成的 bloomfilter 库而要手写

用 uint64 数组比 []byte 更省空间且更快

hash64 函数必须避免负数模运算

误判率计算不能只看公式，得结合实际 key 分布

用 `uint64` 数组比 `[]byte` 更省空间且更快

`hash64` 函数必须避免负数模运算