0

0

Python set 底层结构实现原理

舞夢輝影

舞夢輝影

发布时间:2026-02-26 19:04:02

|

967人浏览过

|

来源于php中文网

原创

python set 底层结构实现原理

Python 的 set 底层基于哈希表(hash table)实现,和 dict 高度相似,但只存储键(key),不存值(value)。它的核心目标是支持平均 O(1) 时间复杂度的成员检查、插入和删除操作。

哈希表结构:数组 + 桶链(开放寻址法)

CPython 中的 set 使用**开放寻址法(open addressing)**,而非拉链法(chaining)。这意味着:

  • 底层是一块连续的内存数组(称为 table),每个槽位(slot)存储一个 hash 值和一个指向元素对象的指针;
  • 当发生哈希冲突时,不是在槽位后挂链表,而是按固定探测序列(如线性探测或二次探测变种)寻找下一个空闲槽;
  • CPython 实际使用的是“伪随机探测”(基于 hash 值扰动的线性探测改进版),兼顾局部性和冲突分散性。

关键字段与内存布局

每个 set 对象内部维护一个 PySetObject 结构体,主要包含:

  • table 指针:指向哈希表数组起始地址;
  • used:当前已存储的唯一元素个数;
  • fill:已占用(含已删除标记)的槽位总数(用于触发扩容);
  • mask:哈希表长度减一(table size 总是 2 的幂),用于快速取模:index = hash & mask
  • deleted slots:被删除元素留下的“哑元”(dummy)槽位(值为 NULL 或特殊标记),避免探测链断裂。

哈希计算与冲突处理细节

插入一个元素 x 时,流程如下:

造次
造次

Liblib打造的AI原创IP视频创作社区

下载

立即学习Python免费学习笔记(深入)”;

  • 调用 hash(x) 得到哈希值(要求对象可哈希且 hash 稳定);
  • hash & mask 定位初始索引;
  • 若该槽为空或为 dummy,直接插入;
  • 若槽中已有元素,比较其 hash 值是否相等 → 不等则探测下一个位置;
  • 若 hash 相等,再调用 == 判断是否真正重复(解决哈希碰撞)。

注意:set 的去重依赖 hash()__eq__() 两个方法协同工作——hash 不同一定不等,hash 相同才需进一步比较。

动态扩容与收缩机制

fill / size > 2/3(约 66.7% 负载率)时触发扩容,新 size 为原 size 的 4 倍(最小为 8);删除大量元素后,若 fill / size 且 size > 50000,则可能缩容。扩容过程会重新哈希所有现存元素,重建 table。

这种策略在空间和时间间做了权衡:避免频繁重哈希,同时控制探测长度增长(负载率越低,平均查找步数越少)。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

248

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

906

2024.03.01

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

385

2025.06.09

golang结构体方法
golang结构体方法

本专题整合了golang结构体相关内容,请阅读专题下面的文章了解更多。

200

2025.07.04

Golang 实际项目案例:从需求到上线
Golang 实际项目案例:从需求到上线

《Golang 实际项目案例:从需求到上线》以真实业务场景为主线,完整覆盖需求分析、架构设计、模块拆分、编码实现、性能优化与部署上线全过程,强调工程规范与实践决策,帮助开发者打通从技术实现到系统交付的关键路径,提升独立完成 Go 项目的综合能力。

1

2026.02.26

Golang Web 开发路线:构建高效后端服务
Golang Web 开发路线:构建高效后端服务

《Golang Web 开发路线:构建高效后端服务》围绕 Go 在后端领域的工程实践,系统讲解 Web 框架选型、路由设计、中间件机制、数据库访问与接口规范,结合高并发与可维护性思维,逐步构建稳定、高性能、易扩展的后端服务体系,帮助开发者形成完整的 Go Web 架构能力。

3

2026.02.26

Golang 并发编程专题:掌握多核时代的核心技能
Golang 并发编程专题:掌握多核时代的核心技能

《Golang 并发编程专题:掌握多核时代的核心技能》系统讲解 Go 在并发领域的设计哲学与实践方法,深入剖析 goroutine、channel、调度模型与并发安全机制,结合真实场景与性能思维,帮助开发者构建高吞吐、低延迟、可扩展的并发程序,全面提升多核时代的工程能力。

5

2026.02.26

batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

353

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

77

2026.02.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号