Python数据结构选哪个_List/Dict/Set/Tuple时空复杂度对比

P粉602998670

发布时间：2026-03-17 11:29:03

506人浏览过

来源于php中文网

原创

查元素快不快主要看是否使用哈希表：dict和set平均O(1)，list/tuple最坏O(n)；哈希冲突严重时性能退化至接近O(n)；用set替代list判断成员可显著提速。

python数据结构选哪个_list/dict/set/tuple时空复杂度对比

查元素快不快，主要看用不用得上哈希表

Python 的 dict 和 set 底层是哈希表，平均情况下查元素是 O(1)；list 和 tuple 是数组实现，查元素得遍历，最坏 O(n)。别被“平均”骗了——如果大量插入导致哈希冲突严重（比如往 dict 里塞一堆结构相似的自定义对象且没重写 __hash__），实际性能可能退化到接近 O(n)。

常见错误现象：if x in my_list: 在循环里反复调用，数据量一过千就明显卡顿；换成 my_set = set(my_list); if x in my_set: 立刻变快。

用 set 存查找目标（去重+快查），哪怕只查几次也值得转一次
dict 查 key 快，但查 value 仍是 O(n) —— 没捷径，别幻想 dict.values() 自带索引
小数据量（list 反而比 set 更轻量，别机械套“哈希一定快”

要改数据还是只读，决定了能不能用 tuple

tuple 不可变，内存更紧凑、创建更快、能当 dict 的 key；list 可变，支持增删改。但“不可变”是浅层的——如果 tuple 里存了 list，那个 list 还是可以改的，只是你不能替换整个位置。

使用场景：tuple 适合做配置项、函数返回多值（a, b = func() 实际返回的就是 tuple）、字典键（如 cache[(x, y)] = result）；list 适合需要 .append()、.pop() 或按索引改值的地方。

立即学习“Python免费学习笔记（深入）”；

Dreamina

字节跳动推出的AI绘画工具，用简单的文案创作精美的图片

下载

别为了“看起来不可变”硬把 list 转成 tuple，结果里面嵌了个可变对象，徒增理解成本
tuple 作为函数参数传入后，接收方无法通过类型判断它是否真该被当常量用——靠文档和命名约定，不是靠语法
用 typing.NamedTuple 或 dataclass(frozen=True) 比裸 tuple 更明确表达“这是结构化只读数据”

删元素时 list.pop(i) 和 set.remove(x) 的代价差很远

list.pop(i) 删除中间元素要移动后面所有项，平均 O(n)；set.remove(x) 是哈希定位后直接断链，平均 O(1)。但注意：set 不保证顺序，也不能按位置删（没有下标概念）。

错误现象：用 for i in range(len(my_list)): 遍历时边查边 my_list.pop(i)，结果漏删、索引错乱；或者想用 set 去重后还要保持原顺序，却直接转回 list(set(...)) 导致顺序全乱。

要删多个指定值且关心顺序？先建 set 存待删项，再用列表推导式：[x for x in my_list if x not in to_remove_set]
要按位置批量删（如删索引 2~5）？list 切片赋值更稳：del my_list[2:6]
set.discard(x) 比 remove(x) 安全——没找到也不报错，适合不确定元素是否存在的场景

内存占用差异在大数据量时会暴露得很真实

同数量级整数：tuple list dict ≈ set。因为 dict/set 要预留哈希桶空间（初始至少 8 个槽，即使只存 1 个元素），且每个元素额外存哈希值和指针。而 tuple 和 list 就是连续指针数组。

实测：存一百万个整数，list 约占 36MB，tuple 约 28MB，set 约 45MB（含空桶）。如果你在内存敏感环境（如嵌入式 Python、Lambda 函数）处理几十万条数据，这个差距会让 OOM 来得更早。

只读且需索引访问？优先 tuple，别图省事用 list
用 sys.getsizeof() 测内存前，记得它不统计内部对象（比如 list 里的字符串），只算容器本身开销
array.array('i', ...) 比 list[int] 省得多——但失去通用性，只存数字时才考虑

事情说清了就结束。复杂点在于：没有银弹，list 看似慢却最灵活，set 查得快却丢顺序，tuple 省内存但改不了，dict 键快值慢——选哪个，得看你代码里**真正瓶颈在哪一行**，而不是凭印象猜。

Python await怎么用_await后面必须接可等待对象(协程/Task/Future)规则解析

Python Flask表单怎么校验_深入WTForms自定义验证器编写指南与多字段联合复杂校验

Python树的层序遍历怎么写_利用队列辅助实现二叉树BFS广度遍历

Python Flask怎么发邮件_通过Flask-Mail配置SMTP服务器支持异步发送HTML模板邮件

Python协程怎么取消_task.cancel()抛出CancelledError异常与安全退出清理资源操作

相关专题

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

847

2023.08.22

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06