自定义对象默认不能当 dict key,因为其__hash__返回None或与__eq__不一致,违反哈希要求;需确保相等对象哈希值相同,且仅基于不可变字段实现__hash__。

为什么自定义对象默认不能当 dict key
因为 Python 的 dict 要求 key 必须是「可哈希的(hashable)」,而默认情况下自定义类实例不满足这个条件:它们的 __hash__ 方法返回的是基于对象身份(id())的值,但同时 __eq__ 又允许被重载——一旦你重写了 __eq__ 却没同步改 __hash__,Python 会把 __hash__ 设为 None,导致抛出 TypeError: unhashable type。
常见错误现象:
- 定义了
__eq__但没定义__hash__→ 立刻报错 - 只改了
__hash__但逻辑和__eq__不一致 → key 查不到、重复插入、甚至字典行为异常
让对象可哈希的最低可行做法
核心原则:相等的对象必须有相同的哈希值。最稳妥的方式是基于**不可变字段**计算哈希。
实操建议:
立即学习“Python免费学习笔记(深入)”;
- 确保参与比较的字段在对象创建后不再改变(比如用
@property+ 私有属性,或直接使用__slots__+ 冻结逻辑) - 在
__hash__中只用这些不变字段做hash((a, b, c)),不要调用可能改变状态的方法 - 如果所有字段都可变,就别强行支持哈希;改用
dict以外的数据结构(如list配合线性查找,或用weakref.WeakKeyDictionary前提是对象生命周期可控)
示例:
class Point:
def __init__(self, x, y):
self._x = x
self._y = y
@property
def x(self):
return self._x
@property
def y(self):
return self._y
def __eq__(self, other):
if not isinstance(other, Point):
return False
return self.x == other.x and self.y == other.y
def __hash__(self):
return hash((self.x, self.y))
__hash__ 和 __eq__ 不匹配时的实际影响
这不是理论风险,而是立刻破坏 dict 正确性的 bug。
典型表现:
- 两个逻辑上相等的对象(
a == b为True)却能同时作为 key 存进同一个dict→ 字典里出现“重复”key -
my_dict[a]能取到值,但my_dict[b]报KeyError,即使a == b - 用
set([a, b])得到长度为 2 的集合,哪怕a == b
根本原因:dict 先用 hash(key) 定位桶,再用 == 在桶内比对。哈希不一致 → 分配到不同桶 → 彼此“看不见”。
更安全的替代方案(当不想/不能控制可变性时)
不是所有对象都适合当 key。真遇到字段必然可变、或业务逻辑依赖运行时修改的情况,硬塞进 dict 只会埋坑。
可考虑:
- 用元组或 frozenset 替代:比如把
Point(x, y)换成(x, y),把一组标签换成frozenset(['a', 'b']) - 用
dataclasses.dataclass(frozen=True)自动生成安全的__hash__和__eq__,省去手写逻辑 - 封装一层索引映射:维护一个
{id(obj): obj}的字典,再额外用weakref.WeakKeyDictionary或外部 lookup 表管理逻辑关系
关键点在于:哈希行为必须稳定,而稳定性来源于字段不可变性,不是语法上加了 __hash__ 就万事大吉。










