setdefault的默认值在调用时立即求值,若为可变对象会导致意外共享;正确做法是用defaultdict、显式检查或传入类型/工厂函数并手动调用。

直接用 dict.setdefault(key, []) 或 dict.setdefault(key, {}) 看似方便,但若默认值是可变对象(如列表、字典、自定义类实例),且你反复调用它(比如在循环中),就可能意外共享同一个对象 —— 因为 setdefault() 的第二个参数是**表达式,在函数调用时就求值一次**,不是每次缺失时都新建。
问题根源:默认参数被提前计算
下面代码看似安全,实则危险:
d = {}
for i in range(3):
d.setdefault('items', []).append(i)
print(d) # {'items': [0, 1, 2]} ✅ 看起来正常
# 但如果你在多处调用 setdefault('items', []),它们都指向同一个 list 对象
真正的问题出现在多个键共用同一默认值表达式,或跨多次逻辑调用时。例如:
d1 = {}
d2 = {}
d1.setdefault('cfg', {})['timeout'] = 5
d2.setdefault('cfg', {})['retries'] = 3
print(d1['cfg']) # {'timeout': 5, 'retries': 3} ❌ 意外污染!
print(d2['cfg']) # {'timeout': 5, 'retries': 3}
这是因为 {} 在每次 setdefault 调用时虽是新字面量,但若写成 setdefault('cfg', shared_dict) 就彻底共享;更隐蔽的是,若你把默认值写成函数返回值却没包装好,也会出错。
立即学习“Python免费学习笔记(深入)”;
正确做法:用 lambda 或函数延迟构造
确保每次 key 缺失时,都生成一个**全新、独立**的对象。核心是:把构造逻辑封装成可调用对象,让 setdefault 在需要时才执行它。
-
推荐:用
lambda匿名函数
简洁、直观、无副作用:d.setdefault('users', lambda: []).()不行 ——setdefault不会自动调用函数。正确写法是自己封装一层:
# ✅ 正确:手动检查 + 构造
if 'users' not in d:
d['users'] = []
d['users'].append('alice')
✅ 更优雅:用 defaultdict(最常用解法)
from collections import defaultdict
d = defaultdict(list)
d['users'].append('alice') # 自动创建新 list
-
如果坚持用
setdefault,必须显式调用构造逻辑:
不能依赖其第二个参数“自动新建”,而要让它接收一个函数,再手动调用:
# ✅ 安全:传入工厂函数,自己调用
d.setdefault('logs', list).append('start') # list 是类型,调用 list() 得新列表
d.setdefault('config', dict)['db'] = 'sqlite'
✅ 更通用:用 lambda(需注意括号)
d.setdefault('cache', lambda: {}).()['key'] = 'val' # 不推荐,难读
✅ 清晰推荐:封装成辅助函数
def get_new_list(): return []
def get_new_config(): return {'log_level': 'INFO'}
d.setdefault('tasks', get_new_list).append('cleanup')
d.setdefault('settings', get_new_config)['debug'] = True
自定义类实例的处理
对于自定义类,默认值必须每次新建实例,否则所有 key 共享同一对象状态:
class Counter:
def __init__(self): self.count = 0
def inc(self): self.count += 1
❌ 危险:所有 key 共享同一个 Counter 实例
d.setdefault('counter', Counter()) # Counter() 立即执行,只建一次
✅ 正确:传类型(可调用),再调用
d.setdefault('counter', Counter)().inc() # 每次都 new Counter()
✅ 更好:用 defaultdict 或显式检查
from collections import defaultdict
d = defaultdict(Counter) # 自动调用 Counter()
d['a'].inc()
d['b'].inc() # 各自独立
总结关键点
-
setdefault(key, default)的default是**立即求值**的表达式,不是延迟构造器 - 若
default是字面量([],{}),每次调用确实新建,但仅限该次调用 —— 多次调用之间不共享;真正风险在于把它赋给变量再复用,或误以为它“按需生成” - 最安全、最 Pythonic 的方案是
defaultdict,它明确设计用于此场景 - 若必须用
setdefault,把default设为类型(list,dict,Counter)或无参工厂函数,并确保你主动调用它(如.setdefault(k, list)())
不复杂但容易忽略 —— 关键是分清“表达式求值时机”和“对象生命周期”。










