defaultdict工厂函数须为可调用对象,如list而非[];Counter手动改value会导致most_common()结果滞后;namedtuple字段名须合法标识符;deque模拟队列须用popleft()而非pop()。

defaultdict 初始化值写错类型,程序不报错但逻辑崩了
用 defaultdict 时传错工厂函数,比如该用 list 却写了 [],或者该用 int 却写了 0,代码能跑,但每次访问新键都返回同一个可变对象,后续修改会互相污染。
-
defaultdict([])是错的——[]不是可调用对象,会直接抛TypeError: first argument must be callable - 正确写法是
defaultdict(list)(无括号),因为list是类型,可调用;defaultdict(lambda: [])也行,但没必要 - 常见陷阱:用
defaultdict({})想默认字典,结果报错;得写defaultdict(dict) - 如果工厂函数有参数(比如想默认空字符串
''),不能直接写defaultdict(''),得用defaultdict(str)或defaultdict(lambda: '')
Counter 统计后直接改 value,下次 most_common() 就不准了
Counter 是 dict 子类,但它的 most_common() 结果依赖内部状态,手动改某个 key 的 value 不会自动触发重排序或缓存刷新,导致统计视图滞后。
- 不要写
c['a'] = 100后还指望c.most_common(1)立刻返回('a', 100)——它可能仍按旧顺序排 - 安全做法是:改完后显式调用
c.clear()再重建,或用Counter(c)重新封装一次 - 更轻量的替代:需要动态更新+查 topN,优先考虑用
heapq.nlargest(n, c.items(), key=lambda x: x[1]),绕过most_common缓存 - 注意
Counter对负数计数合法(比如c.subtract(['x'])),但most_common()默认只返回正数项,负值和零值被忽略
namedtuple 定义后字段名含空格或数字开头,import 就失败
namedtuple 生成的是类,字段名最终变成属性名,必须符合 Python 标识符规则。名字不合规不会在定义时报错,而是在首次实例化或访问字段时才崩。
- 错误示例:
Point = namedtuple('Point', ['x pos', '2nd'])→ 实例化后访问p.x pos语法错误,p.2nd直接SyntaxError - 解决方法:用
rename=True参数自动修复,比如namedtuple('Point', ['x pos', '2nd'], rename=True)会转成_0,_1,但可读性差 - 更稳妥的做法:预处理字段名,用
re.sub(r'[^a-zA-Z0-9_]', '_', name).strip('_')清洗,再确保不以数字开头 - 注意:字段名重复也会触发
rename=True,比如['a', 'b', 'a']→ 第二个a变成_2,容易漏看
deque 做队列用 pop() 而不是 popleft(),结果变成栈了
deque 默认从右端操作,pop() 和 append() 都在尾部,如果不小心用 pop() 替代 popleft() 来模拟 FIFO,实际就退化成 LIFO,语义全反。
立即学习“Python免费学习笔记(深入)”;
- 典型场景:BFS 遍历图时误写
queue.pop(),导致深度优先行为,路径变长甚至死循环 - 性能差异明显:
popleft()是 O(1),pop()也是 O(1),但语义错位比性能问题更致命 - 调试技巧:打印前几轮出队元素顺序,对照预期 BFS 层序,立刻能发现是不是“先进后出”
- 如果真要兼顾双端,明确命名变量,比如
stack = deque()/queue = deque(),靠名字约束使用习惯










