
本文详解 `how_sum` 函数的记忆化优化陷阱:修复因可变默认参数导致的缓存污染问题,并确保在不同输入数组下结果正确、高效且可复用。
在解决“找出数组中若干数使其和等于目标值”的经典递归问题时,朴素实现虽逻辑清晰,但存在严重的指数级时间复杂度(如 how_sum(500, [7, 14]) 会超时)。引入记忆化(memoization)是标准优化手段,但若实现不当,反而会引发隐蔽且致命的错误——正如原代码中 memo: dict = {} 作为默认参数所导致的问题。
? 核心错误:可变默认参数引发的缓存污染
Python 中,函数的默认参数在定义时仅初始化一次,而非每次调用时新建。因此:
def how_sum(target, nums, memo={}) # ❌ 危险!同一字典被所有调用共享当多次调用 how_sum(例如 how_sum(7, [2,3]) 和 how_sum(7, [2,4])),它们共用同一个 memo 字典。前一次运行缓存的 memo[7] = [3,2,2] 会被后一次直接复用——即使 [2,4] 根本无法组成 7。这正是输出错误(如 how_sum(7, [2,4]) 返回 [3,2,2] 而非 None)的根本原因。
⚠️ 注意:原问题中声称的“正确输出”本身存在逻辑矛盾(如 how_sum(8, [2,3,5]) 实际有解 [3,5] 或 [2,2,2,2]),但缓存污染会导致它返回完全无关的旧结果,这才是真正需要修复的缺陷。
✅ 正确的记忆化实现
必须确保每次顶层调用拥有独立、干净的 memo。推荐方案:使用 None 作为默认值,在函数内初始化:
def how_sum(target: int, nums: list[int], memo: dict[int, list[int] | None] | None = None) -> list[int] | None:
# 每次顶层调用都创建新 memo;递归调用则复用传入的 memo
if memo is None:
memo = {0: []} # base case: target==0 → 空列表
# 若已计算过,直接返回缓存结果
if target in memo:
return memo[target]
# 初始化为 None,表示尚未找到解
memo[target] = None
# 尝试每个数字
if target > 0: # 避免无效递归(target<0 已由 base case 处理)
for num in nums:
remainder = target - num
# 递归求解余数
combination = how_sum(remainder, nums, memo)
if combination is not None:
# 找到解:在余数解后追加当前 num
memo[target] = combination + [num]
break # 找到一个解即可,无需继续
return memo[target]✅ 完整可运行示例与验证
def main():
print(how_sum(7, [2, 3])) # [2, 2, 3] 或 [3, 2, 2](顺序取决于遍历)
print(how_sum(7, [5, 3, 4, 7])) # [7] 或 [4, 3](任一有效解均可)
print(how_sum(7, [2, 4])) # None(无解)
print(how_sum(8, [2, 3, 5])) # [3, 5] 或 [2, 2, 2, 2]
print(how_sum(500, [7, 14])) # None(因 500 不是 7 的倍数,14 是 7 的倍数)
if __name__ == "__main__":
main()? 关键要点总结
- 永远避免可变对象(list, dict)作为函数默认参数,这是 Python 最经典的陷阱之一。
- 记忆化缓存的作用域必须与问题实例一致:不同 nums 数组必须使用独立缓存。
- 初始化 memo 时预置 memo[0] = [] 可省去每次检查 target == 0 的开销。
- 使用 break 在找到首个解后立即退出循环,符合题目“返回任意一个组合”的要求,提升效率。
- 时间复杂度从 O(n^target) 降至 O(target × n),空间复杂度 O(target)(缓存大小 + 递归栈)。
通过以上修正,how_sum 不仅能正确处理边界情况与无解场景,更具备工业级的健壮性与可复用性。










