
本文介绍如何将包含姓名与数字的二维列表按姓名去重合并,并对对应数字进行累加,推荐使用字典实现 o(n) 时间复杂度的高效聚合。
在处理类似 [['Smith, Karen', '10'], ['Miller, Michael', '20'], ...] 这样的结构化数据时,核心需求是:按姓名(第一列)分组,将所有对应数字(第二列)转换为整数后求和。直接在列表上反复查找、修改效率低下(尤其在 4000+ 条数据时),而 Python 字典天然支持键值映射与快速更新,是最简洁、高效的解决方案。
以下是推荐的实现方式:
mylist = [['Smith, Karen', '10'], ['Miller, Michael', '20'], ['Smith, Karen', '30'], ['Taylor, Peter', '95']]
# 使用字典累计数值:name → total_number
result_dict = {}
for name, num_str in mylist:
result_dict[name] = result_dict.get(name, 0) + int(num_str)
# 转回所需格式:列表嵌套列表
mylist = [[name, str(total)] for name, total in result_dict.items()]
print(mylist)
# 输出: [['Smith, Karen', '40'], ['Miller, Michael', '20'], ['Taylor, Peter', '95']]✅ 关键优势说明:
- dict.get(key, default) 安全获取当前累计值,避免 KeyError;
- 单次遍历完成聚合,时间复杂度为 O(n),远优于嵌套循环的 O(n²);
- 自动去重,无需额外判断或预提取重复项;
- 支持任意顺序输入,结果中姓名顺序取决于首次出现顺序(Python 3.7+ 字典保持插入序)。
⚠️ 注意事项:
- 确保第二列字符串可安全转为整数(如含空格、非数字字符需预清洗);
- 若需严格保持原始姓名大小写或空格规范,建议提前标准化(如 name.strip());
- 如需按姓名字母序输出,最后可对 result_dict.items() 排序:sorted(result_dict.items())。
该方法兼顾可读性、性能与健壮性,是处理此类“键值聚合”问题的标准实践。










