
本文介绍如何在python中高效统计数据库购物车表中同一用户下相同商品id与数量组合的出现频次,适用于合并重复商品项的业务场景。
在电商或订单系统中,用户购物车常存在多条记录表示“同一商品、同一数量”的重复添加(例如两次加入 product_id=2, quantity=1000)。为优化前端展示或后续结算逻辑,需将这些重复项合并并显示累计数量(如“2次 product_id=2 with quantity=1000”)。虽然可通过SQL的 GROUP BY 实现,但若数据已加载至内存(如使用ORM查询结果列表),用纯Python处理更灵活、可控。
以下是一个简洁高效的解决方案,使用 collections.defaultdict 进行键值计数:
from collections import defaultdict
def count_product_quantity_for_user(records, user_id):
"""
统计指定用户在购物车记录中,(product_id, quantity) 组合的出现次数
:param records: 可迭代的字典/类字典对象列表(如SQLAlchemy查询结果、namedtuple或dict)
:param user_id: 目标用户的唯一标识符
:return: defaultdict(int),键为(product_id, quantity)元组,值为出现次数
"""
counts = defaultdict(int)
for record in records:
# 确保 record 支持字典式访问(如 record['user_id'])
if record.get('user_id') == user_id:
key = (record['product_id'], record['quantity'])
counts[key] += 1
return counts
# 示例调用(假设 records 已从数据库查询获得)
user_id = 582042554
counts = count_product_quantity_for_user(records, user_id)
# 格式化输出
for (product_id, quantity), count in counts.items():
print(f"{count} times product_id={product_id} with quantity={quantity}")✅ 关键说明与注意事项:
- records 应为已加载到内存的记录集合(如 session.query(Cart).filter(...).all() 返回的列表),不适用于超大数据集——此时推荐直接使用SQL聚合(如 SELECT product_id, quantity, COUNT(*) FROM cart WHERE user_id = ? GROUP BY product_id, quantity)以降低内存开销;
- quantity 为 Decimal 类型时(如示例中的 Decimal('1000.00')),可直接作为元组元素参与哈希,无需额外转换;若含浮点数,建议先标准化(如 round(q, 2))避免精度导致键不匹配;
- 若需返回结构化结果供API使用,可将 counts.items() 转为标准列表字典:
result = [
{"product_id": pid, "quantity": qty, "count": cnt}
for (pid, qty), cnt in counts.items()
]该方法逻辑清晰、无外部依赖,适合嵌入Django视图、FastAPI路由或批量处理脚本中,是轻量级购物车去重统计的理想实践。










