0

0

Python 中合并 JSON 中重复键的值(以分号连接)

霞舞

霞舞

发布时间:2026-02-17 15:54:12

|

795人浏览过

|

来源于php中文网

原创

Python 中合并 JSON 中重复键的值(以分号连接)

本文介绍如何在 python 中正确处理含重复键的 json 字符串,通过自定义解析器将相同键的所有值合并为一个以分号分隔的字符串,解决标准 json 解析器因键唯一性限制而丢失数据的问题。

本文介绍如何在 python 中正确处理含重复键的 json 字符串,通过自定义解析器将相同键的所有值合并为一个以分号分隔的字符串,解决标准 json 解析器因键唯一性限制而丢失数据的问题。

JSON 规范本身不允许重复键,因此标准解析器(如 json.loads())在遇到重复键时,通常仅保留最后一个值,导致前面的数据被静默丢弃。但在实际开发中(如 MuleSoft 配置、日志片段或遗留系统导出数据),我们常会遇到人为构造的“非标准 JSON”——即同一对象内存在多个同名键。此时,若需完整保留所有值并按业务逻辑聚合(例如用 ; 连接),就必须绕过默认解析行为,改用 object_pairs_hook 参数捕获原始键值对序列。

Python 的 json.loads() 支持 object_pairs_hook 参数,它会在解析每个 JSON 对象时,将该对象内按出现顺序排列的键值对列表(list[tuple[str, Any]])传入指定函数。这正是我们处理重复键的关键切入点:不依赖字典自动去重,而是手动分组聚合。

以下是一个健壮、可复用的解决方案:

MATLAB与VB混合编程技术研究 WORD版
MATLAB与VB混合编程技术研究 WORD版

本文档主要讲述的是MATLAB与VB混合编程技术研究;着重探讨了在VB应用程序中集成MATLAB实现程序优化的四种方法,即利用Matrix VB、调用DLL动态链接库、应用Active自动化技术和动态数据交换技术,并分析了集成过程中的关键问题及其基本步骤。这种混合编程实现了VB的可视化界面与MATLAB强大的数值分析能力的结合。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
from itertools import groupby
import json

def merge_duplicates(pairs):
    """
    将键值对列表按键分组,并将同键的所有值用 ';' 连接
    注意:groupby 要求输入已按键排序,故先 sorted(pairs)
    """
    # 按 key 排序确保相同 key 相邻
    sorted_pairs = sorted(pairs, key=lambda x: x[0])
    for key, group in groupby(sorted_pairs, key=lambda x: x[0]):
        values = [value for _, value in group]
        yield key, ';'.join(values)

def parse_json_with_duplicate_merge(json_str):
    """
    解析含重复键的 JSON 字符串,合并同键值(分号分隔)
    """
    return json.loads(json_str, object_pairs_hook=lambda pairs: dict(merge_duplicates(pairs)))

# 示例使用
json_input = '''{
"1061": "GROCERY",
"1073": "GM-HBC",
"4220": "PRODUCE",
"958": "MEAT",
"958": "DAIRY",
"958": "FROZEN"
}'''

result = parse_json_with_duplicate_merge(json_input)
print(result)
# 输出: {'1061': 'GROCERY', '1073': 'GM-HBC', '4220': 'PRODUCE', '958': 'DAIRY;FROZEN;MEAT'}

关键说明与注意事项:

立即学习Python免费学习笔记(深入)”;

  • groupby 要求输入严格有序,因此必须先 sorted(pairs, key=lambda x: x[0]),否则同键元素可能分散,导致分组失败;
  • 值的拼接顺序取决于原始 JSON 中键值对的出现顺序(经排序后为字典序),如需保持原始插入顺序,需改用 collections.OrderedDict 或记录索引,但本例中语义上顺序无关紧要;
  • 此方法仅影响顶层对象;若 JSON 包含嵌套对象且其中也存在重复键,需递归应用该逻辑(可扩展为自定义 JSONDecoder 子类);
  • 输入必须是合法 JSON 字符串(即使含重复键),若格式有误(如缺少逗号、引号不匹配),仍会抛出 json.JSONDecodeError;
  • 该方案不修改原始 json 模块行为,安全无副作用,适合集成到现有数据管道中。

总结:通过 object_pairs_hook 捕获原始键值对流,结合 itertools.groupby 实现高效分组聚合,即可优雅解决“重复键值合并”这一常见反模式需求。无需第三方库,纯标准库实现,简洁、可控、生产就绪。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

442

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

544

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

322

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

442

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

544

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

322

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

283

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号