如何从嵌套 JSON 数据中提取指定键的所有值

霞舞

发布时间：2026-01-24 08:21:36

944人浏览过

来源于php中文网

原创

如何从嵌套 JSON 数据中提取指定键的所有值

本文介绍一种通用、健壮的方法，使用递归遍历任意深度的嵌套 json（字典/列表混合结构），精准提取所有指定键（如 `"aaaa"` 或 `"bbbb"`）对应的值，并汇总为 python 列表。适用于复杂自定义字段、动态结构 api 响应等场景。

在处理真实业务中的 JSON 数据（如 Jira、ServiceNow 或自研配置系统返回的响应）时，常遇到高度嵌套、结构不固定的情况——目标字段（如 "AAAA" 和 "BBBB"）可能深藏于多层 list 与 dict 的组合中，且出现位置和层级不统一。此时，硬编码路径（如 data["customFields"][2]["values"][0][0]["values"][0]["AAAA"]）极易出错、难以维护，也完全无法应对结构变化。

更可靠的方式是采用深度优先递归遍历：无论目标键位于对象的哪一层，只要它存在，就将其值“捕获”并产出。核心逻辑如下：

若当前项是字典（dict）：检查是否直接包含目标键；若有，立即产出其值；再对其所有值（data.values()）递归调用；
若当前项是列表（list）：对其中每个元素递归调用；
若为原子类型（字符串、数字等），直接跳过（无子结构可遍历）。

该方法简洁、无副作用、支持任意嵌套深度，且天然兼容缺失字段（自动跳过）。

以下是完整可运行示例代码（已补全原始 JSON 的语法错误，确保合法）：

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

import json

# ✅ 修复原始 JSON：补全结尾大括号、修正拼写（如 "type" 字段名）
raw_json = '''
{
    "id": 1234,
    "name": "xxxx",
    "description": "XXXXY",
    "descriptionFormat": "XZXZ",
    "children": [],
    "customFields": [
        {
            "fieldId": 1111,
            "name": "dert",
            "values": [
                {
                    "id": 45,
                    "name": "est",
                    "type": "erence"
                }
            ],
            "type": "alue"
        },
        {
            "fieldId": 1114,
            "name": "name_pe",
            "values": [
                {
                    "id": 423255,
                    "name": "CN",
                    "type": "eference",
                    "referenceData": {
                        "ropagation": "ATE"
                    },
                    "euse": false
                }
            ],
            "type": "alue"
        },
        {
            "fieldId": 1111111,
            "name": "Cases",
            "values": [
                [
                    {
                        "fieldId": 111121,
                        "name": "Case",
                        "values": [
                            {
                                "AAAA": 9090,
                                "BBBB": "MONACO",
                                "ype": "eference",
                                "referenceData": {
                                    "ropagation": "ATE"
                                },
                                "euse": false
                            }
                        ],
                        "ames": [],
                        "type": "alue"
                    }
                ],
                [
                    {
                        "fieldId": 111122,
                        "name": "Case",
                        "values": [
                            {
                                "AAAA": 9091,
                                "BBBB": "NICE",
                                "ype": "eference",
                                "ata": {
                                    "ropagation": "ATE"
                                },
                                "euse": false
                            }
                        ],
                        "ames": [],
                        "type": "alue"
                    }
                ]
            ],
            "type": "alue"
        }
    ]
}
'''

data = json.loads(raw_json)

def extract_values(obj, target_key):
    """递归提取 JSON 对象中所有 target_key 对应的值"""
    if isinstance(obj, dict):
        # 当前层级存在目标键 → 立即产出
        if target_key in obj:
            yield obj[target_key]
        # 递归遍历所有值（包括嵌套 dict/list）
        for value in obj.values():
            yield from extract_values(value, target_key)
    elif isinstance(obj, list):
        # 遍历列表每一项
        for item in obj:
            yield from extract_values(item, target_key)
    # 其他类型（str, int, bool, None）不递归，直接忽略

# ✅ 提取结果
List_AAAA = list(extract_values(data, "AAAA"))
List_BBBB = list(extract_values(data, "BBBB"))

print("List_AAAA =", List_AAAA)  # [9090, 9091]
print("List_BBBB =", List_BBBB)  # ['MONACO', 'NICE']

⚠️ 注意事项与最佳实践：

键名敏感性：该函数严格区分大小写（"AAAA" ≠ "aaaa"），确保传入键名与 JSON 中完全一致；
性能考量：对于超大 JSON（GB 级），递归可能导致栈溢出或内存压力；此时建议改用迭代式 DFS 或流式解析器（如 ijson）；
类型安全：函数不校验值类型，若需只提取数字型 "AAAA"，可在 yield obj[target_key] 前添加 if isinstance(obj[target_key], (int, float)): 判断；
去重需求：若需唯一值，可将结果转为 list(set(...))，但注意 set() 不保持顺序且不可哈希嵌套结构（本例中值为简单类型，安全）；
调试技巧：临时在 yield 前插入 print(f"Found {target_key} = {obj[target_key]} at path: ...") 可辅助定位来源路径（需额外维护路径追踪逻辑）。