如何同时读取结构不同的多个 JSON 文件并提取 productID 列表

心靈之曲

发布时间：2026-02-04 21:26:13

529人浏览过

来源于php中文网

原创

如何同时读取结构不同的多个 JSON 文件并提取 productID 列表

本文介绍在 java 中使用 jackson 库灵活解析多个结构不一致的 json 文件，统一提取所有 `productid` 字段并去重合并为一个列表，适用于异构 json 数据源的批量处理场景。

在实际开发中，我们常需从多个 JSON 文件中提取相同语义但嵌套路径或结构不同的字段（如 productID）。例如，你提供的两个 JSON 文件：

JSON №1 是顶层为 JSON 数组，每个元素含 "products": [...] 字段，其中对象含 "productID"；
JSON №2 是单个 JSON 对象，直接包含 "products": [...] 数组，结构更扁平。

二者虽字段名一致，但根节点类型（ArrayNode vs ObjectNode）和层级不同，无法用单一 POJO 或固定路径硬编码解析。此时应采用 Jackson 的树模型（Tree Model） —— 即 JsonNode，配合动态路径探测与容错遍历，实现“结构无关”的健壮解析。

✅ 推荐方案：基于 JsonNode 的泛化解析

以下是一个完整、可复用的工具方法，支持传入任意数量的 JSON 文件路径，并自动适配两种常见结构：

ExcelFormulaBot

在AI帮助下将文本指令转换为Excel函数公式

下载

import com.fasterxml.jackson.databind.JsonNode;
import com.fasterxml.jackson.databind.ObjectMapper;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.*;

public class ProductIdExtractor {

    private static final ObjectMapper mapper = new ObjectMapper();

    /**
     * 从多个 JSON 文件中提取全部 productID，自动适配不同结构（数组根 or 对象根 + products 字段）
     */
    public static Set extractAllProductIds(List jsonPaths) throws IOException {
        Set allProductIds = new LinkedHashSet<>(); // 保持插入顺序且去重

        for (Path path : jsonPaths) {
            String content = Files.readString(path);
            JsonNode rootNode = mapper.readTree(content);

            // 情况1：根节点是数组 → 遍历每个元素，查找其下的 "products" 数组
            if (rootNode.isArray()) {
                for (JsonNode element : rootNode) {
                    extractFromProductsField(element, allProductIds);
                }
            }
            // 情况2：根节点是对象 → 直接在其下查找 "products" 数组
            else if (rootNode.isObject()) {
                extractFromProductsField(rootNode, allProductIds);
            }
            // 其他情况（如纯字符串/数字）跳过，可按需添加日志警告
        }
        return allProductIds;
    }

    /**
     * 统一从任意 JsonNode 中尝试提取 "products" 数组内的所有 productID
     */
    private static void extractFromProductsField(JsonNode node, Set target) {
        JsonNode productsNode = node.get("products");
        if (productsNode != null && productsNode.isArray()) {
            for (JsonNode product : productsNode) {
                JsonNode idNode = product.get("productID");
                if (idNode != null && idNode.isTextual()) {
                    target.add(idNode.asText().trim());
                }
            }
        }
    }

    // 使用示例
    public static void main(String[] args) throws IOException {
        List paths = Arrays.asList(
            Path.of("src/test/resources/json/product_0001690510.json"),
            Path.of("src/test/resources/json/product_0001694109.json")
        );

        Set productIds = extractAllProductIds(paths);
        System.out.println("Extracted product IDs: " + productIds);
        // 输出类似：[0001690510, 0001700877, 0001694109, ...]
    }
}

? 关键设计说明

结构无关性：通过 rootNode.isArray() / rootNode.isObject() 动态判断根类型，避免 ClassCastException；
路径鲁棒性：使用 node.get("products") 安全获取子节点（返回 null 而非抛异常），再检查是否为数组；
字段容错：对每个 product 对象，仅当 productID 存在且为字符串时才提取，跳过缺失或类型错误项；
去重与有序：使用 LinkedHashSet 保证 ID 唯一性，同时保留首次出现顺序（便于调试）；
零依赖 POJO：无需为每种 JSON 结构定义 Java 类，降低维护成本。

⚠️ 注意事项

确保项目已引入 Jackson Databind：



    com.fasterxml.jackson.core
    jackson-databind
    2.17.0

若 JSON 文件极大（>100MB），建议改用 JsonParser 流式解析以节省内存；
如需支持更多结构变体（如 product_id、productId 多种命名），可在 extractFromProductsField 中扩展别名映射逻辑；
生产环境建议增加 try-catch 包裹单文件解析，并记录失败文件路径以便排查。

该方案将“解析异构 JSON”这一痛点转化为清晰、可测试、易扩展的通用逻辑，真正实现“一次编写，多结构兼容”。

将 JSON 数据高效映射为类型安全、可访问的 Java 对象

Java中数组声明与初始化的常见错误解析

Java中在抽象基类main方法内动态实例化派生类的完整教程

生成基于XSD动态构建表单并导出XML的Java解决方案

如何在Java中正确解析嵌套JSON数组中的对象元素

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

426

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

538

2023.08.23