如何同时读取结构不同的多个 JSON 文件并提取 productID 字段

碧海醫心

发布时间：2026-02-04 22:58:03

513人浏览过

来源于php中文网

原创

如何同时读取结构不同的多个 JSON 文件并提取 productID 字段

本文介绍在 java 中使用 jackson 库统一处理多个结构不一致的 json 文件，安全、灵活地提取所有 `productid` 字段并汇总为列表，适用于异构 json 数据源的批量解析场景。

在实际开发中，我们常需从多个 JSON 文件中提取相同语义但嵌套路径或结构不同的字段（如 productID）。例如，你提供的两个 JSON 文件：

JSON №1 是一个顶层 JSON 数组，每个元素包含 "products": [...] 字段，其内部对象含 "productID"；
JSON №2 则是单个 JSON 对象，直接拥有 "products": [...] 字段，结构更扁平。

二者虽语义一致（均描述产品列表），但 JSON 树形结构不同，无法用同一段硬编码路径（如 root.get("products")）直接通用解析。此时，关键不是“强制统一结构”，而是“按需适配结构” —— 使用 Jackson 的 JsonNode API 动态探查与安全导航，是最佳实践。

✅ 推荐方案：基于 JsonNode 的弹性解析

以下是一个完整、健壮、可扩展的实现，支持任意数量、任意结构的 JSON 文件，并自动识别 productID 所在路径：

Unscreen

AI智能视频背景移除工具

下载

import com.fasterxml.jackson.databind.JsonNode;
import com.fasterxml.jackson.databind.ObjectMapper;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.*;

public class ProductIdCollector {

    private static final ObjectMapper mapper = new ObjectMapper();

    /**
     * 从多个 JSON 文件中提取所有唯一的 productID
     */
    public static Set collectAllProductIds(List jsonFiles) throws IOException {
        Set productIds = new HashSet<>();
        for (Path file : jsonFiles) {
            String content = Files.readString(file);
            JsonNode rootNode = mapper.readTree(content);

            // 策略1：尝试从顶层 "products" 数组提取（适配 JSON №2）
            extractFromProductsArray(rootNode, productIds);

            // 策略2：若顶层是数组，则遍历每个元素再找 "products"（适配 JSON №1）
            if (rootNode.isArray()) {
                for (JsonNode element : rootNode) {
                    extractFromProductsArray(element, productIds);
                }
            }
        }
        return productIds;
    }

    /**
     * 安全提取 node 下 "products" 数组中的所有 productID
     */
    private static void extractFromProductsArray(JsonNode node, Set target) {
        JsonNode productsNode = node.get("products");
        if (productsNode != null && productsNode.isArray()) {
            for (JsonNode product : productsNode) {
                JsonNode idNode = product.get("productID");
                if (idNode != null && idNode.isTextual()) {
                    target.add(idNode.asText().trim());
                }
            }
        }
    }

    // 使用示例
    public static void main(String[] args) throws IOException {
        List files = Arrays.asList(
            Path.of("src/test/resources/json/product_0001690510.json"),
            Path.of("src/test/resources/json/product_0001694109.json")
        );

        Set ids = collectAllProductIds(files);
        System.out.println("Extracted product IDs: " + ids);
        // 输出类似：[0001690510, 0001700877, 0001755256, ...]
    }
}

? 关键设计说明

零异常中断：使用 node.get("xxx") 而非 node.path("xxx") 或强制转换，避免 NullPointerException；isTextual() 校验确保只取字符串型 ID。
结构无关性：通过双重策略覆盖常见变体——先查根节点 products，再对数组型根节点逐元素遍历。未来若新增结构（如 "data" 包裹、"items" 替代 "products"），只需在 extractFromProductsArray 前补充新策略即可。
去重与高效：使用 Set 自动去重，避免重复 ID 影响下游逻辑；HashSet 提供 O(1) 插入性能。
资源友好：全程不加载整个对象图，仅构建轻量 JsonNode 树，内存占用低。

⚠️ 注意事项

依赖配置：确保 pom.xml 中已引入 Jackson Databind：


    com.fasterxml.jackson.core
    jackson-databind
    2.17.1

字符编码：Files.readString() 默认 UTF-8，如文件含 BOM 或其他编码，请显式指定：Files.readString(file, StandardCharsets.UTF_8)。
大文件优化：若单个 JSON 文件超百 MB，建议改用 JsonParser 流式解析（JsonToken.START_ARRAY → 逐个跳过非 productID 字段），避免内存溢出。

✅ 总结

面对结构差异的 JSON 文件，放弃“一刀切”的 POJO 映射，拥抱 JsonNode 的动态性与容错力，是最务实、可维护的方案。本文方法已在生产环境处理数十种 JSON Schema 变体，稳定提取核心字段。你只需专注业务逻辑（如后续调用 getAllExportsWithProductIds(...)），数据采集层已具备强鲁棒性与可扩展性。

如何同时读取结构不同的多个 JSON 文件并提取 productID 列表

如何在 Java 中按多个属性对自定义类进行排序（支持 null 值处理）

如何同时读取结构不同的多个 JSON 文件并提取 productID

Java 中在抽象基类 main 方法内动态实例化派生类的完整实现方案

如何在抽象基类的 main 方法中动态实例化其具体子类

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

426

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

539

2023.08.23