0

0

如何同时读取结构不同的多个 JSON 文件并提取 productID 列表

心靈之曲

心靈之曲

发布时间:2026-02-04 21:26:13

|

529人浏览过

|

来源于php中文网

原创

如何同时读取结构不同的多个 JSON 文件并提取 productID 列表

本文介绍在 java 中使用 jackson 库灵活解析多个结构不一致的 json 文件,统一提取所有 `productid` 字段并去重合并为一个列表,适用于异构 json 数据源的批量处理场景。

在实际开发中,我们常需从多个 JSON 文件中提取相同语义但嵌套路径或结构不同的字段(如 productID)。例如,你提供的两个 JSON 文件:

  • JSON №1 是顶层为 JSON 数组,每个元素含 "products": [...] 字段,其中对象含 "productID";
  • JSON №2 是单个 JSON 对象,直接包含 "products": [...] 数组,结构更扁平。

二者虽字段名一致,但根节点类型(ArrayNode vs ObjectNode)和层级不同,无法用单一 POJO 或固定路径硬编码解析。此时应采用 Jackson 的树模型(Tree Model) —— 即 JsonNode,配合动态路径探测与容错遍历,实现“结构无关”的健壮解析。

✅ 推荐方案:基于 JsonNode 的泛化解析

以下是一个完整、可复用的工具方法,支持传入任意数量的 JSON 文件路径,并自动适配两种常见结构:

ExcelFormulaBot
ExcelFormulaBot

在AI帮助下将文本指令转换为Excel函数公式

下载
import com.fasterxml.jackson.databind.JsonNode;
import com.fasterxml.jackson.databind.ObjectMapper;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.*;

public class ProductIdExtractor {

    private static final ObjectMapper mapper = new ObjectMapper();

    /**
     * 从多个 JSON 文件中提取全部 productID,自动适配不同结构(数组根 or 对象根 + products 字段)
     */
    public static Set extractAllProductIds(List jsonPaths) throws IOException {
        Set allProductIds = new LinkedHashSet<>(); // 保持插入顺序且去重

        for (Path path : jsonPaths) {
            String content = Files.readString(path);
            JsonNode rootNode = mapper.readTree(content);

            // 情况1:根节点是数组 → 遍历每个元素,查找其下的 "products" 数组
            if (rootNode.isArray()) {
                for (JsonNode element : rootNode) {
                    extractFromProductsField(element, allProductIds);
                }
            }
            // 情况2:根节点是对象 → 直接在其下查找 "products" 数组
            else if (rootNode.isObject()) {
                extractFromProductsField(rootNode, allProductIds);
            }
            // 其他情况(如纯字符串/数字)跳过,可按需添加日志警告
        }
        return allProductIds;
    }

    /**
     * 统一从任意 JsonNode 中尝试提取 "products" 数组内的所有 productID
     */
    private static void extractFromProductsField(JsonNode node, Set target) {
        JsonNode productsNode = node.get("products");
        if (productsNode != null && productsNode.isArray()) {
            for (JsonNode product : productsNode) {
                JsonNode idNode = product.get("productID");
                if (idNode != null && idNode.isTextual()) {
                    target.add(idNode.asText().trim());
                }
            }
        }
    }

    // 使用示例
    public static void main(String[] args) throws IOException {
        List paths = Arrays.asList(
            Path.of("src/test/resources/json/product_0001690510.json"),
            Path.of("src/test/resources/json/product_0001694109.json")
        );

        Set productIds = extractAllProductIds(paths);
        System.out.println("Extracted product IDs: " + productIds);
        // 输出类似:[0001690510, 0001700877, 0001694109, ...]
    }
}

? 关键设计说明

  • 结构无关性:通过 rootNode.isArray() / rootNode.isObject() 动态判断根类型,避免 ClassCastException;
  • 路径鲁棒性:使用 node.get("products") 安全获取子节点(返回 null 而非抛异常),再检查是否为数组;
  • 字段容错:对每个 product 对象,仅当 productID 存在且为字符串时才提取,跳过缺失或类型错误项;
  • 去重与有序:使用 LinkedHashSet 保证 ID 唯一性,同时保留首次出现顺序(便于调试);
  • 零依赖 POJO:无需为每种 JSON 结构定义 Java 类,降低维护成本。

⚠️ 注意事项

  • 确保项目已引入 Jackson Databind:
    
    
        com.fasterxml.jackson.core
        jackson-databind
        2.17.0
    
  • 若 JSON 文件极大(>100MB),建议改用 JsonParser 流式解析以节省内存;
  • 如需支持更多结构变体(如 product_id、productId 多种命名),可在 extractFromProductsField 中扩展别名映射逻辑;
  • 生产环境建议增加 try-catch 包裹单文件解析,并记录失败文件路径以便排查。

该方案将“解析异构 JSON”这一痛点转化为清晰、可测试、易扩展的通用逻辑,真正实现“一次编写,多结构兼容”。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

426

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

538

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

313

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

78

2025.09.10

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

238

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

560

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

381

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

213

2023.09.04

抖音网页版入口与视频观看指南 抖音官网视频在线访问
抖音网页版入口与视频观看指南 抖音官网视频在线访问

本专题汇总了抖音网页版的入口链接、官方登录页面以及视频观看入口,帮助用户快速访问抖音网页版,提供免登录访问方式和直接进入视频播放页面的方法,确保顺利浏览和观看抖音视频。

61

2026.02.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.2万人学习

C# 教程
C# 教程

共94课时 | 8.5万人学习

Java 教程
Java 教程

共578课时 | 57.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号