0

0

如何将含多值逗号分隔的 Excel 表格转换为嵌套 JSON 数组

霞舞

霞舞

发布时间:2026-03-16 09:23:14

|

420人浏览过

|

来源于php中文网

原创

本文详解如何使用 apache poi 读取 excel(.xlsx)文件,针对含逗号分隔值的单元格(如“6-a,7-b,8-a”或“tamil,english,maths”),自动解析并构造成结构化 jsonarray,支持多层嵌套对象(如 class-section 对、subject 列表)。

本文详解如何使用 apache poi 读取 excel(.xlsx)文件,针对含逗号分隔值的单元格(如“6-a,7-b,8-a”或“tamil,english,maths”),自动解析并构造成结构化 jsonarray,支持多层嵌套对象(如 class-section 对、subject 列表)。

在 Java 后端开发中,常需将业务人员提供的 Excel 配置表(如教师-班级-科目映射表)转换为标准 JSON 格式供 API 或前端消费。当 Excel 单元格内存储多个逻辑项(如 class&Section 列值为 "6-A,7-B,8-A",Subject 列值为 "Tamil,English,Maths")时,直接逐单元格转 JSON 会导致扁平化结构,无法满足嵌套数组需求。本教程提供一套健壮、可维护、符合 RESTful 数据规范的解决方案,基于 Apache POI + org.json(或 Alibaba FastJSON),无需引入复杂 ORM,纯内存解析。

✅ 核心设计原则

  • 表头驱动:动态读取首行作为 JSON 字段名(如 "Teacher_code", "class&Section", "Subject"),提升配置灵活性;
  • 类型智能识别:区分 STRING 与 NUMERIC 单元格,避免科学计数法(如 2.34566E7)误解析;
  • 语义化拆分:对含分隔符字段按业务规则解析——
    • 若含 "-"(如 "6-A")→ 拆为 { "class": "6", "section": "A" };
    • 若无 "-"(如 "Tamil")→ 视为独立 subject → { "subject": "Tamil" };
  • 资源安全释放:使用 try-with-resources 确保 InputStream 和 Workbook 及时关闭。

? 完整实现代码(含注释)

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.json.JSONArray;
import org.json.JSONObject;

import java.io.IOException;
import java.io.InputStream;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.text.NumberFormat;
import java.util.*;
import java.util.stream.Collectors;

public class ExcelToNestedJson {

    public static void main(String[] args) throws Exception {
        Path excelPath = Paths.get("school.xlsx"); // 替换为实际路径

        try (InputStream in = Files.newInputStream(excelPath);
             Workbook workbook = new XSSFWorkbook(in)) {

            Sheet sheet = workbook.getSheetAt(0);
            if (sheet == null) throw new IllegalArgumentException("Sheet is empty or invalid");

            // ✅ 步骤1:读取表头(首行),作为 JSON 键名
            Row headerRow = sheet.getRow(sheet.getFirstRowNum());
            List<String> headers = new ArrayList<>();
            for (int j = headerRow.getFirstCellNum(); j < headerRow.getLastCellNum(); j++) {
                Cell cell = headerRow.getCell(j);
                headers.add(cell != null && cell.getCellType() == CellType.STRING 
                    ? cell.getStringCellValue().trim() 
                    : "column_" + j);
            }

            // ✅ 步骤2:遍历数据行(跳过首行)
            List<JSONObject> resultArray = new ArrayList<>();
            for (int i = sheet.getFirstRowNum() + 1; i <= sheet.getLastRowNum(); i++) {
                Row row = sheet.getRow(i);
                if (row == null) continue; // 跳过空行

                JSONObject teacherObj = new JSONObject();

                // ✅ 步骤3:逐列解析,按表头名和单元格内容生成嵌套结构
                for (int j = row.getFirstCellNum(); j < row.getLastCellNum(); j++) {
                    Cell cell = row.getCell(j);
                    if (cell == null) continue;

                    String header = headers.get(j);
                    JSONArray jsonArray = new JSONArray();

                    switch (cell.getCellType()) {
                        case STRING:
                            String rawValue = cell.getStringCellValue().trim();
                            if (!rawValue.isEmpty()) {
                                String[] values = rawValue.split("\s*,\s*"); // 健壮分割:忽略逗号前后空格
                                for (String v : values) {
                                    v = v.trim();
                                    JSONObject item = new JSONObject();
                                    if (v.contains("-")) { // 处理 "class-section" 类型(如 "6-A")
                                        String[] parts = v.split("-", 2);
                                        item.put("class", parts[0]);
                                        item.put("section", parts.length > 1 ? parts[1] : "");
                                    } else if (header.toLowerCase().contains("subject")) { // 主题类字段
                                        item.put("subject", v);
                                    } else { // 其他字符串字段(如教师编码)
                                        item.put(header, v);
                                    }
                                    jsonArray.put(item);
                                }
                            }
                            teacherObj.put(header, jsonArray);
                            break;

                        case NUMERIC:
                            // 防止科学计数法,统一转为字符串(适用于教师编号等非数值计算场景)
                            NumberFormat nf = NumberFormat.getInstance(Locale.US);
                            nf.setGroupingUsed(false);
                            String numStr = nf.format(cell.getNumericCellValue());
                            // 教师编码列通常为数字但需保留前导零 → 存为字符串
                            if (j == 0) {
                                teacherObj.put(header, numStr);
                            } else {
                                // 其他数值列若需作为 class 单独处理(无 section),可扩展此处逻辑
                                JSONObject singleClass = new JSONObject();
                                singleClass.put("class", numStr);
                                jsonArray.put(singleClass);
                                teacherObj.put(header, jsonArray);
                            }
                            break;

                        default:
                            teacherObj.put(header, "");
                    }
                }
                resultArray.add(teacherObj);
            }

            // ✅ 输出最终 JSON 数组(格式化缩进便于调试)
            System.out.println(new JSONObject().put("data", new JSONArray(resultArray)).toString(2));
        } catch (IOException e) {
            throw new RuntimeException("Failed to read Excel file", e);
        }
    }
}

⚠️ 关键注意事项

  • 依赖配置:确保 pom.xml 中包含:
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>5.2.4</version>
    </dependency>
    <dependency>
        <groupId>org.json</groupId>
        <artifactId>json</artifactId>
        <version>20231013</version>
    </dependency>
  • 空单元格/空行处理:代码中已加入 if (row == null) continue 和 if (cell == null) continue,避免 NPE;
  • 分隔符鲁棒性:使用正则 \s*,\s* 分割,兼容 "6-A, 7-B ,8-A" 等含空格格式;
  • 字段映射灵活性:通过 header.toLowerCase().contains("subject") 判断主题列,可按需改为精确匹配(如 header.equals("Subject"));
  • 性能提示:对于超大 Excel(>10MB),建议改用 SXSSFWorkbook 流式读取,避免 OOM。

✅ 验证输出示例

输入 Excel 行:
| Teacher_code | class&Section | Subject |
|--------------|----------------|-------------------|
| 23424234 | 6-A,7-B,8-A | Tamil,English,Maths |

输出 JSON 片段:

Tweeze
Tweeze

Tweeze.app是一个AI驱动的个性化新闻简报服务,定位为个人互联网AI阅读助手

下载
{
  "data": [
    {
      "Teacher_code": "23424234",
      "class&Section": [
        { "class": "6", "section": "A" },
        { "class": "7", "section": "B" },
        { "class": "8", "section": "A" }
      ],
      "Subject": [
        { "subject": "Tamil" },
        { "subject": "English" },
        { "subject": "Maths" }
      ]
    }
  ]
}

该方案兼顾可读性、可维护性与生产健壮性,可直接集成至 Spring Boot Controller 或定时任务中,成为 Excel 配置驱动服务的标准解析模块。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

161

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

89

2026.01.26

spring boot框架优点
spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容,供大家免费下载体验。

139

2023.09.05

spring框架有哪些
spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍:1、Spring Core,通过将对象的创建和依赖关系的管理交给容器来实现,从而降低了组件之间的耦合度;2、Spring MVC,提供基于模型-视图-控制器的架构,用于开发灵活和可扩展的Web应用程序等。

411

2023.10.12

Java Spring Boot开发
Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开,系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识,并通过电商平台、博客系统与企业管理系统等项目实战,帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

73

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性
Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架,它通过 约定优于配置的原则,大幅简化了 Spring 应用的初始搭建、配置和开发过程,让开发者可以快速构建独立的、生产级别的 Spring 应用,无需繁琐的样板配置,通常集成嵌入式服务器(如 Tomcat),提供“开箱即用”的体验,是构建微服务和 Web 应用的流行工具。

154

2025.12.22

Java Spring Boot 微服务实战
Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用,内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例(如电商订单系统),帮助开发者掌握 从单体应用迁移到高可用微服务系统的完整流程与实战能力。

273

2025.12.24

Spring Boot企业级开发与MyBatis Plus实战
Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者,系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例,帮助开发者提升后端开发效率,减少重复代码,快速交付稳定可维护的业务系统。

35

2026.02.11

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号