0

0

在Java中如何实现数据导入导出功能_Java文件数据项目说明

P粉602998670

P粉602998670

发布时间:2026-01-21 09:05:02

|

760人浏览过

|

来源于php中文网

原创

Java数据导入导出核心是明确格式、边界与错误粒度:POI易OOM需流式读取,CSV须遵循RFC 4180并加BOM,导出需熔断校验与业务规则统一转换。

在java中如何实现数据导入导出功能_java文件数据项目说明

Java 中实现数据导入导出,核心不在于“用什么框架”,而在于「明确数据格式、边界场景和错误处理粒度」。Excel 是高频需求,但直接手写 POI 逻辑极易写出内存溢出、日期错乱、空指针或公式误读的代码;CSV 看似简单,却常因分隔符冲突、换行嵌套、编码不一致导致解析失败。

用 Apache POI 处理 Excel 导入时为什么 WorkbookFactory.create(inputStream) 会 OOM?

因为默认加载方式将整个 .xlsx 文件解压并构建 DOM 式对象树,10MB 文件可能占用 500MB 堆内存。尤其在 Web 环境中,多个并发上传极易触发 Full GC 或直接 java.lang.OutOfMemoryError: Java heap space

  • 改用 StreamingReader.builder().rowCacheSize(100).read(inputStream)(需引入 excel-streaming-reader 库),按行流式拉取,内存占用稳定在 MB 级
  • 避免调用 cell.getStringCellValue() 前不判空 —— cellnull 时抛 NullPointerException
  • 日期类型单元格必须用 cell.getDateCellValue(),而非先 getStringCellValue() 再 parse,否则返回的是 Excel 内部序列值(如 44926.0
  • 若模板含合并单元格,Row.getCell(int) 可能返回 null,需配合 Sheet.getMergedRegion() 手动查找归属值

导出 CSV 时中文乱码、字段含逗号或换行怎么办?

本质是没遵循 RFC 4180 标准:字段必须用双引号包裹,内部双引号要转义为两个双引号,换行符必须在双引号内,且文件必须以 UTF-8 BOM 开头(否则 Windows 记事本默认用 GBK 解码)。

  • 不要自己拼接字符串,用 OpenCSVCsvWriterApache Commons CSVCSVPrinter
  • 创建 OutputStreamWriter 时显式指定 StandardCharsets.UTF_8,并在首行写入 \uFEFF(BOM)
  • 字段含双引号时,CSVPrinter.print("他说\"Hello\"") 会自动转义为 "他说""Hello"""
  • 避免用 FileWriter —— 它默认使用平台编码(Windows 是 GBK),必然乱码
try (OutputStream os = response.getOutputStream();
     OutputStreamWriter osw = new OutputStreamWriter(os, StandardCharsets.UTF_8);
     BufferedWriter bw = new BufferedWriter(osw);
     CSVPrinter printer = new CSVPrinter(bw, CSVFormat.DEFAULT.withFirstRecordAsHeader())) {
    // 写入 BOM
    bw.write('\uFEFF');
    // 写表头和数据
    printer.printRecord("姓名", "城市", "备注");
    printer.printRecord("张三", "上海", "第一行\n含换行");
}

Spring Boot 项目中如何统一拦截导出请求并防止恶意大文件生成?

导出接口若无校验,攻击者可构造 ?limit=10000000 参数触发全表导出,拖垮数据库和 JVM。不能只靠前端限制,后端必须做硬性熔断。

Anyword
Anyword

AI文案写作助手和文本生成器,具有可预测结果的文案 AI

下载

立即学习Java免费学习笔记(深入)”;

  • 在 Controller 方法上加 @PreAuthorize("@exportAuthChecker.check(#params) == true"),自定义 ExportAuthChecker Bean 校验用户角色 + 当前时间窗口内导出次数 + 查询条件是否含必要过滤字段(如 tenant_id
  • 使用 @Async 将导出任务扔进独立线程池(ThreadPoolTaskExecutor 配置 maxPoolSize=3),避免阻塞主线程
  • 导出前执行 SELECT COUNT(*),若超阈值(如 10 万行)直接抛 ExportLimitException 并返回 400 Bad Request
  • 生成文件后不存磁盘,而是用 ResponseEntity 直接流式写回,避免临时文件清理遗漏

真正难的不是读写文件,而是把业务规则映射到每一行数据:比如导出订单时,“支付状态”字段要从 pay_status 整型转成“已支付/退款中/已关闭”,而导入时又要反向校验该文本能否映射回合法枚举值。这类转换逻辑一旦散落在各处,维护成本远高于 IO 本身。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

841

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

742

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

738

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

399

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

5

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 12.6万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号