怎么在Java中读取Excel文件_Apache POI库解析xls/xlsx实战

P粉602998670

发布时间：2026-03-12 10:56:08

500人浏览过

来源于php中文网

原创

应使用workbookfactory.create(inputstream)自动识别.xls/.xlsx格式；索引从0开始，空单元格需用missingcellpolicy处理；大文件用streamingreader或sax解析；中文、日期、公式需分别配置编码、样式和formulaevaluator。

怎么在java中读取excel文件_apache poi库解析xls/xlsx实战

读取 `.xls` 和 `.xlsx` 文件要用不同类，别混用

Apache POI 对两种格式的底层处理完全不同：HSSFWorkbook 专用于旧版二进制 .xls，XSSFWorkbook 用于新版 XML 格式 .xlsx。直接拿 XSSFWorkbook 去读 .xls 文件会抛出 InvalidFormatException；反过来用 HSSFWorkbook 读 .xlsx 则报 OfficeXmlFileException。

实操建议：

立即学习“Java免费学习笔记（深入）”；

优先用 WorkbookFactory.create(InputStream) —— 它自动识别格式，返回 Workbook 接口实例，不用手动判断
如果必须显式指定，检查文件扩展名或魔数（如 InputStream.mark(8); InputStream.read()）再选类
.xlsb、.xlsm 等变体也得走 XSSFWorkbook，但需确保依赖了 poi-ooxml 模块

`Sheet` 和 `Row` 的索引从 0 开始，但 Excel 界面显示从 1

这是新手最常踩的坑：调用 sheet.getRow(1) 拿到的是 Excel 里第 2 行（即界面显示的“第2行”），不是标题行。如果表头在第1行，实际要取 getRow(0)。

实操建议：

立即学习“Java免费学习笔记（深入）”；

遍历 sheet 时用 sheet.getFirstRowNum() 和 sheet.getLastRowNum()，别硬写 0 或 1000
row.getCell(0) 可能返回 null（空单元格未创建），要用 row.getCell(0, Row.MissingCellPolicy.CREATE_NULL_AS_BLANK) 避免 NPE
数值型单元格默认读出来是 double，比如 “123” 会变成 123.0，需用 cell.getNumericCellValue() + 类型判断转成整型或字符串

内存占用大？用 `StreamingReader` 或 `SAX` 模式读大文件

默认的 XSSFWorkbook 把整个 .xlsx 解压进内存，10MB 文件可能吃掉 500MB 堆空间。5万行以上就容易 OutOfMemoryError。

智简简历

免费AI简历制作工具，智能生成、可视化编辑、多格式导出。

下载

实操建议：

立即学习“Java免费学习笔记（深入）”；

对只读场景，用 org.apache.poi.ss.usermodel.StreamingReader（需额外引入 poi-scratchpad）—— 支持逐行流式读，内存稳定在几 MB
超大数据（百万行+），直接上 OPCPackage + XSSFReader + SAX 解析，跳过 Workbook 层，但要自己解析 XML 结构
.xls 大文件没流式方案，只能分批读（如每次读 1000 行）+ 及时 row.dispose()

中文乱码、日期错乱、公式不计算？看这三处配置

POI 默认不处理编码和样式上下文，很多“读出来不对”其实不是 bug，是没设对参数。

实操建议：

立即学习“Java免费学习笔记（深入）”；

中文乱码：确保文件本身是 UTF-8 或 GBK 编码（Excel 保存时选“另存为 → 工具 → Web 选项 → 编码”），POI 不负责解码文本内容，它只是原样读取字符串
日期错乱：调用 cell.getDateCellValue() 前先 cell.getCellStyle().getDataFormatString() 确认是否真为日期类型；否则可能被当成数字（Excel 内部用浮点数存日期）
公式不计算：默认只读公式字符串（如 "=SUM(A1:A10)"），要结果得用 FormulaEvaluator，且注意 XSSFFormulaEvaluator 必须绑定到 XSSFWorkbook 实例

复杂点在于：同一个 Excel 文件里可能混合文本、数字、日期、布尔、错误值五种单元格类型，cell.getCellType() 在新版本已弃用，必须用 cell.getType() + switch 分支处理，漏一种就可能崩。

初学者如何用Java实现一个控制台版的游戏英雄属性计算器_OOP实践

如何在Java中打印输出九九乘法表_双重for循环经典案例

怎么在Java中计算程序的运行时间_System.currentTimeMillis用法

如何在Java中查找List的众数_频率统计与Collections.max的联合应用

如何使用Java IO流开发一个文本日记本程序_文件读写与控制台交互

相关标签:

java NULL switch xml 整型字符串 double 接口堆 apache bug excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java中的类初始化锁(Class Initialization Lock)_多线程加载类安全机制下一篇：什么是Java的守护线程(Daemon Thread)_垃圾回收线程与用户线程的区别

作者最新文章

CSS如何定义非标准的自定义品牌色_通过CSS变量引用预设十六进制

2026-03-12 10:49

Java中的String类常用方法有哪些_字符串操作与正则表达式匹配全解

2026-03-12 10:49

如何为Golang配置本地Kubernetes集群 Go语言Kind/Minikube环境

2026-03-12 10:51

Python Tkinter事件绑定怎么写_bind()方法绑定键盘按键(‘’)与鼠标点击事件

2026-03-12 10:51

mysql如何处理主库宕机后的数据找回_mysql binlog解析补齐

2026-03-12 10:53

mysql如何设置内核刷新频率_mysql innodb_flush_log_at_trx_commit

2026-03-12 10:53

如何在Golang中实现OpenTelemetry分布式追踪 Go语言云原生可观测性

2026-03-12 10:53

如何升级MySQL数据库版本_In-Place升级与逻辑备份迁移

2026-03-12 10:54

mysql错误日志在哪看_mysql日志路径查看方法

2026-03-12 10:55

Java中的类初始化锁(Class Initialization Lock)_多线程加载类安全机制

2026-03-12 10:55

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1089

2024.03.01

switch语句用法

switch语句用法：1、Switch语句只能用于整数类型，枚举类型和String类型，不能用于浮点数类型和布尔类型；2、每个case语句后面必须跟着一个break语句，以防止执行其他case的代码块，没有break语句，将会继续执行下一个case的代码块；3、可以在一个case语句中匹配多个值，使用逗号分隔；4、Switch语句中的default代码块是可选的等等。

569

2023.09.21

Java switch的用法

Java中的switch语句用于根据不同的条件执行不同的代码块。想了解更多switch的相关内容，可以阅读本专题下面的文章。

441

2024.03.13

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1947

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1168

2024.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

760

2023.08.03

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板