0

0

服务器端如何解压上传的zip包并读取其中的XML

煙雲

煙雲

发布时间:2026-01-30 10:21:09

|

995人浏览过

|

来源于php中文网

原创

需用服务端语言解压ZIP并解析XML:Python用zipfile+ElementTree、Java用ZipInputStream+DocumentBuilder、Node.js用adm-zip+xml2js、PHP用ZipArchive+SimpleXML、.NET用ZipArchive+XDocument。

服务器端如何解压上传的zip包并读取其中的xml

如果您在服务器端接收到客户端上传的 ZIP 文件,并需要从中解压并读取内部的 XML 文件内容,则需通过服务端编程语言提供的压缩处理与文件解析能力完成。以下是实现此目标的具体方法:

一、使用 Python 的 zipfile 模块解压并解析 XML

该方法适用于基于 Python 的后端(如 Flask、Django),利用标准库 zipfile 读取 ZIP 内容,无需完整解压到磁盘,可直接从内存中提取 XML 文件字节流并交由 xml.etree.ElementTree 解析。

1、接收上传的 ZIP 文件对象(例如 Flask 中 request.files['file'])。

2、使用 zipfile.ZipFile() 打开上传的文件对象,确保 mode='r'。

3、遍历 ZIP 文件内所有成员,筛选出扩展名为 .xml 的文件路径。

4、调用 zip_file.read(xml_filename) 获取 XML 内容字节流。

5、将字节流转为字符串后,用 xml.etree.ElementTree.fromstring() 加载为 XML 树结构。

6、对解析后的 root 元素执行 XPath 查询或迭代子节点以提取所需数据。

二、使用 Java 的 java.util.zip 与 javax.xml.parsers 解析

该方法适用于 Spring Boot 或传统 Servlet 环境,通过 ZipInputStream 流式读取 ZIP 条目,避免将整个 ZIP 文件写入临时磁盘,提升安全性与性能。

1、从 HttpServletRequest 获取 InputStream 并包装为 ZipInputStream。

2、循环调用 getNextEntry() 获取每个 ZipEntry 对象。

3、检查 entry.getName().toLowerCase().endsWith(".xml") 判断是否为 XML 文件。

4、使用 ByteArrayOutputStream 缓存当前 entry 的字节内容,再转为 ByteArrayInputStream 供 DocumentBuilder.parse() 使用。

5、通过 DocumentBuilderFactory.newInstance().newDocumentBuilder() 创建解析器实例。

6、调用 parse() 方法加载 XML 内容,之后使用 getElementsByTagName() 或 XPath 表达式提取节点值。

三、使用 Node.js 的 adm-zip 与 xml2js 库处理

该方法适用于 Express.js 等 Node 后端环境,借助 adm-zip 提取 ZIP 中指定文件,再用 xml2js 将 XML 字符串转换为 JavaScript 对象进行操作。

1、通过 multer 中间件接收 multipart/form-data 类型上传的 ZIP 文件。

2、使用 new AdmZip(filePath) 实例化 ZIP 对象。

3、调用 extractAllTo(targetPath, true) 将 ZIP 全部内容解压至临时目录,或使用 getEntries() 遍历条目。

Skybox AI
Skybox AI

一键将涂鸦转为360°无缝环境贴图的AI神器

下载

4、筛选 entries.filter(entry => entry.entryName.endsWith('.xml')) 获取 XML 条目。

5、调用 entry.getData() 获取 Buffer 数据,再 toString('utf8') 转为 XML 字符串。

6、传入 xml2js.parseString() 回调函数,在回调中处理生成的 JS 对象结构。

四、使用 PHP 的 ZipArchive 与 SimpleXML 扩展

该方法适用于基于 PHP 的服务端(如 Laravel、原生 PHP),利用内置 ZipArchive 类打开 ZIP 包,配合 SimpleXMLLoadString 解析内存中的 XML 字符串。

1、使用 $_FILES['zip_file']['tmp_name'] 获取上传 ZIP 的临时路径。

2、实例化 new ZipArchive() 并调用 open() 方法加载 ZIP 文件。

3、使用 numFiles 属性获取总条目数,循环调用 getNameIndex(i) 获取每个文件名。

4、判断 strpos($filename, '.xml') !== false 且 substr($filename, -4) === '.xml' 确认 XML 文件。

5、调用 getFromIndex(i) 获取对应 XML 文件的原始内容字符串。

6、使用 simplexml_load_string() 将字符串加载为 SimpleXMLElement 对象,再通过 -> 运算符访问节点属性与文本。

五、使用 .NET Core 的 System.IO.Compression 与 System.Xml.Linq

该方法适用于 ASP.NET Core Web API,通过 ZipArchive 类读取上传的 Stream,结合 XDocument.Load() 直接解析 XML 字节流,全程不依赖临时文件系统。

1、从 IFormFile 接口获取上传文件的 OpenReadStream() 返回的 Stream。

2、使用 new ZipArchive(stream, ZipArchiveMode.Read) 创建只读归档实例。

3、遍历 archive.Entries 属性,筛选 entry.FullName.EndsWith(".xml", StringComparison.OrdinalIgnoreCase) 的条目。

4、调用 entry.Open() 获取其内容 Stream,并传递给 XmlReader.Create() 构造阅读器。

5、使用 XDocument.Load(xmlReader) 加载为 XDocument 对象。

6、通过 Descendants()、Elements() 或 XPathSelectElement() 方法定位目标节点并提取值。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
laravel组件介绍
laravel组件介绍

laravel 提供了丰富的组件,包括身份验证、模板引擎、缓存、命令行工具、数据库交互、对象关系映射器、事件处理、文件操作、电子邮件发送、队列管理和数据验证。想了解更多laravel的相关内容,可以阅读本专题下面的文章。

320

2024.04.09

laravel中间件介绍
laravel中间件介绍

laravel 中间件分为五种类型:全局、路由、组、终止和自定。想了解更多laravel中间件的相关内容,可以阅读本专题下面的文章。

278

2024.04.09

laravel使用的设计模式有哪些
laravel使用的设计模式有哪些

laravel使用的设计模式有:1、单例模式;2、工厂方法模式;3、建造者模式;4、适配器模式;5、装饰器模式;6、策略模式;7、观察者模式。想了解更多laravel的相关内容,可以阅读本专题下面的文章。

373

2024.04.09

thinkphp和laravel哪个简单
thinkphp和laravel哪个简单

对于初学者来说,laravel 的入门门槛较低,更易上手,原因包括:1. 更简单的安装和配置;2. 丰富的文档和社区支持;3. 简洁易懂的语法和 api;4. 平缓的学习曲线。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

374

2024.04.10

laravel入门教程
laravel入门教程

本专题整合了laravel入门教程,想了解更多详细内容,请阅读专题下面的文章。

86

2025.08.05

laravel实战教程
laravel实战教程

本专题整合了laravel实战教程,阅读专题下面的文章了解更多详细内容。

65

2025.08.05

laravel面试题
laravel面试题

本专题整合了laravel面试题相关内容,阅读专题下面的文章了解更多详细内容。

68

2025.08.05

spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

115

2025.08.06

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

8

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 10.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号