从CSV生成嵌套XML的XSLT技巧

月夜之吻

发布时间：2026-02-01 09:08:02

180人浏览过

来源于php中文网

原创

应使用xsl:for-each-group group-by="order_id"在CSV转XML第一轮即分组，配合xsl:output indent="yes"确保格式正确，避免group-adjacent和disable-output-escaping。

从csv生成嵌套xml的xslt技巧

用 `xsl:for-each-group` 处理 CSV 中的层级关系

CSV 本身没有嵌套结构，但实际数据常隐含分组逻辑（比如同一 order_id 下多行 item）。直接用 xsl:for-each 会平铺所有行，无法生成 <order><items><item>...</item></items></order> 这类结构。必须先按关键字段分组。

常见错误是试图在 CSV 转 XML 后再用 XSLT 分组——此时已丢失原始行序和分组边界，容易错配。正确做法是在解析 CSV 的第一轮 XSLT 中就完成分组。

确保输入 CSV 已转为扁平 XML（如每行一个 <row>，每列一个子元素），且含可分组字段（如 <order_id>1001</order_id>）
使用 xsl:for-each-group group-by="order_id"，而非 group-adjacent ——后者依赖物理相邻，而 CSV 行序不保证逻辑分组连续
分组内用 xsl:for-each select="current-group()" 遍历该组所有行，再逐个映射为 <item>

处理 CSV 头部缺失或动态列名时的 `xsl:key` 替代方案

标准 CSV 解析后若无固定列名（如首行非 header，或列顺序不固定），@column-name 类路径表达式会失效。此时不能硬写 row/col2，需用位置索引 + 映射表。

典型场景：同一 XSLT 要处理不同版本 CSV（v1 有 qty，v2 改为 quantity），又不想维护多套样式表。

天工AI

昆仑万维推出的国内首款融入大语言模型的AI对话问答、AI搜索引擎，知识从这里开始。

下载

预先用 xsl:key 建立列名到索引的映射（如 key('col-index', 'quantity') → 3），但前提是 XML 化时保留了列定义
更稳妥的做法：在 CSV 转 XML 阶段就统一列名（例如用 Python 脚本预处理，把所有变体映射为 <quantity>），XSLT 只面向标准化 XML 工作
若必须纯 XSLT 处理，可用 xsl:variable name="headers" select="/csv/headers/column/text()" 提取首行，再用 index-of($headers, 'quantity') 动态定位，但要求 XSLT 2.0+ 且首行明确

`xsl:output method="xml"` 必须设 `indent="yes"` 且禁用 `disable-output-escaping`

嵌套 XML 若格式混乱，后期解析易出错。但很多人忽略 XSLT 输出控制，导致生成的 XML 所有标签挤在一行，或属性值被双重转义（如 而非 <code><）。

尤其当 CSV 字段含 XML 特殊字符（<、&、"）时，错误配置会让内容变成无效 XML。

<xsl:output method="xml" indent="yes" encoding="UTF-8"/> 是底线配置，indent="yes" 让嵌套结构可读且利于调试
绝对避免 disable-output-escaping="yes"，除非你 100% 确认字段内容是安全的 XML 片段——CSV 数据不可信，应让 XSLT 自动转义
如果字段含换行符（\n），XSLT 默认会保留，但某些 XML 解析器对文本节点中的 \n 敏感；可在模板中用 normalize-space() 或 replace(., '\n', ' ')（XSLT 2.0+）预处理

<xsl:stylesheet version="2.0"
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="xml" indent="yes" encoding="UTF-8"/>
  <xsl:template match="/csv">
    <orders>
      <xsl:for-each-group select="row" group-by="order_id">
        <order id="{current-grouping-key()}">
          <items>
            <xsl:for-each select="current-group()">
              <item sku="{sku}" qty="{qty}"/>
            </xsl:for-each>
          </items>
        </order>
      </xsl:for-each-group>
    </orders>
  </xsl:template>
</xsl:stylesheet>

真正卡住人的往往不是语法，而是 CSV 到 XML 的中间表示是否保留了分组线索——如果解析时把所有行压成同级 <row> 却没带原始行号或上下文标记，后续 XSLT 再怎么写分组逻辑都可能漏项或错绑。

Python Beautiful Soup解析XML 使用BS4提取XML标签数据

Python minidom writexml去除空行解决格式化输出多余空白问题

XML文件转Word Python python-docx-template模板填充

XML文件如何添加DOCTYPE声明 Python脚本插入DTD引用

Python xml.dom.minidom教程使用minidom格式化和解析XML

相关标签:

python csv for select xml 样式表 column

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java DOM如何复制和移动节点下一篇：C#如何用DataContractJsonSerializer处理XML

作者最新文章

Minimax自然风景提示词 Minimax航拍效果指令

2026-03-17 15:42

XML文件可以直接打印吗怎么调整XML打印排版布局

2026-03-17 15:45

C#生成带密码的ZIP C#如何创建加密的压缩文件

2026-03-17 16:11

XML文件如何通过HTTP OPTIONS查询 API支持的方法

2026-03-17 16:11

Bootstrap垂直分割线实现 Bootstrap如何在两列之间添加竖线

2026-03-17 16:13

c++单例模式实现方法 c++如何编写一个线程安全的单例

2026-03-17 16:14

Minimax视频生成写实风格提示词大全

2026-03-17 16:15

XML文件转Base64编码传输如何在JSON中安全传输XML内容

2026-03-17 16:21

c++ rvalue引用和move语义 c++如何避免不必要的拷贝

2026-03-17 16:24

c++ 静态代码分析工具 c++如何使用cppcheck或clang-tidy

2026-03-17 16:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1950

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2120

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1180

2024.11.28

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18