用 xml.etree.elementtree 解析 xml 后需手动构建合法 html 结构(含 ),并用 html.escape() 转义特殊字符,再保存为 .html 文件;直接改后缀或输出原始 xml 会导致浏览器无法正确渲染。

用 Python 的 xml.etree.ElementTree 解析后写入 .html 文件
XML 不是 HTML,不能直接改后缀就当网页打开——浏览器会报错或显示为纯文本。必须把 XML 数据转成合法的 HTML 结构(比如加 、),再保存为 .html 后缀。
最轻量、无依赖的做法是用标准库 xml.etree.ElementTree 读取,手动拼 HTML 字符串或构建简单 DOM 再输出:
- 先用
ET.parse()加载 XML,避免用ET.fromstring()处理含声明或注释的文件(容易抛ParseError) - 根元素内容要包裹进
...,否则浏览器不识别为网页 - XML 中的特殊字符(如
&、)在写入 HTML 前需转义,否则破坏结构;用 <code>html.escape()最稳妥 - 别直接
print(root)或str(root)——那是对象地址,不是 HTML 文本
import xml.etree.ElementTree as ET
import html
<p>tree = ET.parse("data.xml")
root = tree.getroot()</p><h1>构建最小合法 HTML</h1><p>html_content = f"<!DOCTYPE html>\n<html>\n<body>\n{html.escape(ET.tostring(root, encoding='unicode'))}\n</body></html>"</p><p>with open("output.html", "w", encoding="utf-8") as f:
f.write(html_content)用 XSLT 转换 XML 到 HTML(适合结构固定、需样式控制的场景)
如果 XML 有固定 schema(比如 RSS、DocBook),且你希望复用模板、支持条件渲染或 CSS 类名,XSLT 比手拼字符串更可靠。但 Python 默认不带 XSLT 引擎,得装 lxml。
立即学习“前端免费学习笔记(深入)”;
网格图片手风琴jquery特效代码,结合网格手风琴缩略图和手风琴面板的功能,给你展示你的图片网站一个有趣的方法。你可以选择使用XML或HTML。功能强大的API将允许进一步提高这个jQuery插件的功能,可以方便地集成到您自己的应用程序。兼容主流浏览器,php中文网推荐下载! 使用方法: 1、在head区域引入样式表文件style.css和grid-accordion.css 2、在head
常见错误是 XSL 文件路径写错,或没声明命名空间导致匹配失败:
-
lxml.etree.XSLT只接受etree.XSLT对象,不能传文件路径字符串 - XML 若含命名空间(如
xmlns="http://example.com"),XSLT 中必须用前缀声明并匹配,否则<template match="/root"></template>会失效 - 输出编码要用
result.method == "html"并设encoding="utf-8",否则中文变乱码
from lxml import etree
<p>xml_doc = etree.parse("data.xml")
xslt_doc = etree.parse("transform.xsl")
transform = etree.XSLT(xslt_doc)</p><p>result = transform(xml_doc)
with open("output.html", "wb") as f: # 注意是 wb,不是 w
f.write(bytes(result))浏览器直接打开 XML 显示为“格式化树”?那不是 HTML
双击 XML 文件,Chrome/Firefox 有时会渲染成可折叠的树状视图——这只是浏览器内置的 XML 查看器,不是 HTML 渲染。此时地址栏显示 file:///xxx.xml,右键“查看页面源代码”看到的仍是原始 XML,没有 标签。
这种视图无法通过 CSS 控制样式,也不能嵌入 JS;想真正当网页用,必须生成包含完整 HTML 文档结构的文件:
- 检查生成的
output.html是否能用file://协议打开且显示正常(不是下载弹窗或白屏) - 若打开为空白,用浏览器开发者工具看 Console 是否报
Failed to load resource——可能是路径引用了相对资源但没放对位置 - 若显示原始 XML 标签(如
<item>xxx</item>),说明没加包裹,或内容被当作文本节点而非 HTML 解析
用命令行工具快速转换(适合 CI 或临时处理)
不想写脚本?xmllint(libxml2 提供)配合 --html 参数可以强制输出 HTML 格式,但只是“伪装”,不添加文档结构,仅适合调试:
-
xmllint --html --xpath "//title/text()" data.xml能提取文本,但不能生成完整页面 - 真正生成可用 HTML 还是要靠
xsltproc:xsltproc transform.xsl data.xml > output.html - Windows 用户注意:
xsltproc不自带,需从 GnuWin32 或 MSYS2 安装;PowerShell 中重定向要用Out-File -Encoding utf8避免 BOM
实际转换时最容易漏的是 DOCTYPE 声明和字符编码声明,尤其是 XML 原文含中文又没指定 encoding="UTF-8",生成的 HTML 在某些浏览器里会默认用 GBK 解码,文字全乱。









