0

0

如何用Python的lxml库验证XML是否符合XSD

星降

星降

发布时间:2026-01-28 10:44:35

|

175人浏览过

|

来源于php中文网

原创

使用lxml.etree.XMLSchema验证XML是否符合XSD,需先加载XSD构建验证器,再解析XML并调用validate()或assertValid()校验,注意命名空间、编码及导入包含路径处理。

如何用python的lxml库验证xml是否符合xsd

用 lxml 验证 XML 是否符合 XSD,核心是使用 lxml.etree.XMLSchema 类加载 XSD 文件,再用它校验 XML 文档。关键在于正确处理命名空间、解析错误和验证失败信息。

加载 XSD 并创建验证器

先用 etree.parse() 读取 XSD 文件,再传给 XMLSchema() 构造验证器对象。注意:XSD 必须是有效格式,且路径可访问。

  • 如果 XSD 有导入()或包含(),确保相关文件路径正确,或通过 etree.Resolver 自定义解析逻辑
  • 推荐显式指定 parser(如 etree.XMLParser(resolve_entities=False))避免实体解析干扰
  • 示例:
    from lxml import etree
    
    with open("schema.xsd", "rb") as f:
        schema_root = etree.XML(f.read())
    schema = etree.XMLSchema(schema_root)
    

解析并验证 XML 文档

XML 文件需先解析为 etree.ElementTreeetree.Element,再调用验证器的 .validate() 方法。该方法返回布尔值,但不抛异常——错误信息需主动获取。

  • schema.assertValid(doc) 可直接抛出 DocumentInvalid 异常,适合严格校验场景
  • 更常用的是 schema.validate(doc) + schema.error_log 获取详细报错
  • 示例:
    with open("data.xml", "rb") as f:
        doc = etree.parse(f)
    
    if not schema.validate(doc):
        for error in schema.error_log:
            print(f"Line {error.line}, Col {error.column}: {error.message}")
    

处理常见问题:命名空间与编码

XSD 和 XML 中的命名空间不匹配是验证失败的主因之一;同时注意文件编码(建议统一用 UTF-8 并显式声明)。

Figma
Figma

Figma 是一款基于云端的 UI 设计工具,可以在线进行产品原型、设计、评审、交付等工作。

下载

立即学习Python免费学习笔记(深入)”;

  • XML 文件开头应含 ,XSD 同理
  • 若 XML 使用默认命名空间(xmlns="http://example.com/ns"),XSD 中 targetNamespace 必须一致,且元素引用需带前缀或正确设置 elementFormDefault="qualified"
  • 调试时可用 print(etree.tostring(doc, encoding="unicode", pretty_print=True)) 检查实际解析结构

完整验证函数示例

封装一个健壮的验证函数,兼顾异常捕获、日志输出和返回结构化结果:

def validate_xml_with_xsd(xml_path, xsd_path):
    try:
        with open(xsd_path, "rb") as f:
            schema_root = etree.XML(f.read())
        schema = etree.XMLSchema(schema_root)
    except etree.XMLSyntaxError as e:
        return {"valid": False, "error": f"XSD 解析失败: {e}"}

    try:
        with open(xml_path, "rb") as f:
            doc = etree.parse(f)
    except etree.XMLSyntaxError as e:
        return {"valid": False, "error": f"XML 解析失败: {e}"}

    if not schema.validate(doc):
        errors = [
            {"line": e.line, "column": e.column, "message": e.message}
            for e in schema.error_log
        ]
        return {"valid": False, "errors": errors}
    
    return {"valid": True}

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

186

2023.09.27

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1900

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2091

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1063

2024.11.28

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

415

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

418

2023.11.14

HTTP 503错误解决方法
HTTP 503错误解决方法

HTTP 503错误表示服务器暂时无法处理请求。想了解更多http错误代码的相关内容,可以阅读本专题下面的文章。

2260

2024.03.12

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2078

2024.08.16

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

84

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号