xml数字签名基于w3c xmlsig规范,支持选择性签名与格式保留,核心结构为signedinfo、signaturevalue和keyinfo,必须经规范化(如exclusive c14n)后计算摘要,推荐使用apache santuario、signedxml或signxml等成熟库实现。

XML数字签名是通过W3C标准定义的XML-Signature Syntax and Processing(简称XMLSig)规范实现的,核心目标是对XML文档或其中某一部分进行完整性保护和身份认证。它不是简单地对整个XML字符串做哈希,而是支持“选择性签名”——可签整个文档、某个元素、多个不连续节点,甚至外部资源,并能保留原始格式(如注释、命名空间、空白字符等)。
签名的基本结构:SignedInfo + SignatureValue + KeyInfo
一个合规的XML签名由几个关键部分组成,嵌入在<signature></signature>元素中:
-
SignedInfo:签名的输入数据,包含待签名内容的引用(
Reference)、规范化方法(CanonicalizationMethod)、摘要算法(DigestMethod)和签名算法(SignatureMethod)。它是签名运算的实际输入,必须先按规则规范化再哈希。 -
SignatureValue:对
SignedInfo规范化后内容进行签名得到的Base64编码值(如RSA-SHA256、ECDSA-SHA384等)。 - KeyInfo(可选):提供验证所需的公钥信息,例如X.509证书、密钥名称或DSA公钥参数。生产环境建议用证书链,便于信任链验证。
-
Object / Reference:每个
Reference指向一个待签名的数据源(URI可以是空字符串表示整个文档、#id表示某元素、或外部URL),并指定其摘要值和所用摘要算法。
关键步骤:规范化(Canonicalization)不可跳过
XML天生具有多种等价写法(换行、缩进、属性顺序、命名空间声明位置等),直接哈希会导致相同逻辑内容产生不同摘要。XMLSig强制要求对SignedInfo及每个Reference所指内容先执行规范化(C14N),常用方式有:
-
http://www.w3.org/2001/10/xml-exc-c14n#(Exclusive Canonicalization):排除无关命名空间,适合嵌套签名场景。 -
http://www.w3.org/TR/2001/REC-xml-c14n-20010315(Legacy C14N):基础规范化,需注意命名空间污染风险。 - 若签名范围是整个文档,需对整个
SignedInfo做C14N;若只签某个<payment></payment>元素,则对该元素子树单独C14N后计算摘要。
常见实现方式与工具建议
手写XML签名极易出错(尤其是C14N和URI解析),推荐使用成熟库:
-
Java:使用Apache Santuario(
org.apache.santuario),内置完整XMLSig支持,适配JDK原生XML处理,支持DOM/SAX流式签名。 -
.NET:
System.Security.Cryptography.Xml命名空间提供SignedXml类,支持ID引用、X.509证书嵌入和多种算法。 -
Python:推荐
signxml库(基于lxml),简洁易用,支持enveloped/enveloping/detached三种签名形式,自动处理C14N和URI解析。 - 注意点:验证时必须复现与签名时完全一致的规范化方法和摘要算法;避免使用已淘汰算法(如SHA1、MD5、RSA-PKCS#1 v1.5 without PSS);URI为空字符串("")表示“整个文档”,但实际含义取决于签名上下文(如是否为enveloped签名)。
典型签名类型与适用场景
XMLSig定义了三种主流封装模式,选择取决于业务需求:
-
Enveloped signature:签名信息嵌入被签名的XML内部(如作为最后一个子元素),最常见。验证时需临时移除
<signature></signature>自身再计算摘要,否则会循环引用。 -
Enveloping signature:整个原始XML作为
<object></object>嵌入<signature></signature>内,适合传输单个签名包,如SAML断言。 - Detached signature:签名与原始XML完全分离(如两个独立文件),通过URI引用原始数据,适用于签署二进制附件或大型文档。
不复杂但容易忽略。关键是理解SignedInfo的构造逻辑、严格匹配规范化方式、正确解析URI上下文,再借助可靠库落地。










