Go语言XML处理核心是struct标签与xml.Unmarshaler/Marshaler接口:标签控制字段映射、属性、忽略、innerxml等;接口实现定制解析/编码逻辑,需主动调用Token方法。

Go语言通过encoding/xml包提供XML解析与编码能力,自定义行为主要靠结构体标签(struct tags)和实现特定接口(如xml.Unmarshaler和xml.Marshaler)来完成。核心在于控制字段映射、跳过字段、重命名元素、处理嵌套或特殊格式内容。
用struct标签精细控制字段映射
结构体字段通过xml:标签声明如何参与XML序列化/反序列化,常用选项包括:
-
字段名重命名:
xml:"book"让字段在XML中以出现,而非默认的驼峰转小写加连字符 -
忽略字段:
xml:"-"完全跳过该字段;xml:",omitempty"仅在值为空(零值)时省略该元素或属性 -
作为XML属性:
xml:"id,attr"将字段编码为同级元素的属性,如 -
捕获原始XML内容:
xml:",innerxml"把子元素的全部未解析内容存入字符串字段(适合混合内容或需手动处理的片段) -
指定为字符数据(CDATA):暂无原生标签支持,但可通过自定义
MarshalXML实现
实现xml.Unmarshaler来自定义解析逻辑
当默认解析无法满足需求(如解析带单位的数字,或兼容多种格式),可让结构体实现UnmarshalXML(d *xml.Decoder, start xml.StartElement) error方法。
例如,解析一个带单位的尺寸字段:
立即学习“go语言免费学习笔记(深入)”;
type Size struct {
Value float64 `xml:"-"`
Unit string `xml:"unit,attr"`
}
func (s *Size) UnmarshalXML(d *xml.Decoder, start xml.StartElement) error {
// 先读取属性
for _, attr := range start.Attr {
if attr.Name.Local == "unit" {
s.Unit = attr.Value
}
}
// 再读取文本内容
token, err := d.Token()
if err != nil {
return err
}
if se, ok := token.(xml.CharData); ok {
s.Value, _ = strconv.ParseFloat(strings.TrimSpace(string(se)), 64)
}
return nil
}
实现xml.Marshaler来自定义编码逻辑
类似地,实现MarshalXML(e *xml.Encoder, start xml.StartElement) error可完全控制输出格式。比如强制输出为CDATA、添加命名空间、或按业务规则生成嵌套结构。
示例:将字符串字段始终包裹在中:
func (s MyContent) MarshalXML(e *xml.Encoder, start xml.StartElement) error {
e.EncodeToken(start)
e.EncodeToken(xml.CharData([]byte(``)))
e.EncodeToken(xml.EndElement{Name: start.Name})
return nil
}
处理嵌套、多态或动态结构
对于不确定子元素类型(如或),可先用通用结构体解析type字段,再根据值选择具体结构体二次解析;或使用xml:",any"捕获未知子元素为[]byte,再手动解码。
若需统一处理多个相似类型,可定义接口+工厂函数,避免重复判断逻辑。
基本上就这些。关键是先用好struct标签覆盖80%场景,复杂逻辑再上接口实现——不复杂但容易忽略的是:自定义方法里必须主动调用Decoder.Token()或Encoder.EncodeToken()完成实际读写,否则会卡住或遗漏内容。










