SAX解析器通过startElement和endElement方法实现事件驱动解析:前者在遇到开始标签时触发,用于获取标签名和属性;后者在结束标签时调用,用于收尾处理,二者需配对使用并配合characters方法完成文本提取。

SAX解析器不构建整个文档树,而是边读边触发回调方法。其中 startElement 和 endElement 是最核心的两个方法,分别在遇到开始标签和结束标签时被自动调用。
startElement:抓取标签名、属性和命名空间
这个方法在每次解析到一个开始标签(如 )时触发。它会传入标签的命名空间URI、本地名、完整标签名(qName),以及该标签的所有属性。
- 通常用 localName 或 qName 判断当前是什么元素(比如 "book"、"title")
- 用 Attributes 对象获取属性值,例如
attributes.getValue("id") - 如果没启用命名空间支持,localName 可能为空,此时优先用 qName
- 注意:它不包含标签内的文本内容,文本由 characters() 方法负责
endElement:识别标签闭合,配合状态管理
当解析器遇到对应结束标签(如 )时调用。参数和 startElement 类似,但一般只关心标签名,用来“收尾”之前 startElement 开启的逻辑。
- 常用于清空临时变量、完成对象封装、退出当前解析层级
- 比如解析到
时,可以把已收集的作者文本存进当前 book 对象 - 和 startElement 保持配对使用,避免漏处理或错位(可用栈或布尔标志辅助跟踪)
实际配合使用的典型模式
多数场景下,你需要用成员变量暂存上下文信息:
立即学习“Java免费学习笔记(深入)”;
- 定义一个 currentTag 字符串,在 startElement 中赋值为 localName
- 用 StringBuilder 收集 characters() 中的文本(注意:characters 可能被多次调用!)
- 在 endElement 中根据 currentTag 判断该把 StringBuilder 的内容塞到哪个字段
- 别忘了在 endElement 结束后清空 StringBuilder,否则下次内容会拼接上去
基本上就这些。关键不是死记方法签名,而是理解它们在解析流中的位置和职责——startElement 是“进门”,endElement 是“出门”,中间的 characters 才是“说话”。










