
高效提取html字符串中的特定数据
本文介绍如何从一段HTML字符串中提取特定结构的数据。假设HTML包含多个 例如,我们有如下HTML字符串: 内容2 内容3 立即学习“前端免费学习笔记(深入)”; 内容4 我们需要提取以下格式的数据: 其中,“提取内容1”对应 虽然可以使用正则表达式,但为了更稳健地处理HTML内容,建议使用DOM解析器。以下JavaScript代码演示了如何使用DOMParser实现这一目标: 内容2 内容3 立即学习“前端免费学习笔记(深入)”; 内容4 这段代码首先使用class="template_content"和data-template属性。我们的目标是从这段HTML中提取这些data-template属性值及其内容。
标题1
标题2
标题3
{ "data-template": "(提取内容1)", "content": "(提取内容2)" }
data-template属性值,“提取内容2”对应let html = `
标题1
标题2
标题3
DOMParser将HTML字符串解析成DOM树,然后使用querySelectorAll选择所有具有class="template_content"的data-template属性值和innerHTML内容,并将它们存储在一个数组中。 这种方法比正则表达式更可靠,因为它能够正确处理复杂的HTML结构,避免因HTML内容变化而导致的错误。











