
使用正则表达式解析html文本中的href地址
在解析HTML文本时,获取特定元素的href地址是常见需求。正则表达式可以实现匹配目标内容,但容易误配。建议使用HTML解析器,安全可靠。浏览器端可选择利用document.createElement + innerHTML、DOMParser或jQuery等工具。
以jQuery为例,解析示例HTML文本的href地址实现如下:
$(html).find('>li>a').map((_, a) => $(a).attr('href')) // jq
[...$(html).find('>li>a')].map(a => $(a).attr('href')) // Array
// jq 转 Array 可用 [...jq], jq.toArray(), Array.from(jq, mapfn)
// 如需完整 URL, $(a).attr('href') 改为 a.href结果:
[
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=3",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=4",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=6",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=9",
"/eduadmin/DevelopActivity/SystemActivityManage/2/-1"
]











