
网页内容抓取:去除指定字符
问题:
如何使用 javascript 将网页中符合特定字符的文本元素替换为空字符?例如,去除文本中的特殊字符,如 "、=、:"。
答案:
以下是使用 javascript 完成此操作的方法:
立即学习“Java免费学习笔记(深入)”;
// 查找带有属性 "style" 的段落元素
var paragraphs = document.querySelectorAll("p[style]");
// 遍历每个段落
for (var i = 0; i < paragraphs.length; i++) {
// 使用正则表达式替换符合字符
paragraphs[i].innerHTML = paragraphs[i].innerHTML.replace(/([<>"=&:]+)| /g, "");
}此代码将替换段落中所有符合 "、=、:" 的字符,同时还会去除 html 实体 " "(空格)。










