
清除 html 标签属性的妙法
当你将 Microsoft Word 文档转换为 HTML 时,可能会遇到一个问题:转换后的 HTML 代码中包含大量冗余的表格标签属性和繁杂的样式。如何清除这些属性,仅保留最基本的表格标签代码呢?
解决方案:
借助 JavaScript 中的正则表达式,我们可以轻松清除 HTML 标签中的所有属性。下面是一个函数实现:
function removeAttributes(htmlString) {
// 正则表达式匹配 HTML 标签和属性
var pattern = /<[^>]+?(\s+[^>]*?)?>/gi;
// 使用字符串替换将匹配到的标签和属性清除
var cleanString = htmlString.replace(pattern, function (match) {
return match.replace(/(\s+\w+(=["'][^"']*["'])?)/gi, '');
});
return cleanString;
}示例用法:
立即学习“Java免费学习笔记(深入)”;
var htmlString = 'This is a paragraph.
'; var cleanedString = removeAttributes(htmlString); console.log(cleanedString); //This is a paragraph.
通过调用此函数,你可以轻松清除 HTML 标签中的所有属性,仅保留最基础的标签代码。











