JavaScript中利用正则去除字符串中所有HTML标签

舞夢輝影

发布时间：2026-03-18 21:20:03

535人浏览过

来源于php中文网

原创

直接用正则去除HTML标签可行但有明显局限性，仅适用于结构简单、来源可信的纯展示文本清洗；真正安全的方式是用浏览器原生DOM解析，自动处理实体、注释、畸形HTML等，语义准确且容错性强。

javascript中利用正则去除字符串中所有html标签

直接用正则去除 HTML 标签在 JavaScript 中可行，但有明显局限性——它无法处理嵌套、注释、CDATA、属性中含 < 或 > 的情况，也不支持自闭合标签的严谨解析。仅适用于结构简单、来源可信的纯展示文本清洗（如富文本编辑器输出的轻量 HTML）。

基础写法：匹配并移除成对或单标签

最常用的是匹配以 < 开头、以 > 结尾的任意内容：

const cleanText = htmlString.replace(/]*>/g, '');

这个正则含义是：< + 任意非 > 字符（[^>]*）+ >，全局替换为空字符串。

它能处理：

立即学习“Java免费学习笔记（深入）”；

<div>hello</div> → "hello"
<p class="intro">Hi</p> → "Hi"
<br/><img src="x"> → 空字符串（所有标签被清空）

稍稳妥一点：排除注释和 CDATA（仍不完美）

若 HTML 可能含注释（）或 CDATA（<![CDATA[...]]>），可先清除这些再删标签：

const cleanText = htmlString
  .replace(//g, '')
  .replace(//g, '')
  .replace(/]*>/g, '');

注意：[\s\S] 能匹配换行符，*? 是非贪婪模式，避免跨多行误吞内容。

HaloTool

AI工具在线集合网站

下载

真正安全的方式：用浏览器原生 DOM 解析

只要运行环境有 DOM（浏览器或 Node.js 配合 JSDOM），这是最可靠的方法：

function stripHtml(html) {
  if (!html || typeof html !== 'string') return '';
  const div = document.createElement('div');
  div.innerHTML = html;
  return div.textContent || div.innerText || '';
}

优势：

自动处理实体（ → ）、脚本/样式内容不执行、注释自动忽略
对畸形 HTML（如未闭合标签、属性含 <）有容错能力
结果语义准确，等同于用户“看到的纯文本”

Node.js 中需先安装 jsdom 并引入：

const { JSDOM } = require('jsdom');
function stripHtml(html) {
const dom = new JSDOM(html);
return dom.window.document.body.textContent || '';
}

不推荐的“增强正则”误区

有人尝试写更复杂的正则来覆盖更多情况，例如：

/]*>/gi

这类写法看似更精确，实则问题更多：

无法识别 SVG/HTML5 自定义标签（如 <my-component>）
遇到 <script>alert('<div>') 这类内容会提前截断
正则无法做语法树分析，本质上仍是“字符串擦除”，不是“HTML 解析”

与其花时间调正则边界，不如切换到 DOM 方案——更短、更稳、更少 bug。

JavaScript中setTimeout零毫秒延迟的实际执行偏差

JavaScript中模块加载失败的错误捕获与降级处理

JavaScript中利用管道模式处理异步数据转换逻辑

JavaScript中正则表达式粘性匹配与y修饰符逻辑

JavaScript中异步并发量控制算法的实现思路与代码

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

javascript JavaScript 正则表达式字符串 regexp

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：JavaScript中WebSocket实现服务端双向通信的逻辑下一篇：JavaScript中正则提取文本中所有图片链接的匹配模式

作者最新文章

Python如何实现任务调度系统_定时任务设计

2026-03-18 12:43

Java中Apache利用mod_cache自定义缓存键的生成规则

2026-03-18 12:44

Linux下利用ss命令高效率查询特定PID关联的Socket信息

2026-03-18 12:53

Java中Apache中error_log对权限拒绝（403）的记录

2026-03-18 13:23

Apache中主备模式在小规模Java系统中的成本与效益

2026-03-18 13:24

Java final 常量在编译期的常量折叠优化

2026-03-18 13:35

Java中Apache通过mod_log_config自定义日志格式

2026-03-18 13:41

Linux 共享内存异常_共享内存调优

2026-03-18 13:46

JavaScript中利用模块化实现前端AB测试的功能开关

2026-03-18 14:09

Linux生产事故复盘模板_复盘方法与示例

2026-03-18 14:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js获取数组长度的方法

在js中，可以利用array对象的length属性来获取数组长度，该属性可设置或返回数组中元素的数目，只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值，也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容，供大家免费下载使用。

565

2023.06.20

js刷新当前页面

js刷新当前页面的方法：1、reload方法，该方法强迫浏览器刷新当前页面，语法为“location.reload([bForceGet]) ”；2、replace方法，该方法通过指定URL替换当前缓存在历史里（客户端）的项目，因此当使用replace方法之后，不能通过“前进”和“后退”来访问已经被替换的URL，语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

443

2023.07.04

js四舍五入

js四舍五入的方法：1、tofixed方法，可把 Number 四舍五入为指定小数位数的数字；2、round() 方法，可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

803

2023.07.04

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

494

2023.09.01

JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号，可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容，供大家免费下载体验。

678

2023.09.04

js生成随机数的方法

js生成随机数的方法有：1、使用random函数生成0-1之间的随机数；2、使用random函数和特定范围来生成随机整数；3、使用random函数和round函数生成0-99之间的随机整数；4、使用random函数和其他函数生成更复杂的随机数；5、使用random函数和其他函数生成范围内的随机小数；6、使用random函数和其他函数生成范围内的随机整数或小数。

1140

2023.09.04

如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍：1、内联脚本是将JavaScript代码直接嵌入到HTML标签中；2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中；3、外部脚本是将JavaScript代码放置在一个独立的文件；4、外部脚本是将JavaScript代码放置在一个独立的文件。

674

2023.09.12

Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型，用于表示独一无二的值。Symbol的特点：1、独一无二，每个Symbol值都是唯一的，不会与其他任何值相等；2、不可变性，Symbol值一旦创建，就不能修改或者重新赋值；3、隐藏性，Symbol值不会被隐式转换为其他类型；4、无法枚举，Symbol值作为对象的属性名时，默认是不可枚举的。

562

2023.09.20

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18

热门下载

网站特效

网站源码

网站素材

前端模板