0

0

JavaScript 嵌套括号内容提取:非正则解决方案

霞舞

霞舞

发布时间:2025-08-22 19:18:01

|

664人浏览过

|

来源于php中文网

原创

javascript 嵌套括号内容提取:非正则解决方案

本文介绍了一种使用 JavaScript 解析嵌套括号结构,并提取特定内容的方法,该方法不依赖正则表达式,而是通过构建括号树来实现,可以有效处理括号不平衡的情况,并提供灵活的遍历和过滤机制,适用于需要处理复杂嵌套结构的场景。

在处理包含嵌套括号的字符串时,使用正则表达式可能会变得非常复杂,尤其是在括号嵌套层数较深或存在不平衡括号的情况下。本文提供了一种非正则的解决方案,通过构建一个括号树的数据结构来解析字符串,并提供灵活的遍历方法,以便提取所需的信息。

BracketTree 类

核心在于 BracketTree 类,它负责构建和管理括号树。

class BracketTree {
    constructor (brackets, string) {
        // ...
    }

    traverse (callback) {
        // ...
    }
}

构造函数接收两个参数:

立即学习Java免费学习笔记(深入)”;

  • brackets: 一个包含两个字符的字符串,分别表示开括号和闭括号。
  • string: 需要解析的字符串。

traverse 方法接收一个回调函数,用于遍历括号树的每个节点。

构建括号树

BracketTree 类的构造函数主要负责解析字符串,并构建括号树。其核心逻辑在于 parse 函数,它递归地遍历字符串,识别开括号和闭括号,并构建树的节点。

function parse (start) {
    let children = [];
    let pos = start;

    loop: while (pos < string.length) {
        switch (string[pos]) {
            case opening:
                let child = parse(pos + 1);
                children.push(child);
                if (child.end == string.length) {
                    break loop;
                }
                pos = child.end;
                break;

            case closing:
                if (start == 0) {
                    children = [{
                        children, start, end: pos, opened: false, closed: true,
                        contents: string.slice(0, pos)
                    }];
                } else {
                    return {
                        children, start, end: pos, opened: true, closed: true,
                        contents: string.slice(start, pos)
                    };
                }
        }
        pos++;
    }

    return (start == 0)? {
        children, start, end: string.length, opened: false, closed: false,
        contents: string
    }: {
        children, start, end: string.length, opened: true, closed: false,
        contents: string.slice(start)
    };
}

parse 函数返回一个对象,表示一个括号节点,包含以下属性:

元典智库
元典智库

元典智库:智能开放的法律搜索引擎

下载
  • children: 子节点数组。
  • start: 节点在字符串中的起始位置。
  • end: 节点在字符串中的结束位置。
  • opened: 是否有对应的开括号。
  • closed: 是否有对应的闭括号。
  • contents: 节点包含的字符串内容。

遍历括号树

traverse 方法用于遍历括号树的每个节点,并执行回调函数。

traverse (callback) {
    if (typeof callback != 'function') {
        return false;
    }

    let root = this.root;
    let input = root.contents;
    let nodeId = 0;

    function recurse (parent, level) {
        function callbackLeaf (start, end) {
            callback({
                root, parent, level,
                nodeId: nodeId++, childId: childId++,
                start, end, contents: input.slice(start, end)
            });
        }

        function callbackBranch (branch) {
            return callback({
                root, parent, branch, level,
                nodeId: nodeId++, childId: childId++
            });
        }

        let children = parent.children;
        let childId = 0;
        if (children.length == 0) {
            callbackLeaf(parent.start, parent.end);
            return;
        }

        callbackLeaf(parent.start, children[0].start - children[0].opened);
        if (callbackBranch(children[0])) {
            recurse(children[0], level+1);
        }

        for (var i = 0; i < children.length-1; i++) {
            callbackLeaf(children[i].end + children[i].closed, children[i+1].start - children[i+1].opened);
            if (callbackBranch(children[i+1])) {
                recurse(children[i+1], level+1);
            }
        }

        callbackLeaf(children[i].end + children[i].closed, parent.end);
    }

    recurse(root, 0);
    return true;
}

回调函数接收一个参数,包含以下属性:

  • root: 括号树的根节点。
  • parent: 当前节点的父节点。
  • branch: 当前节点的子节点(如果当前节点是分支节点)。
  • level: 当前节点的深度。
  • nodeId: 当前节点的唯一标识符。
  • childId: 当前节点在其父节点中的索引。
  • start: 节点在字符串中的起始位置。
  • end: 节点在字符串中的结束位置。
  • contents: 节点包含的字符串内容。

使用示例

以下代码展示了如何使用 BracketTree 类来解析字符串,并提取特定内容。

let input = 'NOT OPENED {3}2}1}***{avatarurl {id {message}}} blah blah blah {1{2{3} NOT CLOSED';
let tree = new BracketTree('{}', input);

function filteredTraverse (caption, leafFilter, branchFilter) {
    console.log(`${'-'.repeat(29 - caption.length/2)} ${caption} `.padEnd(60, '-'));
    leafFilter ??= () => true;
    branchFilter ??= () => true;
    tree.traverse((args) => {
        if (args.branch) {
            return branchFilter(args);
        }
        if (leafFilter(args)) {
            console.log(`${'  '.repeat(args.level)}<${args.contents}>`);
        }
    });
}

filteredTraverse(
    'Ignore unbalanced and all their descendants',
    null,
    ({branch}) => branch.opened && branch.closed
);

filteredTraverse(
    'Ignore unbalanced but include their descendants',
    ({parent}) => parent.opened == parent.closed
);

filteredTraverse(
    'Ignore empty',
    ({start, end}) => start != end
);

filteredTraverse(
    'Show non-empty first children only',
    ({childId, start, end}) => childId == 0 && start != end
);

这段代码首先创建了一个 BracketTree 实例,然后定义了一个 filteredTraverse 函数,用于遍历括号树,并根据指定的过滤器提取内容。filteredTraverse 函数接收三个参数:

  • caption: 描述过滤器的字符串。
  • leafFilter: 用于过滤叶子节点的回调函数。
  • branchFilter: 用于过滤分支节点的回调函数。

通过不同的过滤器,可以提取不同类型的内容,例如:

  • 忽略不平衡的括号及其所有子节点。
  • 忽略不平衡的括号,但包含其子节点。
  • 忽略空节点。
  • 只显示非空的第一个子节点。

总结

本文提供了一种非正则的解决方案,用于解析包含嵌套括号的字符串。通过构建括号树,可以有效地处理括号嵌套和不平衡的情况,并提供灵活的遍历和过滤机制,以便提取所需的信息。这种方法适用于需要处理复杂嵌套结构的场景,例如解析配置文件、代码或数据。

注意事项:

  • 此方法在处理非常大的字符串时,可能会占用较多内存。
  • 可以根据实际需求,对 BracketTree 类进行扩展,例如添加更多的方法来操作括号树。
  • 在性能要求较高的场景下,可以考虑使用其他更高效的算法。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

515

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

251

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

749

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

215

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

351

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

236

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

534

2023.12.06

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

54

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP基础入门课程
PHP基础入门课程

共33课时 | 2万人学习

前端系列快速入门课程
前端系列快速入门课程

共4课时 | 0.4万人学习

誉天教育RHCE视频教程
誉天教育RHCE视频教程

共9课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号