0

0

JS如何实现递归下降?解析器的实现

月夜之吻

月夜之吻

发布时间:2025-08-22 08:48:02

|

896人浏览过

|

来源于php中文网

原创

递归下降解析器通过函数调用模拟文法规则推导,将非终结符转为函数,终结符匹配token,利用调用顺序体现优先级,循环实现左结合,消除左递归避免栈溢出,配合词法分析生成token流,并构建AST,错误恢复可采用跳过token至同步点。

js如何实现递归下降?解析器的实现

递归下降解析器,说白了,就是利用函数之间的相互调用来模拟文法规则的推导过程。每个非终结符对应一个函数,函数内部根据产生式规则选择性地调用其他函数(对应其他非终结符)或者直接匹配终结符。

实现JS递归下降解析器,核心在于将文法规则转化为可执行的代码逻辑。

解决方案

首先,你需要定义好你的文法。举个例子,我们来解析一个简单的算术表达式,包含加法和乘法:

expression : term ((PLUS | MINUS) term)*
term       : factor ((MUL | DIV) factor)*
factor     : NUMBER | LPAREN expression RPAREN

这里

PLUS
,
MINUS
,
MUL
,
DIV
,
NUMBER
,
LPAREN
,
RPAREN
都是终结符,
expression
,
term
,
factor
是非终结符。

接下来,为每个非终结符创建一个函数:

class Parser {
  constructor(tokens) {
    this.tokens = tokens;
    this.current = 0;
  }

  parse() {
    return this.expression();
  }

  expression() {
    let left = this.term();

    while (this.match("PLUS", "MINUS")) {
      let operator = this.previous();
      let right = this.term();
      left = { type: "Binary", operator, left, right }; // 构建抽象语法树 (AST)
    }

    return left;
  }

  term() {
    let left = this.factor();

    while (this.match("MUL", "DIV")) {
      let operator = this.previous();
      let right = this.factor();
      left = { type: "Binary", operator, left, right };
    }

    return left;
  }

  factor() {
    if (this.match("NUMBER")) {
      return { type: "Literal", value: this.previous().value };
    }

    if (this.match("LPAREN")) {
      let expr = this.expression();
      this.consume("RPAREN", "Expect ')' after expression.");
      return expr;
    }

    throw new Error("Expect expression.");
  }

  match(...types) {
    for (let type of types) {
      if (this.check(type)) {
        this.advance();
        return true;
      }
    }

    return false;
  }

  consume(type, message) {
    if (this.check(type)) {
      return this.advance();
    }

    throw new Error(message);
  }

  check(type) {
    if (this.isAtEnd()) return false;
    return this.peek().type === type;
  }

  advance() {
    if (!this.isAtEnd()) this.current++;
    return this.previous();
  }

  isAtEnd() {
    return this.peek().type === "EOF";
  }

  peek() {
    return this.tokens[this.current];
  }

  previous() {
    return this.tokens[this.current - 1];
  }
}

代码中,

expression
函数对应
expression
非终结符,内部调用
term
函数,并循环匹配
PLUS
MINUS
term
函数类似,对应
term
非终结符。
factor
函数处理数字和括号表达式。

关键点:

  • 递归调用:
    factor
    函数中,如果遇到
    LPAREN
    ,会递归调用
    expression
    函数,处理括号内的表达式。
  • 错误处理:
    consume
    函数用于确保解析器按照预期找到特定的终结符,否则抛出错误。
  • 抽象语法树 (AST): 代码构建了一个简单的 AST,用于后续的求值或者代码生成。 AST 的结构反映了表达式的语法结构。

如何处理左递归文法?

左递归文法是指文法规则中,某个非终结符直接或间接地推导出以自身开头的产生式。 例如:

expression : expression PLUS term | term

如果直接按照上面的方式写递归下降解析器,会导致无限递归,栈溢出。 解决办法是消除左递归。 上面的文法可以改写成:

expression : term (PLUS term)*

万知
万知

万知: 你的个人AI工作站

下载

也就是上面的代码实现的方式。 本质上,是将左递归转换为右递归或者循环。

如何进行词法分析(Tokenization)?

在解析之前,需要将源代码转换成 token 流。 Tokenization 就是这个过程。 一个简单的 Tokenizer 如下:

class Tokenizer {
  constructor(source) {
    this.source = source;
    this.current = 0;
    this.tokens = [];
  }

  tokenize() {
    while (!this.isAtEnd()) {
      this.start = this.current;
      this.scanToken();
    }

    this.tokens.push({ type: "EOF", lexeme: "", value: null, line: this.line });
    return this.tokens;
  }

  scanToken() {
    let char = this.advance();
    switch (char) {
      case '(': this.addToken("LPAREN"); break;
      case ')': this.addToken("RPAREN"); break;
      case '+': this.addToken("PLUS"); break;
      case '-': this.addToken("MINUS"); break;
      case '*': this.addToken("MUL"); break;
      case '/': this.addToken("DIV"); break;
      case ' ':
      case '\r':
      case '\t':
        // Ignore whitespace.
        break;
      default:
        if (this.isDigit(char)) {
          this.number();
        } else {
          throw new Error("Unexpected character.");
        }
    }
  }

  number() {
    while (this.isDigit(this.peek())) this.advance();

    this.addToken("NUMBER", Number(this.source.substring(this.start, this.current)));
  }

  isDigit(char) {
    return char >= '0' && char <= '9';
  }

  addToken(type, literal = null) {
    const text = this.source.substring(this.start, this.current);
    this.tokens.push({ type, lexeme: text, value: literal, line: this.line });
  }

  advance() {
    this.current++;
    return this.source[this.current - 1];
  }

  peek() {
    if (this.isAtEnd()) return '\0';
    return this.source[this.current];
  }

  isAtEnd() {
    return this.current >= this.source.length;
  }
}

Tokenizer 的作用是将字符串分解成 token 数组,例如

"(1 + 2) * 3"
会被分解成
[LPAREN, NUMBER(1), PLUS, NUMBER(2), RPAREN, MUL, NUMBER(3)]

如何处理优先级和结合性?

优先级和结合性是算术表达式解析中的重要概念。 优先级决定了运算符的运算顺序(例如,乘除优先于加减),结合性决定了相同优先级运算符的运算顺序(例如,左结合的加法

1 + 2 + 3
等价于
(1 + 2) + 3
)。

在递归下降解析器中,优先级通过函数的调用顺序来体现。 例如,

expression
函数调用
term
函数,而
term
函数调用
factor
函数,就意味着
factor
中的运算符(例如括号)优先级最高,其次是
term
中的运算符(例如乘除),最后是
expression
中的运算符(例如加减)。

结合性通过循环的方向来控制。 例如,上面的

expression
term
函数中的
while
循环是从左到右的,因此加法和乘法都是左结合的。 如果要实现右结合,需要调整循环的方向或者使用递归。

如何进行错误恢复?

解析过程中难免会遇到错误,例如语法错误。 好的解析器应该能够尽可能地从错误中恢复,继续解析,而不是直接崩溃。

错误恢复的策略有很多种,例如:

  • Panic Mode: 遇到错误后,跳过一些 token,直到遇到一个同步 token(例如分号、括号),然后继续解析。
  • Rule Resynchronization: 在每个非终结符对应的函数中,定义一些同步 token。 遇到错误后,跳过一些 token,直到遇到同步 token,然后重新开始解析该非终结符。

错误恢复是一个比较复杂的问题,需要根据具体的文法和应用场景来选择合适的策略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1502

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

232

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

87

2025.10.17

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

97

2023.09.25

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6197

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

820

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1070

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1359

2024.03.01

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

9

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号