go不推荐照搬经典解释器模式,应采用组合+函数式+简单ast解决具体语法解析问题,优先使用text/scanner等标准库工具,避免过早抽象和空接口断言。

Go 里没有解释器模式的“标准实现”,别硬套设计模式教科书
Go 语言本身不鼓励、也不适合照搬经典解释器模式(比如《设计模式》里那个带 Expression 接口和一堆子类的树形结构)。它缺少泛型早期支持、没有虚函数调度、接口隐式实现又太松散——直接翻译 Java/C++ 示例,大概率写出难维护、难调试、性能还差的代码。
真正实用的做法是:用 Go 的组合 + 函数式风格 + 简单 AST,聚焦解决具体语法解析问题。比如配置表达式、规则引擎条件、简易 DSL 查询语句。
- 别为“模式”而建抽象层,先写死一个
parseIfExpr函数,跑通再拆 - 避免提前定义
TerminalExpressionNonterminalExpression这类空接口+断言的写法,运行时 panic 难定位 - Go 的
text/scanner或go/parser(如果语法接近 Go)比手写递归下降更稳,别从零造词法分析轮子
用 text/scanner + 自定义 token 处理简单 DSL 最省力
90% 的内部 DSL(如告警规则里的 cpu > 80 && mem )不需要完整 parser,<code>text/scanner 足够应付。它帮你搞定空格、注释、数字/标识符分隔,你只管按 token 流做状态判断。
常见错误是把 scanner 当成 parser 用:只调 Scan() 却不检查 TokenText() 或 Mode,结果数字被当字符串、运算符漏识别。
立即学习“go语言免费学习笔记(深入)”;
- 初始化 scanner 时务必设置
Mode:比如scanner.ScanIdents | scanner.ScanFloats | scanner.ScanInts - 用
switch s.Token()分支处理,而不是靠字符串比较s.TokenText()—— 后者无法区分关键字和普通标识符 - 遇到
scanner.Ident时,查表判断是变量名(cpu)、关键字(and)还是函数(avg()),别一股脑当变量 - 错误恢复很弱:
text/scanner遇到非法字符直接返回scanner.EOF,建议外层加行号计数和简单错误提示
go/parser 解析类 Go 语法时,AST 是现成的,别自己造节点
如果你的 DSL 语法长得像 Go(比如支持括号、点号访问、函数调用),直接用 go/parser 和 go/ast 是最快路径。Go 工具链已经给你生成好 AST 结构,不用重写 Visitor 模式。
典型坑是误以为 go/parser.ParseExpr 能解析任意表达式——它只接受合法 Go 表达式。比如 user.name == "tom" 可以,但 user:name == "tom"(冒号分隔)会直接报 syntax error: unexpected :。
- 用
go/parser.ParseExpr解析单个表达式;用go/parser.ParseFile解析带声明的完整文件 - 遍历 AST 用
ast.Inspect,不是手写递归:它自动跳过 nil 字段,且能中断遍历 - 注意类型断言安全:检查
node != nil再做node.(*ast.BinaryExpr),否则 panic -
go/ast节点不含原始位置信息(如哪个字符是==),需要配合go/token.FileSet获取行列号
执行阶段避免反射,优先用 map[string]func() interface{}
解释器最慢的一环常在“执行”:每次 eval 都用 reflect.Value.Call 调函数,或反复类型断言。Go 里更轻量的做法是预注册函数表,用字符串 key 直接查闭包。
容易忽略的是变量作用域管理。很多实现用全局 map 存变量,导致并发执行时数据错乱,或嵌套表达式污染父作用域。
- 把变量绑定封装成结构体,比如
type Scope struct { vars map[string]interface{}; parent *Scope },查找时逐级向上 - 函数注册用
map[string]func([]interface{}) interface{},参数强转由注册方负责,解释器只传 slice - 避免在 eval 中 new 大对象(如切片、map)——高频调用下 GC 压力明显,可复用 sync.Pool
- 数值计算优先用
float64统一处理,别在 int/float 间反复转换,Go 的 interface{} 转换开销不小
真正的难点不在语法解析,而在让不同来源的变量(环境变量、HTTP 请求头、数据库字段)能自然接入同一套求值上下文——这需要设计时就明确数据契约,而不是等写完 parser 才发现 user.id 有时是 string 有时是 int。










