0

0

如何在c++中实现一个简单的JIT编译器? (LLVM Core入门)

穿越時空

穿越時空

发布时间:2026-02-01 13:05:29

|

539人浏览过

|

来源于php中文网

原创

LLVM 14+ 必须用 ORC JIT(如 LLJIT),旧 ExecutionEngine 已移除;硬绕 ORC 会因缺符号解析、内存保护等导致 SIGSEGV;最简可行方案是基于 orc::KaleidoscopeJIT 的三层架构,需显式注册系统库并注意目标平台匹配。

如何在c++中实现一个简单的jit编译器? (llvm core入门)

直接用 LLVM Core 实现“简单 JIT”不是写几个函数就能跑起来的事——LLVMExecutionEngine 在 14+ 版本已移除,orc::ThreadSafeContextorc::KaleidoscopeJIT 是当前唯一受支持路径,硬绕开 ORC 会卡在符号解析或内存保护上。

为什么不能只用 llvm::IRBuilder + llvm::ExecutionEngine

LLVM 14 起彻底删除了旧式 ExecutionEngine API;即使降级到 LLVM 12,createJITCompilerForModule 也早已标记为 deprecated。你写的 IR 可以生成,但没 ORC 的 symbol resolver、object layer、compile layer,getSymbolAddress 必然返回 0,调用时 SIGSEGV。

  • 旧教程里常见的 EngineBuilder + create() 在 LLVM 15 中编译不过
  • llvm::sys::DynamicLibrary::LoadLibraryPermanently(nullptr) 不再自动暴露主机符号,必须显式注册
  • 未启用 -DLLVM_USE_SANITIZER=Address 构建的 LLVM,JIT 内存页默认不可执行(mprotect 拒绝 PROT_EXEC

最简可行 JIT:基于 orc::KaleidoscopeJIT 的三步链

官方 Kaleidoscope 教程第4章的 JIT 模板仍是目前最轻量、可直接复用的起点。它把 JIT 拆成三层:内存管理(orc::ObjectLinkingLayer)、编译调度(orc::IRCompileLayer)、符号解析(orc::SymbolResolver)。你不需要全写,只需继承并微调。

#include "llvm/ExecutionEngine/Orc/CompileUtils.h"
#include "llvm/ExecutionEngine/Orc/ExecutionUtils.h"
#include "llvm/ExecutionEngine/Orc/JITTargetMachineBuilder.h"
#include "llvm/ExecutionEngine/Orc/RTDyldObjectLinkingLayer.h"
#include "llvm/ExecutionEngine/Orc/ThreadSafeModule.h"
#include "llvm/ExecutionEngine/Orc/LLJIT.h"
#include "llvm/IR/IRBuilder.h"

auto jit = llvm::orc::LLJITBuilder().create();
if (!jit) {
  // handle error
}
// 注册 C 标准库符号(否则 printf 报 unresolved)
jit->getMainJITDylib().addGenerator(
    std::make_unique<llvm::orc::DynamicLibrarySearchGenerator>(
        llvm::sys::DynamicLibrary::getPermanentLibrary(nullptr)));

// 创建模块并插入函数
auto &ctx = jit->getContext();
auto module = std::make_unique<llvm::Module>("jit_module", ctx);
module->setTargetTriple(llvm::sys::getDefaultTargetTriple());

llvm::IRBuilder<> builder(llvm::Type::getInt32Ty(ctx));
auto funcTy = llvm::FunctionType::get(builder.getInt32Ty(), false);
auto func = llvm::Function::Create(funcTy, llvm::Function::ExternalLinkage,
                                   "add_one", module.get());
auto bb = llvm::BasicBlock::Create(ctx, "entry", func);
builder.SetInsertPoint(bb);
builder.CreateRet(builder.CreateAdd(builder.getInt32(42), builder.getInt32(1)));
jit->addIRModule(llvm::orc::ThreadSafeModule(std::move(module), ctx));

// 获取函数指针并调用
auto addr = jit->lookup("add_one");
if (addr) {
  auto f = reinterpret_cast<int(*)()>(addr.getValue());
  int result = f(); // 返回 43
}

LLJIT 初始化失败的三个高频原因

多数人卡在 LLJITBuilder().create() 返回 ErrorCode,而不是后续调用阶段。核心是目标平台和运行时环境不匹配。

如此AI员工
如此AI员工

国内首个全链路营销获客AI Agent

下载

立即学习C++免费学习笔记(深入)”;

  • JITTargetMachineBuilder::detectHost() 失败 → 确保 LLVM_TARGETS_TO_BUILD="host" 编译 LLVM,且运行机器架构(x86_64/aarch64)与构建时一致
  • DynamicLibrarySearchGeneratornullptr 后仍找不到 printfmacOS 需额外链接 -lSystem,Linux 需确保 LD_LIBRARY_PATH 包含 libc.so.6 所在路径
  • addIRModule 报 “symbol ‘main’ already defined” → 检查是否重复调用 addIRModule 或模块里误声明了 main 函数(JIT 模块不能有 main

ORC 的设计哲学是“每个组件可替换”,但入门时别急着自定义 ObjectLinkingLayer —— 先让 LLJIT 跑通,再逐步替换 IRCompileLayerConcurrentIRCompiler 或接入自己的 object cache。真正的复杂点不在 IR 构建,而在符号生命周期管理和跨模块调用时的 MaterializationResponsibility 分发逻辑。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

309

2023.11.28

macOS怎么切换用户账户
macOS怎么切换用户账户

在 macOS 系统中,可通过多种方式切换用户账户。如点击苹果图标选择 “系统偏好设置”,打开 “用户与群组” 进行切换;或启用快速用户切换功能,通过菜单栏或控制中心的账户名称切换;还能使用快捷键 “Control+Command+Q” 锁定屏幕后切换。

364

2025.05.09

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1584

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

717

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

801

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

588

2023.07.06

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.9万人学习

Git 教程
Git 教程

共21课时 | 4.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号