用C++从零实现简单关系型数据库,核心是表结构(类封装字段/行)、文本文件持久化(CSV格式)、基础SQL查询(SELECT WHERE)、可选索引与事务,全程标准库实现,重在理解关系模型本质。

用C++从零实现一个“简单的关系型数据库”,核心不是复刻 MySQL,而是理解关系模型的关键要素:表结构、行存储、SQL-like 查询(哪怕只支持 SELECT WHERE)、索引加速(可选)、事务与持久化。它完全可以基于标准 C++ 和文件 I/O 完成,无需第三方库——重点在于设计清晰、代码可控、便于调试和扩展。
一、定义表结构:用类模拟“Schema”
每张表对应一个 C++ 类,封装字段名、类型、数据行容器。不追求动态类型,用 std::variant 或统一用 std::string 存储所有值(简化起见,推荐后者)。
例如:Student 表含 id(int)、name(string)、score(float),可定义为:
- 一个
std::vector<:vector>>存所有行(每行是字符串向量) - 一个
std::vector<:string>存列名(如{"id", "name", "score"}) - 一个
std::vector<:string>存列类型标识(如{"INT", "TEXT", "REAL"}),用于后续类型检查或转换
二、序列化到文件:文本格式 + 简单协议
不用二进制,用纯文本更易调试。推荐 CSV 风格,但需处理逗号/换行转义(简单做法:双引号包裹字段,内部双引号写成两个)。
立即学习“C++免费学习笔记(深入)”;
文件结构示例(student.tbl):
"1","Alice","95.5"
"2","Bob","87.0"
读取时按行分割,跳过首行(表头),再用 CSV 解析器(自己写 20 行以内)拆出字段;写入时反向操作即可。
关键点:
- 每次增删改后调用
save_to_file()—— 暂不考虑缓存或 WAL - 用
std::ofstream写入,std::ifstream读取,注意打开模式(std::ios::out | std::ios::trunc写,std::ios::in读) - 加简单错误检查:文件是否存在、是否可写、解析是否越界
三、支持基础查询:手写解析器 + 行过滤
不实现完整 SQL 解析器,先支持形如 SELECT * FROM student WHERE score > 85 的子集。
步骤:
- 用空格切分命令,识别关键词(SELECT / FROM / WHERE)
- 提取表名(
student),加载对应表对象 - 解析 WHERE 条件:找列名(
score)、比较符(>)、值(85),转成std::function过滤器 - 遍历内存中的行,对每行提取对应列的字符串,用
std::stof等转为目标类型后比较
提示:WHERE 只支持单条件;多条件(AND)可后续扩展为组合 lambda。
四、进阶但实用的小功能
让项目真正“可用”,加这几个点就明显不同:
-
主键约束:插入前检查
id是否重复(遍历已有行),失败则报错 -
内存缓存:表首次访问时加载进内存,后续操作不反复 IO;修改后标记“dirty”,
save()时才刷盘 -
简单索引:为某列建
std::map<:string std::vector>>(值 → 行号列表),WHERE 查找提速 -
命令行交互:用
while (std::getline(std::cin, line))做 REPL,支持.tables、.schema student等元命令
基本上就这些。不复杂但容易忽略:做好错误提示(比如 WHERE 列不存在时明确报错)、统一编码(全用 UTF-8)、避免裸 new/delete(全用栈对象或智能指针)。写完你会发现,数据库原理一下子落地了——它就是带结构的文件 + 带逻辑的内存操作。










