0

0

c++如何实现前缀树trie_c++ 字符串快速检索与节点设计【实战】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-12-29 19:55:02

|

193人浏览过

|

来源于php中文网

原创

用std::array因O(1)下标跳转、零分配、无扩容抖动;非ASCII字符可通过预处理、扩大数组或哈希映射应对;TrieNode只需bool is_end,避免冗余存储;search与startsWith语义不同需分别实现。

c++如何实现前缀树trie_c++ 字符串快速检索与节点设计【实战】

为什么用 std::array 而不是 std::vector 存子节点

前缀树的核心性能来自 O(1) 的字符跳转,std::array<:unique_ptr>, 26></:unique_ptr> 直接用 'a' - 'a' 算下标,避免哈希计算或遍历开销。用 std::vectorstd::map 会把单次插入/查询从 O(L) 拉到平均 O(L·log 26) 甚至 O(L·26),尤其在大量短字符串(如单词、IP段)场景下差异明显。26 个字母是编译期确定大小,std::array 零分配、无动态扩容抖动。

如何处理非小写 ASCII 字符(比如中文、大小写混合)

编码 26 个槽只适用于纯小写英文。实际项目中常见三种应对方式:

  • 统一预处理:调用 std::tolower + std::isalpha 过滤,把输入转成小写再进树
  • 扩大数组尺寸:用 std::array<:unique_ptr>, 128></:unique_ptr>,直接按 ASCII 值索引,ch 作下标(需确保 ch < 128
  • 改用哈希映射:用 std::unordered_map<char std::unique_ptr>></char>,牺牲常数时间换灵活性,适合 Unicode(需配合 std::u32string 和 char32_t 处理)

多数日志关键词匹配、命令行自动补全等场景,选第一种最轻量;做多语言词典则倾向第三种。

TrieNode 必须带 is_end 标记,但别滥用 word 字段

很多初学者会在每个节点存完整字符串(如 std::string word),这会导致内存爆炸——10 万个单词平均长 5 字符,重复前缀被存储上百次。正确做法是只在叶子或终止节点设 bool is_end = false,需要还原字符串时靠调用方传入路径(或递归参数)。若真要存词(如实现「以某前缀开头的所有词」接口),只在 is_end == true 的节点存一份 std::string_view(指向原始字符串池),避免拷贝。

立即学习C++免费学习笔记(深入)”;

GentleAI
GentleAI

GentleAI是一个高效的AI工作平台,为普通人提供智能计算、简单易用的界面和专业技术支持。让人工智能服务每一个人。

下载
struct TrieNode {
    std::array<std::unique_ptr<TrieNode>, 26> children;
    bool is_end = false;
};
<p>class Trie {
std::unique_ptr<TrieNode> root;</p><p>public:
Trie() : root(std::make_unique<TrieNode>()) {}</p><pre class='brush:php;toolbar:false;'>void insert(const std::string& word) {
    auto* node = root.get();
    for (char c : word) {
        int idx = c - 'a';
        if (!node->children[idx]) {
            node->children[idx] = std::make_unique<TrieNode>();
        }
        node = node->children[idx].get();
    }
    node->is_end = true;
}

bool search(const std::string& word) {
    auto* node = root.get();
    for (char c : word) {
        int idx = c - 'a';
        if (!node->children[idx]) return false;
        node = node->children[idx].get();
    }
    return node->is_end;
}

};

insert 和 startsWith 共享路径查找逻辑,但语义隔离必须清晰

看似 startsWith 只是少判 is_end,但二者契约完全不同:search 要求路径存在且终点标记为词尾;startsWith 只要求路径存在(哪怕中途就断了也得返回 false)。不能简单复用 search 返回指针后判断是否为空——因为 search 中途遇到空子节点就 return false,而 startsWith 必须走完全部字符才下结论。易错点在于循环结束后不检查 node 是否为 null,而是直接返回 true。

另外,空字符串 "" 是合法前缀,但只有显式插入过 "" 才能被 search 命中,这点常被忽略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1568

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 7.3万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 21.8万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 13.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号