C++怎么求众数 C++使用哈希表统计词频方法【算法】

裘德小鎮的故事

发布时间：2026-03-03 13:15:10

148人浏览过

来源于php中文网

原创

用 std::unordered_map 统计频次再遍历找最大值是求众数的标准解法，平均 o(1) 时间优于 std::map；注意键类型需支持哈希与等号、空输入处理、线程不安全及小范围数据可用数组优化。

c++怎么求众数 c++使用哈希表统计词频方法【算法】

用 `std::unordered_map` 统计频次是最直接的解法

众数本质是出现次数最多的元素，C++里没有内置“求众数”函数，必须自己统计频次再找最大值。不用手写哈希表，std::unordered_map 就是标准答案——它平均 O(1) 插入和查询，比 std::map（红黑树，O(log n)）更合适。

常见错误是把 std::map 当默认选择，尤其在刷题时没注意性能差异，大数据量下容易超时。

键类型必须支持 operator== 和哈希函数，基础类型（int、char、std::string）都自带
对自定义结构体，得手动提供哈希特化（std::hash<t></t>）和等号重载，否则编译报错：error: call to implicitly-deleted default constructor of 'std::hash<mystruct>'</mystruct>
插入时别用 map[key]++ 直接累加，它会先默认构造 value（对 int 是 0），没问题；但对复杂类型可能触发不必要的构造

遍历一次数组 + 一次 map 就能拿到众数

不需要排序，也不需要两次遍历原数组。统计完频次后，再遍历 unordered_map 找最大 value 对应的 key 即可。注意：众数不唯一，题目若只要一个，取第一个最大值就行；若要全部，得额外存所有 max_count 的 key。

容易踩的坑是边插边更新最大值——看似省一次遍历，但逻辑易错，比如初始 max_count = 0，而数组全为负数（不影响 int 频次，但思维惯性会误判），或空输入没处理。

立即学习“C++免费学习笔记（深入）”；

LibLib AI

中国领先原创AI模型分享社区，拥有LibLib等于拥有了超多模型的模型库、免费的在线生图工具，不考虑配置的模型训练工具

下载

空容器要提前返回，否则遍历空 map 行为未定义
用 int max_count = -1 初始化，比 0 更安全（虽然频次不会负，但防御性习惯）

示例片段：

std::unordered_map<int, int> freq;<br>for (int x : nums) freq[x]++;<br>int mode = nums[0], max_count = 0;<br>for (const auto& p : freq) {<br>    if (p.second > max_count) {<br>        max_count = p.second;<br>        mode = p.first;<br>    }<br>}

当数据范围小且固定时，数组代替哈希表更快

如果题目明确说数值在 [0, 1000] 或 [-10⁴, 10⁴] 这种有限区间，用 vector 或普通数组做计数桶，比 unordered_map 更快也更省内存——无哈希计算、无动态扩容、缓存友好。

典型错误是开数组大小写错：比如值域是 [-5000, 5000]，长度得是 10001，还要偏移 5000；漏掉偏移就会越界访问，引发未定义行为（vector::at 会抛异常，[] 不检查）。

偏移量 = -min_value，数组长度 = max_value - min_value + 1
访问时下标 = 原值 + 偏移量，务必检查是否在 [0, size) 内
对 unsigned 类型或非负数，偏移可省，直接当索引用

多线程或高频调用场景下注意 `unordered_map` 的线程安全性

std::unordered_map 本身不是线程安全的：多个线程同时写（哪怕写不同 key）会导致崩溃；读写并发也不行。只读可以多线程，但前提是 map 构建完成后不再修改。

实际项目中容易忽略这点，比如在初始化阶段用单线程构建好频次表，之后交给多个 worker 线程只读查询——这没问题；但如果一边统计一边被其他线程查，就必须加锁（std::shared_mutex 比 std::mutex 更适合读多写少）。

STL 容器的线程安全规则统一：多读 OK，读写/多写必须同步
不要依赖“我只改不同 bucket”这种底层假设，标准不保证
若需并发安全哈希表，考虑第三方库如 tbb::concurrent_hash_map，而非自己加锁封装

事情说清了就结束。真正卡住人的往往不是算法逻辑，而是哈希键类型不支持、空输入没判断、线程场景下误信“只读安全”这些细节。

C++如何实现一个带LRU淘汰策略的高性能线程安全本地缓存？（组件设计）

C++中的局部类（Local Class）是什么？（有哪些使用限制）

C++怎么实现深拷贝_C++拷贝控制教程【内存】

C++怎么使用future和promise_C++异步结果获取【并发】

C++如何实现带权重优先级的协程任务调度策略？（异步并发控制）

相关标签:

c++ String 封装 Error 结构体 char int operator 线程多线程 map 并发 default constructor 算法

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++如何实现跨线程任务传递？（消息队列+回调）下一篇：C++怎么管理内存 C++内存泄漏怎么排查解决【重点】

作者最新文章

圆周率是多少圆周率π等于多少【百科】

2026-03-03 09:25

C++怎么使用计时器精度_C++高分辨时钟教程【准确】

2026-03-03 09:26

1埃是多少纳米 1埃米等于多少米【微小】

2026-03-03 09:29

智联招聘官网网站智联招聘网页版登录

2026-03-03 09:39

C++如何实现跨平台的动态库加载器？（模块化架构开发）

2026-03-03 09:41

Composer如何限制只从可信源安装包？（security与repository过滤）

2026-03-03 09:43

C++如何调用SMTP发送邮件？（基于socket或第三方库）

2026-03-03 09:45

PPT怎么设置切换效果_PPT页面过渡动画【方法】

2026-03-03 09:52

C++怎么使用chrono计时_C++高精度时间测量【基准】

2026-03-03 09:55

C++怎么读写JSON_C++数据解析教程【热门】

2026-03-03 10:00

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

910

2023.08.02

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

411

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

366

2023.10.25

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

428

2025.06.09

golang结构体方法

本专题整合了golang结构体相关内容，请阅读专题下面的文章了解更多。

201

2025.07.04

string转int

910

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

598

2024.08.29