用std::map统计字符频次时,直接freq[c]++即可,因int默认初始化为0;切勿用freq.at(c)++以免抛异常;区分大小写和空白;UTF-8中文需先解码为Unicode码点再统计。

用 std::map 统计字符串中每个字符出现次数
直接遍历字符串,对每个 char 在 map 中自增计数即可。注意 map 会自动初始化新键为 0(因为 int 是 POD 类型,值初始化为 0),所以不用提前检查是否存在:
std::string s = "hello"; std::mapfreq; for (char c : s) { freq[c]++; // 第一次访问 freq['h'] 时,自动构造为 { 'h': 0 },再 ++ 得 1 }
常见错误是误用 freq.at(c)++ ——它会在键不存在时抛出 std::out_of_range 异常。
区分大小写和空白字符是否计入
默认统计严格按 ASCII 值,'A' 和 'a' 被视为不同字符,空格、换行、制表符也都单独计数。若需忽略大小写:
- 遍历前用
std::tolower转换:freq[std::tolower(c)]++ - 注意包含
头文件,且只对unsigned char安全,建议 cast:freq[std::tolower(static_cast(c))] - 如要跳过空白,加判断:
if (!std::isspace(static_cast(c))) freq[c]++
不处理这些细节时,容易在处理用户输入或日志文本时得到不符合预期的频次结果。
立即学习“C++免费学习笔记(深入)”;
std::unordered_map 比 map 更快,但不保证顺序
如果只需查频次、不关心字符输出顺序(比如只取最高频字符),用 std::unordered_map 更合适——平均插入和查找是 O(1),而 map 是 O(log n)。但它的遍历顺序是哈希决定的,不可预测:
std::unordered_mapfreq; for (char c : s) freq[c]++; // 遍历时顺序随机,不能假设 'a' 一定在 'b' 前面
若后续要按字符 ASCII 升序打印频次,要么改用 map,要么把 unordered_map 的内容拷进 vector 后排序。
中文 UTF-8 字符不能直接用 char 键
UTF-8 下一个汉字占 3 字节,char 只能存单字节,逐字节拆开统计会得到无意义的碎片频次(比如把 你 拆成三个独立 char 值)。此时必须先做 UTF-8 解码,提取 Unicode 码点,再用 std::map 或 std::u32string 处理。标准库不提供开箱即用的 UTF-8 迭代器,常见做法是用第三方库(如 ICU、utf8cpp)或手写解码逻辑。这点极易被忽略,一试英文正常、一跑中文就出错。










