0

0

C++词频统计程序 map容器统计单词频率

P粉602998670

P粉602998670

发布时间:2025-08-29 08:10:01

|

809人浏览过

|

来源于php中文网

原创

使用map统计单词频率时,程序读取文本并逐词处理,通过cleanWord和toLower函数去除标点并转为小写,以std::map存储单词及出现次数,利用其自动排序特性输出有序结果,支持扩展如频率排序或文件输入。

c++词频统计程序 map容器统计单词频率

在C++中,使用

map
容器统计单词频率是一种常见且高效的方法。通过
std::map
,我们可以自动对单词进行排序,并方便地维护每个单词出现的次数。

基本思路

程序读取输入的文本(从标准输入或文件),逐个提取单词,然后以单词为键,出现次数为值,存入

std::map
中。每次遇到一个单词,就将其对应值加1。

完整示例代码

#include 
#include 
#include 
#include 
#include 

// 将单词转为小写,避免大小写敏感
std::string toLower(const std::string& word) {
    std::string lower;
    for (char c : word) {
        lower += std::tolower(c);
    }
    return lower;
}

// 提取纯字母组成的单词,去除标点
std::string cleanWord(const std::string& word) {
    std::string cleaned;
    for (char c : word) {
        if (std::isalpha(c)) {
            cleaned += c;
        }
    }
    return cleaned;
}

int main() {
    std::map wordCount;
    std::string line;

    std::cout << "请输入文本(输入空行结束):\n";

    while (std::getline(std::cin, line) && !line.empty()) {
        std::stringstream ss(line);
        std::string word;

        while (ss >> word) {
            word = cleanWord(word);
            if (!word.empty()) {
                word = toLower(word);
                ++wordCount[word];
            }
        }
    }

    // 输出结果
    std::cout << "\n单词频率统计结果:\n";
    for (const auto& pair : wordCount) {
        std::cout << pair.first << ": " << pair.second << '\n';
    }

    return 0;
}

关键点说明

map自动排序:map会按键的字典序自动排序,输出时单词是有序的。如果不需要排序,可改用

std::unordered_map
提高性能。

大小写处理:将所有单词转为小写,避免"He"和"he"被统计为两个不同单词。

立即学习C++免费学习笔记(深入)”;

BGremover
BGremover

VanceAI推出的图片背景移除工具

下载

标点符号处理:通过

cleanWord
函数过滤掉逗号、句号等非字母字符。

输入控制:程序以空行结束输入,适合交互式使用。如需从文件读取,可将

std::cin
替换为
std::ifstream
对象。

扩展建议

可以添加功能如:限制只统计长度大于2的单词、输出频率最高的前N个单词、将结果写入文件等。也可以使用

vector
配合
sort
按频率排序输出。

基本上就这些,不复杂但容易忽略细节。掌握这个结构后,可以灵活应用到其他统计任务中。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

463

2023.08.02

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

395

2023.09.04

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

463

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

544

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

113

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

200

2025.08.29

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

463

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

544

2024.08.29

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 8万人学习

C 教程
C 教程

共75课时 | 4.3万人学习

C++教程
C++教程

共115课时 | 14.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号