0

0

C++怎么统计代码行数 C++读取文件统计行数实现【工具】

穿越時空

穿越時空

发布时间:2026-01-26 11:37:32

|

727人浏览过

|

来源于php中文网

原创

std::getline是C++中统计文件行数的首选方式,自动处理换行符、跨平台一致,能正确计空行和末尾无换行符的最后一行;应以getline返回值为循环条件,避免使用!file.eof()。

c++怎么统计代码行数 c++读取文件统计行数实现【工具】

std::getline 逐行读取最稳妥

直接用 fgetsread 系统调用容易漏判空行、混入 Windows/Linux 换行符(\r\n vs \n),而 std::getline 自动剥离换行符且跨平台行为一致,是 C++ 中统计逻辑行数的首选方式。

关键点:

  • std::getline 每成功读取一行就计一次,包括内容为空但存在换行符的行(即空行)
  • 遇到文件末尾无换行符时,最后一行仍会被计入——这符合多数开发者的直觉(比如 wc -l 在 Linux 下也这样算)
  • 不建议用 while (!file.eof()) 做循环条件,它会在最后一行后多触发一次,导致行数+1;应以 std::getline 的返回值为判断依据
int count = 0;
std::string line;
std::ifstream file("main.cpp");
while (std::getline(file, line)) {
    ++count;
}
// count 即有效行数

跳过注释和空行需手动判断

std::getline 统计的是「物理行数」,若要统计「有效代码行数」(忽略空白行、单行注释 //、块注释起始行等),必须在读取后做字符串分析。

注意边界情况:

立即学习C++免费学习笔记(深入)”;

  • // 可能出现在行中(如 int x = 1; // init),不能简单按前缀匹配
  • /* ... */ 跨行时无法靠单行判断,完整实现需状态机;轻量级工具通常只处理单行注释和纯空行
  • 制表符、空格组成的“伪空行”(如 \t \n)应视为空行,需用 find_first_not_of(" \t\r\n") 判断
bool is_empty_or_comment(const std::string& s) {
    size_t first = s.find_first_not_of(" \t\r\n");
    return first == std::string::npos || s.substr(first, 2) == "//";
}
// 使用时:if (!is_empty_or_comment(line)) ++code_lines;

大文件下 std::getline 性能足够,无需 mmap

对几 MB 到百 MB 级别的源码文件,std::getline 配合默认缓冲区(通常 8KB)已足够快;实测读取 50MB 文件耗时约 150ms(i7-11800H),远低于编译耗时,没必要上 mmapreadv

TURF(开源)权限管理系统
TURF(开源)权限管理系统

TURF(开源)权限定制管理系统(以下简称“TURF系统”),是蓝水工作室推出的一套基于软件边界设计理念研发的具有可定制性的权限管理系统。TURF系统充分考虑了易用性,将配置、设定等操作进行了图形化设计,完全在web界面实现,程序员只需在所要控制的程序中简单调用一个函数,即可实现严格的程序权限管控,管控力度除可达到文件级别外,还可达到代码级别,即可精确控制到

下载

只有明确遇到性能瓶颈时才考虑优化:

  • 避免频繁构造 std::string:可用 std::vector + file.read() 手动解析换行符,但代码复杂度陡增
  • 多文件并行统计可用 std::thread,但要注意 std::ifstream 不共享状态,各自开流即可
  • Windows 下若文件含 BOM(0xEF 0xBB 0xBF),std::getline 会把它当普通字符读入首行,需额外跳过

命令行参数和编码问题最容易被忽略

写成小工具时,用户常传入中文路径或 UTF-8/BOM 文件,而默认 std::ifstream 在 Windows 下用本地 ANSI 编码打开,会导致乱码甚至打不开文件。

解决方案很具体:

  • Linux/macOS 下基本无感;Windows 下推荐用 std::filesystem::path 处理路径,配合 std::wifstream + std::locale 支持宽字符路径(但内容仍按字节读)
  • 若要正确识别 UTF-8 BOM,可在打开后检查前 3 字节,手动跳过:if (buf[0]==0xEF && buf[1]==0xBB && buf[2]==0xBF) pos += 3;
  • 不要依赖 argc/argv 直接转 std::string 处理中文路径——Windows 控制台默认是 GBK,需用 GetCommandLineW + WideCharToMultiByte

实际交付的小工具,90% 的报错都来自路径或 BOM,而不是算法本身。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

401

2023.08.02

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

772

2023.08.22

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

93

2023.09.25

fgets在c语言中的用法
fgets在c语言中的用法

本专题整合了c语言中fgets用法介绍,阅读专题下面的文章了解更多详细内容。

16

2025.08.27

fgets在c语言中的用法
fgets在c语言中的用法

本专题整合了c语言中fgets用法介绍,阅读专题下面的文章了解更多详细内容。

16

2025.08.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1496

2023.10.24

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

70

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.8万人学习

Git 教程
Git 教程

共21课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号