0

0

c++字符串操作_大小写转换、去空格、分割等实用技巧

煙雲

煙雲

发布时间:2026-03-18 12:26:51

|

100人浏览过

|

来源于php中文网

原创

std::transform转大小写时需将char先转unsigned char再调用std::toupper/tolower,否则有符号扩展导致UB;trim应自定义基于std::isspace的逻辑;分割字符串推荐find+substr而非stringstream;性能敏感场景优先用std::string_view。

c++字符串操作_大小写转换、去空格、分割等实用技巧

std::transform 转大小写时,别直接传 toupper/tolower

常见错误是写 std::transform(s.begin(), s.end(), s.begin(), ::toupper),结果在某些平台(尤其是 Linux + glibc)下遇到 std::bad_cast 或乱码。原因是 toupper 只接受 int 且要求参数在 unsigned char 范围内,而 char 在某些编译器里默认是有符号的,负值传进去就 UB。

正确做法是先转成 unsigned char 再调用:

std::transform(s.begin(), s.end(), s.begin(),
    [](unsigned char c) { return std::toupper(c); });
  • Windows MSVC 通常不报错,容易掩盖问题;Linux/macOS 更严格,务必测试
  • 如果处理 Unicode(如 UTF-8),std::toupper 完全不适用,得用 ICU 或 std::locale 配合 facet(但开销大)
  • 小写同理,用 std::tolower + 同样转换

去除首尾空格:自己写比依赖 Boost 更可控

boost::trim 看起来省事,但引入整个 Boost 太重,而且对非 ASCII 空白字符(比如 \u3000 全角空格)默认不识别。C++20 前没标准 trim,自己写几行更靠谱。

关键点在于:空格不止是 ' ',还有 '\t''\n''\r''\f''\v' —— 这些才是 std::isspace 认的“空白”。

立即学习C++免费学习笔记(深入)”;

auto is_ws = [](unsigned char c) { return std::isspace(c); };
s.erase(s.begin(), std::find_if_not(s.begin(), s.end(), is_ws));
s.erase(std::find_if_not(s.rbegin(), s.rend(), is_ws).base(), s.end());
  • 必须用 unsigned char 传给 std::isspace,否则和 toupper 一样有符号扩展风险
  • 不要用 std::string::find_first_not_of(" \t\n\r\f\v"),它硬编码字符集,无法适配 locale
  • 如果需支持 Unicode 空白(如中文空格),得换正则或专用库,别硬扩

按分隔符分割字符串:别手写 while + find,用 std::stringstream 有陷阱

std::stringstream 遇到连续分隔符(如 "a,,b")会跳过空字段,得到 {"a", "b"} 而不是预期的 {"a", "", "b"}。这不是 bug,是设计如此 —— 它按“单词”切,不是按分隔符切。

Jamboss
Jamboss

Jamboss是一款简单的AI音乐生成App,可以一键生成歌曲。

下载

真要精确控制,用 std::string::find + substr 最稳:

std::vector<std::string> split(const std::string& s, char delim) {
    std::vector<std::string> out;
    size_t start = 0, end = 0;
    while ((end = s.find(delim, start)) != std::string::npos) {
        out.push_back(s.substr(start, end - start));
        start = end + 1;
    }
    out.push_back(s.substr(start));
    return out;
}
  • 这个版本保留空字段,比如 split("a,,b", ','){"a", "", "b"}
  • 如果分隔符是字符串(如 "::"),不能用 find 单字符版,得用 find(delim) 并调整 start 步长
  • C++23 的 std::ranges::split_view 更简洁,但还没普及,线上项目慎用

性能敏感场景:避免反复构造 std::string 临时对象

比如循环里写 s.substr(i, len).c_str(),每次调用都分配内存、拷贝内容。在日志、解析、高频字符串处理中,这会成为瓶颈。

能用 std::string_view 就别用 std::string

// 好:只存指针+长度,零拷贝
std::vector<std::string_view> views;
views.emplace_back(s.data() + i, len);
<p>// 坏:隐式构造 string,堆分配
std::vector<std::string> copies;
copies.emplace_back(s.substr(i, len));
  • std::string_view 不拥有数据,确保原字符串生命周期长于 view
  • 函数参数优先用 std::string_view(C++17 起),避免重载 const char*std::string 两套
  • 调用 C 接口(如 printfopen)时,仍需 .data() + .size() 配合,不能直接传 string_view

字符串操作里最常被忽略的,其实是字符类型的符号性 —— 一个 char 是 signed 还是 unsigned,能决定 toupperisspace 是否崩溃。这点在跨平台代码里,比语法糖重要得多。

相关文章

c++速学教程(入门到精通)
c++速学教程(入门到精通)

c++怎么学习?c++怎么入门?c++在哪学?c++怎么学才快?不用担心,这里为大家提供了c++速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1091

2023.08.02

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

108

2023.09.25

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

309

2023.11.28

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

565

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1571

2023.10.24

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

3

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11.5万人学习

C 教程
C 教程

共75课时 | 5.6万人学习

C++教程
C++教程

共115课时 | 22.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号