substr用于提取子串,含无参和双参重载;pos为起始索引,len为字符个数(非结束位置);pos越界抛异常,pos等于长度时返回空串,len超限自动截断但应先校验。

substr 函数的基本用法和参数含义
substr 是 std::string 的成员函数,用来提取子串。它有两个重载版本:substr()(无参)和 substr(size_t pos, size_t len)(双参)。第一个参数 pos 是起始位置(从 0 开始),第二个参数 len 是要截取的字符个数 —— 注意不是结束位置。
常见错误是把 len 当成“到第几个字符为止”,比如想取索引 2 到 5 的字符(共 4 个),误写成 s.substr(2, 5),实际应写 s.substr(2, 4)。
如果省略 len,则默认截取从 pos 到末尾的所有字符;如果 pos 超出字符串长度,会抛出 std::out_of_range 异常。
越界时的行为和安全检查怎么做
当 pos > s.length() 时,substr 一定会抛异常;但当 pos == s.length() 时,返回空串;当 pos 但 <code>pos + len > s.length(),len 会被自动截断为 s.length() - pos,不会报错。
立即学习“C++免费学习笔记(深入)”;
- 不建议依赖自动截断,尤其在关键逻辑中 —— 容易掩盖边界判断疏漏
- 推荐先校验:
if (pos - 或用更稳妥的方式:
s.substr(pos, std::min(len, s.length() - pos))
和 C 风格字符串、find 配合使用的典型场景
实际开发中,substr 很少单独用,常配合 find、rfind 或 find_first_of 提取特定分隔符之间的内容。比如解析形如 "key=value" 的字符串:
std::string s = "name=alice";
size_t eq_pos = s.find('=');
if (eq_pos != std::string::npos) {
std::string key = s.substr(0, eq_pos); // "name"
std::string value = s.substr(eq_pos + 1); // "alice"
}注意:find 返回 std::string::npos(通常是 -1 的无符号等价),必须显式比较,不能直接用于 substr。
另一个容易忽略的点:中文或 UTF-8 字符串里,substr 按字节截取,不是按字符 —— 如果字符串含多字节字符,结果可能损坏。此时不应使用 substr,而该用 ICU 或 utf8cpp 等库。
性能和替代方案:什么时候不该用 substr
substr 默认返回新字符串,触发内存分配和拷贝 —— 对大字符串或高频调用场景(如解析日志流)可能成为瓶颈。
- 若只需只读访问,考虑用
std::string_view(C++17 起):std::string_view(s).substr(pos, len),零拷贝 - 若已知源字符串生命周期足够长,
string_view更轻量且语义清晰 - 旧标准(C++11/14)中没有
string_view,可传引用 + 偏移/长度组合模拟,但需自行管理有效性
真正麻烦的不是怎么写 substr,而是忘记它背后有拷贝开销,以及在 Unicode 场景下它根本不“懂”字符边界。











