c_str()始终返回以'\0'结尾的C风格字符串,data()仅保证前size()字节为内容但不保证末尾有'\0';C++11明确二者行为差异,C++17强化非空终止语义并支持string_view。

data() 返回内部字符数组的指针,不保证末尾有 '\0';c_str() 也返回指针,但强制保证以 '\0' 结尾。
返回内容是否带空终止符
这是最根本的区别:
-
c_str()始终返回一个以'\0'结尾的 C 风格字符串(null-terminated),可直接传给printf、strlen、open()等 C 函数。 -
data()在 C++11 之前行为未定义(可能不以'\0'结尾);C++11 起明确要求data()返回的指针指向的前size()个字节是字符串内容,但不保证第size()个字节是'\0'。不过实践中多数实现仍会预留空字符(尤其在非 short-string 优化情况下),但你不该依赖它。
C++11/17 中的关键变化
C++11 是分水岭:
- C++11:首次明确定义
data()行为 —— 它与c_str()返回相同地址,且data() + size()处的字节**不一定**是'\0'(即不要求 null-termination)。但标准允许实现让data()[size()] == '\0',只是你不能假设它一定成立。 - C++17:进一步强化了“不保证 null-termination”这一语义,并新增了
std::string_view,其构造函数接受data(), size()形式,正体现了对非 null-terminated 字符序列的支持。
什么时候该用哪个?
看调用目标是否需要 '\0':
立即学习“C++免费学习笔记(深入)”;
- 调用 C 函数(如
fopen(filename.c_str(), "r"))、格式化输出(printf("%s", s.c_str()))、系统 API(execv(argv[0], &argv[0]))→ 必须用c_str()。 - 传给只读二进制接口、或配合
string_view、或需要访问原始字节(含可能的'\0'字符)→ 优先用data(),并显式传长度:write(fd, s.data(), s.size())。 - 注意:
s.data() == s.c_str()在绝大多数实现中为真,但逻辑上不该用==比较它们——比较无意义,且未来实现可能不同(比如 SSO 优化下某次 resize 后data()重分配而c_str()缓存未更新,虽然标准禁止这种缓存不一致)。
一个易错例子
下面代码在 C++11+ 中是**未定义行为(UB)**:
std::string s = "hello\0world"; // 含嵌入 '\0'
const char* p = s.data();
printf("%s", p); // ❌ 只打印 "hello",且行为不可靠:%s 遇到第一个 '\0' 就停,但 data() 不保证后续安全正确做法是:
- 若想打印全部字节(含中间
'\0'),不用%s,改用循环或std::cout.write(s.data(), s.size()); - 若要作为 C 字符串使用,确保不含内部
'\0',并用c_str()。
基本上就这些。核心就一条:要 null-terminated → 用 c_str();只要原始字节+长度 → 用 data()。C++11 把这事说清楚了,别再凭经验混用了。











