0

0

c++如何将string转换为wstring_c++宽窄字符转换【源码】

冰火之心

冰火之心

发布时间:2026-01-24 13:18:02

|

510人浏览过

|

来源于php中文网

原创

应使用MultiByteToWideChar(Windows)或std::mbrtowc(跨平台),而非弃用的std::codecvt或locale依赖的mbstowcs;源字符串编码必须明确为UTF-8,不可依赖系统locale。

c++如何将string转换为wstring_c++宽窄字符转换【源码】

std::string 转 std::wstring 用 mbstowcs 还是 std::codecvt?

在 C++11 及以后,std::codecvt 已被弃用(C++17 标准中标记为 deprecated),且 MSVC 和 GCC 都不推荐继续使用。直接调用 mbstowcsMultiByteToWideChar(Windows)更可靠、更可控。

关键点在于:源 std::string编码必须明确——它通常是 UTF-8(Linux/macOS 默认)、GBK(中文 Windows 系统本地代码页),或其它 locale-dependent 编码。不能假设“系统 locale 就是 UTF-8”。

  • Linux/macOS 下多数终端和文件 I/O 默认 UTF-8,mbstowcsLC_CTYPE 设为 en_US.UTF-8 时可安全转换 UTF-8 到 wchar_t
  • Windows 控制台默认是 GBK(如 Chinese_PRC.936),此时若传入 UTF-8 字符串却用 mbstowcs,会乱码或截断
  • std::wstring_convert 同样已弃用,不要在新项目中使用

Windows 下用 MultiByteToWideChar 转 UTF-8 到 wstring

这是 Windows 上最稳妥的方式,尤其当你明确知道输入是 UTF-8(比如从 JSON、网络 API、UTF-8 文本文件读取的 std::string)。

示例(无异常处理简化版):

立即学习C++免费学习笔记(深入)”;

墨鱼aigc
墨鱼aigc

一款超好用的Ai写作工具,为用户提供一键生成营销广告、原创文案、写作辅助等文字生成服务。

下载
std::wstring string_to_wstring(const std::string& str) {
    if (str.empty()) return std::wstring();
    int len = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, nullptr, 0);
    std::wstring result(len - 1, L'\0'); // -1 排除 null terminator
    MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, &result[0], len);
    return result;
}
  • CP_UTF8 明确指定输入为 UTF-8;别用 CP_ACP(当前 ANSI 代码页),它在中文 Windows 上是 GBK,和 UTF-8 混用必出错
  • 两次调用:第一次获取所需缓冲区长度,第二次写入;避免硬分配过大 buffer 或溢出
  • 返回值含末尾 L'\0',但 std::wstring 自身不依赖它,所以 len - 1 是安全的字符数

跨平台(UTF-8 输入)用 std::mbrtowc 手动转换

如果不想引入 Windows API,又需兼容 Linux/macOS,可用 std::mbrtowc 逐字符解析 UTF-8 —— 它是 C 标准库函数,行为定义清晰,且不依赖全局 locale 设置(只要传入正确的 mbstate_t 初始化状态)。

注意:std::mbrtowc 不是“一次转整个字符串”,需循环调用:

std::wstring utf8_to_wstring(const std::string& u8str) {
    std::wstring result;
    result.reserve(u8str.size()); // 粗略预分配(UTF-8 中 ASCII 占 1 字节,汉字占 3,wchar_t 通常 4 字节)
    mbstate_t state = {};
    const char* ptr = u8str.c_str();
    const char* end = ptr + u8str.size();
    while (ptr < end) {
        wchar_t wc;
        size_t r = std::mbrtowc(&wc, ptr, end - ptr, &state);
        if (r == static_cast(-1)) break; // 无效 UTF-8
        if (r == static_cast(-2)) break; // 截断(不完整多字节序列)
        if (r > 0) {
            result.push_back(wc);
            ptr += r;
        } else {
            ptr++; // r == 0,遇到 '\0'
        }
    }
    return result;
}
  • 必须初始化 mbstate_t state = {},否则未定义行为
  • 返回值 -1 表示非法字节序列(如 "\xFFabc"),-2 表示输入结束但多字节未完成(如只剩 "\xE4\xB8"
  • 该函数不修改 locale,因此比 mbstowcs 更可预测——前提是输入确实是 UTF-8

为什么不能直接 reinterpret_cast(str.data())?

因为 std::stringstd::wstring 的内存布局完全不同:前者是连续 char(1 字节),后者是连续 wchar_t(Windows 是 2 字节,Linux/macOS 通常是 4 字节)。直接 reinterpret_cast 会导致:

  • 字节序错乱(如 UTF-8 的 "中"\xE4\xB8\xAD,强制当 wchar_t 读成 0xE4B80x00E4B800,完全不是 U+4E2D)
  • 越界访问(str.size() 字节 ≠ wstr.size()wchar_t
  • 程序崩溃或静默数据损坏,尤其在开启 ASAN 或不同平台时表现不一

这种“捷径”只在极特殊场景(如你 100% 确定 string 是按 wchar_t 大小对齐的二进制 dump,且平台一致)下才可能成立,日常开发中等同于埋雷。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

417

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

534

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

76

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

381

2023.08.02

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

527

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

278

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

17

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.7万人学习

Git 教程
Git 教程

共21课时 | 2.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号