0

0

C++如何实现字符串的URL编码与解码?(百分号转义处理)

尼克

尼克

发布时间:2026-02-18 17:13:02

|

977人浏览过

|

来源于php中文网

原创

url编码必须转义0x00–0x20、0x7f–0xff及空格、/、?、#、&、=、+、%、$、@、!、~、*、\、(、)、[、]等字符;'-'、'_'、'.'属未保留字符无需编码;utf-8需按字节处理,' '编码为"%20"而非"+",'%'自身须编码为"%25";c++中推荐std::format("%02x")或ostringstream配合setw(2)/setfill('0'),并强制转unsigned char避免符号扩展;解码时须严格校验%后两位十六进制,非法序列原样保留,不自动将+转空格,除非明确启用application/x-www-form-urlencoded模式。

c++如何实现字符串的url编码与解码?(百分号转义处理)

URL编码时哪些字符必须转义?

不是所有非字母数字字符都要变成%XX,只有保留字符(如/?&)和不安全字符(如空格、中文、+#)才需要处理。标准做法是:只对0x00–0x200x7F–0xFF以及' ''/''?''#''&''=''+''%''$''@''!''~''*''\''('')''['']'等显式列出的字符做百分号编码。

常见错误是把'-''_''.''*'也编码了——其实它们在RFC 3986中属于“未保留字符”,可不转义;但注意'*'在部分老服务里会被误解析,保险起见可选编码。

  • UTF-8字符串要先按字节处理,不能按wchar_tstd::u8string单个code point切分
  • ' '必须转成"%20",不是'+'(那是application/x-www-form-urlencoded的规则)
  • 编码后的'%'本身必须变成"%25",否则会破坏转义结构

std::ostringstream还是std::format拼接十六进制?

C++20起std::format最干净,但若项目还在C++17或更低,std::ostringstream比手写sprintf安全,且避免std::to_string无法补零的问题。

别用std::hex直接输出到std::ostringstream而不设std::setw(2)std::setfill('0')——会导致0xA变成"a"而非"0a",且小写字母不符合多数服务端预期(虽然RFC允许大小写,但Nginx、Python urllib.parse默认小写,Go默认大写,建议统一用小写)。

立即学习C++免费学习笔记(深入)”;

editGPT
editGPT

一款浏览器插件,让ChatGPT修改、校对英语文章

下载
  • 示例片段(C++17):
    oss << std::hex << std::setw(2) << std::setfill('0') << static_cast<int>(static_cast<unsigned char>(c));
  • C++20推荐:
    std::format("%02x", static_cast<unsigned int>(static_cast<unsigned char>(c)))
  • 注意强制转成unsigned char再转int,否则char为有符号时,0xFF会变成-1std::hex输出"ffffffff"

URL解码时如何安全处理%XX格式?

解码不是简单正则替换。必须校验%后是否紧跟两个十六进制字符,且不能跨字节截断——比如"%ff%xx"中的%xx非法,应原样保留;"%g1"也非法;"%2"不完整,也要跳过。

更隐蔽的坑是:输入含'%'但后面没跟合法hex,此时不能丢弃这个'%',否则会丢失原始信息(例如用户故意传"hello%world",解码后应为"hello%world",不是"helloworld")。

  • 逐字节扫描,遇到'%'就检查后续两字节是否都为0-9a-fA-F
  • std::isxdigit判断,但注意它接受int且对EOF敏感,传入前需确保不是char(-1)
  • 十六进制转换建议用std::stoi(s, nullptr, 16)或查表法(更快),避免手写(c>='a'?c-'a'+10:c-'0')时没处理大小写
  • 解码结果字节流直接存入std::string,不要尝试转成std::u8string——解码后仍是UTF-8字节序列,语义由上层协议约定

要不要支持+替代空格?

严格来说,URL编码(percent-encoding)不包含'+'→空格规则;那是HTML表单编码(application/x-www-form-urlencoded)的特例。如果你对接的是浏览器GET参数或旧API,大概率会混用这两种规则。

所以实际实现里,解码函数最好加一个bool allow_plus_for_space = false参数,默认关掉。开启时,只在非路径段(如查询参数值)中把'+'当空格处理——路径里的+永远不该被替换(https://a.com/b+cb+c是路径名,不是空格)。

  • 检测是否在查询参数值中,需依赖外部上下文;纯解码函数无法自动判断,所以别默认启用
  • 编码函数一律不生成'+',只输出"%20"
  • 如果调用方明确说“这是form-data”,再套一层预处理:把' '先替换成'+',再做标准URL编码
C++里URL编解码真正难的不是逻辑,是边界字符判断和UTF-8字节层面的严谨性——稍不注意,中文就变乱码,%就吃掉后续字符,或者大小写混用导致签名不一致。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
nginx 重启
nginx 重启

nginx重启对于网站的运维来说是非常重要的,根据不同的需求,可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容,供大家免费下载体验。

240

2023.07.27

nginx 配置详解
nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件,可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大,允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

516

2023.08.04

nginx配置详解
nginx配置详解

NGINX与其他服务类似,因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章,大家可以免费学习。

566

2023.08.04

tomcat和nginx有哪些区别
tomcat和nginx有哪些区别

tomcat和nginx的区别:1、应用领域;2、性能;3、功能;4、配置;5、安全性;6、扩展性;7、部署复杂性;8、社区支持;9、成本;10、日志管理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

240

2024.02.23

nginx报404怎么解决
nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误,表明服务器无法找到请求资源,可以通过以下步骤解决:1. 检查文件是否存在且路径正确;2. 检查文件权限并更改为 644 或 755;3. 检查 nginx 配置,确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

520

2024.07.09

Nginx报404错误解决方法
Nginx报404错误解决方法

解决方法:只需要加上这段配置:try_files $uri $uri/ /index.html;即可。想了解更多Nginx的相关内容,可以阅读本专题下面的文章。

3586

2024.08.07

nginx部署php项目教程汇总
nginx部署php项目教程汇总

本专题整合了nginx部署php项目教程汇总,阅读专题下面的文章了解更多详细内容。

49

2026.01.13

nginx配置文件详细教程
nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总,阅读专题下面的文章了解更多详细内容。

65

2026.01.13

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

561

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Rust 教程
Rust 教程

共28课时 | 6万人学习

Git 教程
Git 教程

共21课时 | 3.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号