0

0

python转义字符_常见转义符列表、原始字符串与Unicode应用

畫卷琴夢

畫卷琴夢

发布时间:2026-02-08 19:05:18

|

994人浏览过

|

来源于php中文网

原创

Python中反斜杠是字符串解析起点而非运行时转义,发生在编译阶段;应避免单个\结尾、慎用r""处理路径,优先用pathlib或os.path.join,原始字符串与Unicode直写更安全可靠。

python转义字符_常见转义符列表、原始字符串与unicode应用

Python 中反斜杠 \ 不是“转义”而是“解析起点”

Python 解析字符串时,遇到 \ 就会尝试将其与后续字符组合成特殊含义(如 \n\t),这个过程发生在字符串字面量被读入内存的**编译阶段**,不是运行时“转换”。所以问题本质不是“怎么转义”,而是“如何让 \ 不触发解析”。

常见错误现象:"C:\new\test.txt" 报错或路径乱码——因为 \n\t 被解释为换行和制表符,实际传给系统的路径是

C:
ew est.txt

  • Windows 路径、正则表达式、JSON 字符串中大量含 \,直接写双反斜杠 \\ 最稳妥
  • 不要依赖 IDE 或 print() 输出判断:print() 显示的是“人类可读形式”,repr() 才反映真实内存内容
  • \ 后跟非定义转义符(如 \z)在 Python 3.12+ 会报 SyntaxWarning,但不会中断执行;旧版本静默忽略

原始字符串 r"" 的边界条件必须清楚

原始字符串只是让 \ 失去转义能力,但它**不能以单个 \ 结尾**,否则语法错误。这不是限制,而是解析器无法区分“这反斜杠属于字符串末尾”还是“它想转义后面的引号”。

典型误用:r"C:\temp\"SyntaxError: EOL while scanning string literalr"abc\" 同理报错。

立即学习Python免费学习笔记(深入)”;

  • 结尾需加空格或换行符再闭合引号:r"C:\temp\ "(注意末尾空格)
  • 更安全的做法是避免结尾 \:用 os.path.join("C:", "temp")pathlib.Path("C:/temp")
  • 原始字符串对换行符无效:r"ab\ncd" 仍是 6 字符字符串(a b \ n c d),不是两行;若要保留真实换行,用三重引号 """ab\ncd"""

Unicode 字符串不需要 \u 转义也能直写,但要注意编码声明与终端支持

Python 3 默认所有字符串都是 Unicode,源文件中直接写中文、emoji(如 "你好?")完全合法。所谓 \u4f60 只是表示方式之一,不是“必须转义”。

容易踩的坑是:源文件保存为 GBK,但没声明编码,Python 尝试用 UTF-8 读取,导致 SyntaxError: Non-UTF-8 code starting with...

BgSub
BgSub

免费的AI图片背景去除工具

下载
  • 如果必须用 \u 表示,确保是小写 u + 4 位十六进制(\u4f60),超 4 位用 \U + 8 位(\U0001F680
  • Windows 控制台默认不支持某些 Unicode 字符(如部分 emoji),print("?") 可能显示为空格或问号,这不是字符串问题,是终端渲染限制
  • 写入文件时,显式指定 encoding="utf-8"(尤其跨平台时),避免依赖系统默认编码

混合使用原始字符串与 Unicode 的真实场景:正则匹配中文路径

处理 Windows 日志中的中文路径(如 日志\错误\2024-05.log)时,既要防止 \ 被转义,又要匹配 Unicode 字符,不能简单套用 r""u""(Python 3 中 u"" 已冗余)。

正确做法是:原始字符串 + Unicode 字符直写,或原始字符串 + \u 编码,二者等价但前者更可读。

import re
# ✅ 推荐:原始字符串内直写中文
pattern = r"日志\\错误\\[\u4e00-\u9fff]+\.log"

✅ 等价但难读

pattern = r"\u65e5\u5fd7\\u9519\u8bef\[\u4e00-\u9fff]+.log"

❌ 错误:非原始字符串,\u 被当成普通字符

pattern = "日志\错误[\u4e00-\u9fff]+.log" # \u 不会被识别为 Unicode 转义

关键点在于:原始字符串禁用 \ 解析,但不影响 \u 作为正则语法的一部分(这里是 [\u4e00-\u9fff],属于正则表达式引擎处理,不是 Python 字符串解析)。

真正容易被忽略的是:正则中的 \ 是给 re 模块用的,而字符串里的 \ 是给 Python 解析器用的——两层解析必须分开考虑。写错一层,整个模式就失效。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

431

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

543

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

315

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

79

2025.09.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

516

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

252

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

754

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

215

2023.08.11

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

67

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号