0

0

Python字符串系统学习路线第41讲_核心原理与实战案例详解【技巧】

舞夢輝影

舞夢輝影

发布时间:2025-12-26 22:15:07

|

574人浏览过

|

来源于php中文网

原创

python字符串是不可变的unicode序列,所有“修改”操作均创建新对象;频繁拼接应使用''.join();str与bytes需显式编码解码;split、f-string、正则替换及中文路径处理需按规范编码。

python字符串系统学习路线第41讲_核心原理与实战案例详解【技巧】

Python字符串的本质是不可变的Unicode序列,理解这一点,就抓住了所有操作逻辑的起点。它不是字符数组,也不是字节流,而是一串经过编码规范约束的文本单元。任何看似“修改”字符串的操作(比如replace、upper、切片拼接),实际都是创建新对象——原字符串毫未改变。

字符串不可变性带来的关键影响

这直接决定你写代码的方式:

  • 频繁拼接大量短字符串时,用+ 或 +=效率低(每次生成新对象,时间复杂度O(n²)),应改用''.join(list)
  • 想“原地修改”,必须转成listbytearray(后者仅限ASCII/字节场景),处理完再转回str
  • id()is比较在小字符串上可能意外返回True(CPython内部做了驻留优化),但绝不能依赖——真正可靠的相等判断永远用==

编码与解码:字符串和字节的边界在哪里

str是文本,bytes是原始字节。二者之间没有自动转换:

标书对比王
标书对比王

标书对比王是一款标书查重工具,支持多份投标文件两两相互比对,重复内容高亮标记,可快速定位重复内容原文所在位置,并可导出比对报告。

下载
  • str → bytes:调用.encode('utf-8')(指定编码格式,不传默认用系统locale)
  • bytes → str:调用.decode('utf-8')(格式必须与编码一致,否则报UnicodeDecodeError)
  • 读文件时用open(..., encoding='utf-8')直接得str;用open(..., 'rb')得bytes,需手动decode

实战中高频又易错的三类操作

不是记住方法名,而是理解它们在什么前提下安全、高效:

立即学习Python免费学习笔记(深入)”;

  • split() / rsplit():默认按空白符切分(含 u00A0等),且会自动过滤空字段;若需保留空字段或按固定字符切,显式传入sep参数(如s.split(',')
  • format() / f-string:f-string在运行时求值,更轻量;format支持命名、位置、嵌套表达式,适合动态模板;两者都支持格式说明符(如f"{x:.2f}"
  • 正则替换中的 :必须用re.sub(r'(d+)-(d+)', r'-', s),反斜杠后数字表示捕获组编号;若想字面输出反斜杠,得写r'\1''\\1'

一个真实调试场景:中文路径乱码

常见于Windows下用subprocess调外部程序,或os.listdir()遇到非UTF-8编码的文件名:

  • 错误做法:直接print(os.listdir('.')) → 控制台编码不匹配,显示
  • 正确思路:用os.fsencode()os.fsdecode()做系统级编解码,或统一用pathlib.Path(自动适配)
  • 终极防御:所有外部输入(文件名、环境变量、网络响应头)进来第一件事——明确它的编码,decode成str;所有输出前——encode为bytes并指定目标编码

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

970

2023.08.02

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

867

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

459

2024.06.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

738

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1561

2023.10.24

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号