python2.7字符编码：首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?-PHP中文网问答

讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

python2.7字符编码：首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

黄舟 2017-04-18 09:46:54

[Python讨论组]

896

想请教一下python2.7下字符编码的两个问题。

python2.7爬虫爬取一个utf-8的中文网页，为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要？

# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为utf-8编码？

黄舟

人生最曼妙的风景，竟是内心的淡定与从容！

全部回复(5)

迷茫2017-04-18 09:48:54 5楼

1、没必要。仅保存网页，只要将respone.read()获得的字节对象以二进制模式写入文件即可。

2、是的。

赞 +0

添加回复

高洛峰2017-04-18 09:48:54 4楼

1.如果你用的Python2的话，不是有没有必要，而是必须。 Unicode只能存在与内存中，保存到文件需要编码为utf-8或者gbk啊等等，不然肯定报错的

是的，因为不声明的话，默认是Ascii的格式，那样比如文件中出现中文就会报错，比如中文注释

赞 +0

添加回复

PHPz2017-04-18 09:48:54 3楼

python 3版本已经将默认编码格式ASCII改了

赞 +0

添加回复

怪我咯2017-04-18 09:48:54 2楼

建议你看一看廖雪峰这篇关于字符串编码的教程，字符串和编码。看完就会知道 utf-8，unicode 之间联系。

赞 +0

添加回复

大家讲道理2017-04-18 09:48:54 1楼

保存文件时是否必要encode为utf-8

这个两种都可以，纯粹看你的希望以哪种编码存储文件，以及那种编码后续处理更方便。
只不过write unicode字符串时，最好使用codes.open来打开文件并设置编码。
源代码编码定义（# --coding:utf-8 --）的作用

告诉python编译器如何解码代码文件，但并不能保证文件的实际编码一定与之匹配。
实际文件的编码还是由编辑器决定的（有些编辑器可能会识别# --coding:utf-8 --，并进行相应的编码存储）。

举个例子，我的vim的fileencoding设置为utf-8，但py文件编码设置为ascii（-- coding:ascii --）。
这时我的py文件的实际编码为utf-8，但python编译器会按ascii来解析源文件，如果遇到非ascii字符就会抛异常:
SyntaxError: 'ascii' codec can't decode byte 0xe4 in position 5: ordinal not in range(128)

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>