如何转换文本编码 iconv工具

P粉602998670

发布时间：2025-08-11 14:37:02

705人浏览过

来源于php中文网

原创

iconv 是一个用于转换文本文件字符编码的命令行工具，支持多种编码格式间的转换。1. 使用 iconv -l 可列出所有支持的编码格式，如 utf-8、gbk、gb2312 等。2. 将 gbk 编码文件转为 utf-8 的命令为 iconv -f gbk -t utf-8 input.txt -o output.txt。3. 若仅需预览转换内容，可省略 -o 参数直接在终端输出。4. 批量转换多个文件可通过 shell 脚本实现，例如 for file in *.txt; do iconv -f gbk -t utf-8 "$file" -o "utf8_$file"; done。5. 添加 -c 参数可忽略无法转换的字符，防止转换中断。6. 如需添加 bom，可使用 utf-8-bom 编码目标，但应谨慎使用，因其非标准 utf-8 规范。使用时需准确识别源编码，建议通过 file -i 或 enca 工具检测，转换前备份原文件，注意换行符差异及编码兼容性问题，并可通过管道与其他命令结合处理数据，最终应验证输出结果以避免乱码。

如何转换文本编码 iconv工具

在处理文本文件时，经常会遇到编码不一致的问题，比如从 GBK 转为 UTF-8，或者反过来。

iconv

是一个非常实用的命令行工具，专门用于转换文本文件的字符编码，广泛存在于 Linux、macOS 以及部分 Windows 环境（如 Cygwin、WSL）中。

什么是 iconv

iconv

（全称：internationalization conversion）是一个标准的字符集转换工具，支持多种编码格式之间的转换。它可以从一种编码读取文本，然后输出为另一种编码，适用于处理网页、配置文件、日志等文本内容。

基本语法

iconv -f FROM_ENCODING -t TO_ENCODING [OPTION] FILE

```
-f
```
或
```
--from-code
```
：指定源编码
```
-t
```
或
```
--to-code
```
：指定目标编码
```
FILE
```
：要转换的文件名，不指定则从标准输入读取
```
-o FILE
```
：指定输出文件
```
-l
```
：列出所有支持的编码

常用操作示例

1. 查看支持的编码格式

iconv -l

这会列出所有 iconv 支持的编码，例如 UTF-8、GBK、GB2312、BIG5、ISO-8859-1、ASCII 等。

2. 将 GBK 编码文件转为 UTF-8

iconv -f GBK -t UTF-8 input.txt -o output.txt

这个命令会把

input.txt

从 GBK 编码转换为 UTF-8，并保存为

output.txt

。

3. 转换并查看内容（不保存）

iconv -f GBK -t UTF-8 input.txt

直接在终端输出转换后的内容，适合预览或调试。

4. 批量转换多个文件

可以结合 shell 脚本批量处理：

for file in *.txt; do
    iconv -f GBK -t UTF-8 "$file" -o "utf8_$file"
done

将当前目录下所有

.txt

文件从 GBK 转为 UTF-8，并加上

utf8_

前缀。

PaperFake

AI写论文

下载

5. 忽略转换错误（防止中断）

如果文本中包含无法转换的字符，可以加

-c

参数忽略这些字符：

iconv -f GBK -t UTF-8 -c input.txt -o output.txt

这会跳过非法或无法识别的字符，避免转换失败。

6. 添加 BOM（谨慎使用）

某些程序（如 Windows 记事本）需要 UTF-8 with BOM 才能正确识别编码。但标准 UTF-8 不带 BOM。若必须添加，可使用：

iconv -f GBK -t UTF-8-BOM input.txt -o output.txt

注意：UTF-8-BOM 并非通用标准，建议仅在必要时使用。

实际使用中的注意事项

确认原始编码：错误指定
```
-f
```
编码会导致乱码。可用
```
file -i filename
```
或
```
enca
```
工具初步判断编码。
备份原文件：转换前建议备份，避免覆盖原始数据。
换行符问题：
```
iconv
```
不处理换行符（CR/LF），跨平台使用时可能需额外处理（可用
```
dos2unix
```
或
```
unix2dos
```
）。
部分编码不兼容：如从 UTF-8 转到 ASCII 时，中文字符会被丢弃或替换，需确保目标编码支持所需字符。

小技巧：通过管道与其他命令配合

cat messy.txt | iconv -f GBK -t UTF-8 | grep "关键字"

可以在不生成中间文件的情况下，对转换后的内容进行搜索或处理。

基本上就这些。

iconv

虽然简单，但在处理中文编码问题时非常可靠，是系统管理员和开发人员日常必备的小工具之一。只要注意编码识别准确，操作起来并不复杂，但容易忽略细节导致乱码，使用时多验证输出结果即可。

Linux 数据库日志分析方法

Linux系统下利用Dmesg查看进程被内核OOM杀掉的记录

Linux时间回退异常_NTP同步故障分析

Linux文件传输方法_scp与rsync对比

Linux日志集中收集_ELK架构实践

相关标签:

linux windows 工具 macos cos for bom input ASCII windows macos linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何同步Linux目录 rsync增量备份实战下一篇：如何生成随机密码 openssl随机

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

点击input框没有光标怎么办

点击input框没有光标的解决办法：1、确认输入框焦点；2、清除浏览器缓存；3、更新浏览器；4、使用JavaScript；5、检查硬件设备；6、检查输入框属性；7、调试JavaScript代码；8、检查页面其他元素；9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

197

2023.11.24

常见的编码方式

常见的编码方式有ASCII编码、Unicode编码、UTF-8编码、UTF-16编码、GBK编码等。想了解更多编码方式相关内容，可以阅读本专题下面的文章。

648

2023.10.24

a和A对应的ASCII码数值

a的ascii码是65，a的ascii码是97；ascii码表中，一个字母的大小写数值相差32，一般知道大写字母的ascii码数值，其对应的小写字母的ascii码数值就算出来了，是大写字母的ascii码数值“+32”。想了解更多相关的内容，可阅读本专题下面的相关文章。

2259

2024.10.24

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1517

2023.07.26