如何在Linux中转换编码 Linux iconv字符集处理

P粉602998670

发布时间：2025-08-29 10:14:01

602人浏览过

来源于php中文网

原创

使用iconv命令可轻松转换Linux文件编码，基本语法为iconv -f 源编码 -t 目标编码输入文件 -o 输出文件，例如iconv -f GBK -t UTF-8 input.txt -o output.txt；可通过file或enca命令检测文件编码；批量转换可用find与xargs结合处理；遇“Invalid or incomplete multibyte or wide character”错误时可加-c选项忽略错误字符，或使用recode工具替代。

如何在linux中转换编码 linux iconv字符集处理

简而言之，在Linux中转换编码，你可以使用

iconv

命令。它是一个强大的字符集转换工具，可以帮你轻松搞定各种编码问题。

解决方案

iconv

命令的基本语法如下：

iconv -f 源编码 -t 目标编码 输入文件 -o 输出文件

```
-f 源编码
```
: 指定输入文件的编码格式。
```
-t 目标编码
```
: 指定输出文件的编码格式。
```
输入文件
```
: 你要转换编码的文件名。
```
-o 输出文件
```
: 转换后的文件名。

举个例子，假设你有一个名为

input.txt

的文件，它的编码是GBK，你想把它转换成UTF-8编码，并保存为

output.txt

，你可以这样操作：

iconv -f GBK -t UTF-8 input.txt -o output.txt

如果省略

-o 输出文件

，

iconv

会将转换后的内容输出到标准输出，你可以通过管道将其重定向到文件：

iconv -f GBK -t UTF-8 input.txt > output.txt

iconv

还支持一些其他的选项，比如

-c

，它可以忽略转换过程中的错误字符。这在处理一些包含非法字符的文件时非常有用。

iconv -f GBK -t UTF-8 -c input.txt -o output.txt

如果你想查看

iconv

支持的编码格式，可以使用

iconv -l

命令。它会列出所有支持的编码，但数量非常多，可能需要滚动屏幕才能看完。

如何确定文件的编码格式？

确定文件编码是个关键步骤。最常用的方法是使用

file

命令。例如：

file input.txt

file

命令会尝试猜测文件的编码，并输出类似

input.txt: UTF-8 Unicode text

的结果。但有时

file

命令的判断并不准确，特别是对于一些简单的文本文件。

这时，可以尝试使用

enca

命令。如果你的系统没有安装

enca

，需要先安装它：

sudo apt-get install enca  # Debian/Ubuntu
sudo yum install enca      # CentOS/RHEL

然后使用

enca

命令检测文件编码：

enca input.txt

enca

通常比

file

命令更准确，尤其是在处理中文编码时。

ClipDrop

Stability.AI出品的图片处理系列工具（背景移除、图片放大、打光）

下载

如何批量转换多个文件的编码？

如果需要批量转换多个文件的编码，可以使用

find

命令和

xargs

命令结合起来。例如，将当前目录下所有

.txt

文件的编码从GBK转换为UTF-8：

find . -name "*.txt" -print0 | xargs -0 -I {} bash -c 'iconv -f GBK -t UTF-8 "{}" -o "utf8_{}"'

这个命令会找到所有

.txt

文件，然后使用

iconv

命令将它们转换为UTF-8编码，并将转换后的文件保存为

utf8_原文件名

。注意，这个命令会直接修改文件名，请务必备份重要文件。

稍微解释一下这个命令：

```
find . -name "*.txt" -print0
```
: 查找当前目录下所有
```
.txt
```
文件，并使用null字符分隔文件名。
```
xargs -0 -I {} bash -c '...'
```
: 将
```
find
```
命令的结果传递给
```
bash
```
命令执行。
```
-0
```
选项表示使用null字符分隔文件名，
```
-I {}
```
表示将每个文件名替换到
```
{}
```
的位置。
```
iconv -f GBK -t UTF-8 "{}" -o "utf8_{}"
```
: 实际的编码转换命令。

遇到“Invalid or incomplete multibyte or wide character”错误怎么办？

在使用

iconv

转换编码时，有时会遇到“Invalid or incomplete multibyte or wide character”错误。这通常表示文件中包含一些无法识别的字符。

解决这个问题的方法之一是使用

-c

选项忽略错误字符：

iconv -f GBK -t UTF-8 -c input.txt -o output.txt

另一种方法是使用

recode

命令。

recode

是一个比

iconv

更强大的编码转换工具，它可以处理更复杂的编码问题。如果你的系统没有安装

recode

，需要先安装它：

sudo apt-get install recode  # Debian/Ubuntu
sudo yum install recode      # CentOS/RHEL

然后使用

recode

命令转换编码：

recode gbk..utf8 input.txt

recode

命令会直接修改原文件，请务必备份重要文件。

如果以上方法都无法解决问题，可能需要手动检查文件，找出并修复错误的字符。这通常需要一些文本编辑器的帮助，比如

vim

或

emacs

。

Linux 服务器内存使用率一直涨但 free -h 看到大量 available 怎么回事

Linux 出现大量 TIME_WAIT 如何判断是否真的有问题及优化参数

Linux 内核 panic 后如何从 vmcore 里提取关键调用栈信息

Linux 服务器 /dev/shm 被塞满导致数据库或 Java 进程崩溃

Linux 内核参数 vm.swappiness=10 后 swap 还是频繁使用的业务场景

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

231

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

436

2024.03.01

点击input框没有光标怎么办

点击input框没有光标的解决办法：1、确认输入框焦点；2、清除浏览器缓存；3、更新浏览器；4、使用JavaScript；5、检查硬件设备；6、检查输入框属性；7、调试JavaScript代码；8、检查页面其他元素；9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

182

2023.11.24

vim保存退出命令

vim是一个非常强大的文本编辑器，常用于Unix和Linux系统。它是从vi发展而来的，相比vi有许多改进和扩展。在vim中，保存并退出的命令是：wq"wq"这个命令是由两个部分组成的。其中，"w"表示写入文件，将所做的更改保存到磁盘;而"q"表示退出vim编辑器。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

266

2023.08.01

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1349

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

702

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

294

2023.06.30