在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

时间：2016-07-02 00:17:22 阅读：211 评论：0 收藏：0 [点我收藏+]

标签：

iconv命令是运行于linux/unix平台的文件编码装换工具。当我们在linux/unix系统shell查看文本文件时，常常会发现文件的中文是乱码的，这是由于文本文件的编码与当前操作系统设置的编码不同而引起的，这时可以使用iconv进行编码转换，从而解决乱码问题。

解决文本文件乱码问题分3步：1.确定文件编码,2.确定iconv是否支持此编码的转换,3.确定Linux/Unix操作系统编码,4.转换文件编码为与系统编码一致；下面通过对test.txt文件来举例。

1、使用file命令来确定文件编码：
$ file -bi gbk.txt | sed -e ‘s/.*[ ]charset=//‘ |tr ‘[a-z]‘ ‘[A-Z‘
ISO-8859-1
可见test.txt文件编码为ISO-8859-1编码。
2、使用iconv -l确定iconv是否支持此种编码的转换：
$ iconv -l | grep ISO-8859-1
ISO-8859-1//
ISO-8859-10//
ISO-8859-11//
ISO-8859-13//
ISO-8859-14//
ISO-8859-15//
ISO-8859-16//
3、确定Linux/Unix操作系统编码：
$ echo $LANG
zh_CN.UTF-8
当前操作系统坏境编码为"UTF-8"
4、转换编码
$ iconv -f ISO-8859-1 -t UTF-8 test.txt
测试
注：由于file命令常常会误判编码，如发现转换出来的编码依然是乱码，可将iconv -f的输入编码换成其他常用编码试试: GBK、BIG5、HZ、GB2312、GB18030、ASCII
iconv命令的详细语法:
iconv [选项..] 文件
选项：
-f 输入编码
-t 输出编码
-l 列出所有已知的编码
-o 输出文件

在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

标签：

原文地址：http://www.cnblogs.com/dingn/p/5634441.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行