Linux使用技巧7--GBK转成UTF-8

Windows系统中编辑的Java源码,在Linux下打开会出现中文乱码的情况。原因就是文件编码格式的问题,Windows下通常是GBK而Linux下是UTF-8。

在vim中用set fileencoding命令就可以看出编码格式,如下:

//linux下
fileencoding=utf-8
//windows下
fileencoding=latin1

最简单的办法就是在windows下将文件另存为utf8格式。那么在linux下我们可以使用iconv工具将其转换格式。

$ iconv --help
Usage: iconv [OPTION...] [FILE...]
Convert encoding of given files from one encoding to another.

 Input/Output format specification:
  -f, --from-code=NAME       encoding of original text
  -t, --to-code=NAME         encoding for output

 Information:
  -l, --list                 list all known coded character sets

 Output control:
  -c                         omit invalid characters from output
  -o, --output=FILE          output file
  -s, --silent               suppress warnings
      --verbose              print progress information

  -?, --help                 Give this help list
      --usage                Give a short usage message
  -V, --version              Print program version
$ iconv -f GBK -t UTF-8 test.java -o test2.java

转换完毕,中文乱码就不见了。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。