文章转载自:
1、查看文件编码方式–file 文件名(但是不是很准确)
yang@mint-linux ~ $ file baidu.html
baidu.html: HTML document, UTF-8 Unicode text, with very long lines, with no line terminators
yang@mint-linux ~ $ file sina.html
sina.html: HTML document, ISO-8859 text, with very long lines, with CRLF, LF line terminators<br>
2、转换文件编码–iconv -f 源编码 -t 目标编码 源文件名 > 目标文件名
yang@mint-linux ~ $ file sina.html
sina.html: HTML document, ISO-8859 text, with very long lines, with CRLF, LF line terminators
yang@mint-linux ~ $ iconv -f gbk -t utf8 sina.html > sina_utf8.html
yang@mint-linux ~ $ file sina_utf8.html
sina_utf8.html: HTML document, UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators
3、转换文件名编码–convmv -f 源编码 -t 目标编码 文件名 --notext(如果不加–notext则只是显示结果,不实际转换)(这个也可以批量转换该文件夹下面的所有文件名)
yang@mint-linux ~ $ touch 中文.txt
yang@mint-linux ~ $ convmv -f utf-8 -t gbk 中文.txt --notest
Your Perl version has fleas #37757 #49830
mv "./中文.txt" "./����.txt"
Ready!
但是如果文件要一个个转换,有几千个文件需要转换呢,使用上面的方法2,也忒苦逼了!换一个工具吧!
1、简介
enca是Linux下的文件编码转换工具。
2、安装
3、使用方法
enca -L zh_CN file # 检查文件的编码
enca -L zh_CN -x UTF-8 file # 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x utf-8 * # 把文件夹下的所有文件转换为utf8编码
4、批量转换
目录转换报错不影响
find | grep -v '.svn' | xargs enca -L zh_CN -x UTF-8