热门关键字:  ubuntu  分区  函数  Fedora  linux系统进程

文件中文编码之间的转换

来源: 作者: 时间:2007-12-19 Tag: 点击:
   上次说到为了方便工作,在LINUX上使用了luit可以快的在Terminal中,在多个中文编码切换,但其实每次切换也是让自己不胜其烦,干脆把那些文件都转成utf-8编码好了,第一个反应就是使用python,以下是框架代码:


#!/usr/bin/python
#This script is for change the file
#encode from gb2312 to UTF-8
import codecs
import sys
if len(sys.argv[:])!=3:
    print "Usage:code.py gb2312_file utf-8_filename"
    sys.exit(1)
f_in=codecs.open(sys.argv[1],'r','gb2312')
f_out=codecs.open(sys.argv[2],'a','UTF-8')
for line in f_in:
    f_out.write(line)
f_in.close()
f_out.close()


其实也就是使用了codecs这个module,上面的编码稍微修改一下就可以进行多个文件的批量转换。
最新评论共有 4 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册
栏目列表