Linux下批量轉(zhuǎn)換GBK文件到UTF-8編碼方法
查看文件編碼
file -i filename
1.遞歸轉(zhuǎn)換(包括子文件夾)
find default -type d -exec mkdir -p utf/{} \;
find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} \;
這兩行命令將default目錄下的文件由GBK編碼轉(zhuǎn)換為UTF-8編碼,目錄結(jié)構(gòu)不變,轉(zhuǎn)碼后的文件保存在utf/default目錄下。
2.轉(zhuǎn)換
命令格式如下
$enca -L 當(dāng)前語(yǔ)言 -x 目標(biāo)編碼 文件名
例如要把當(dāng)前目錄下的所有文件都轉(zhuǎn)成utf-8
$enca -L zh_CN -x utf-8 *
linux命令行bash下,使用iconv轉(zhuǎn)換UTF-8編碼到gb2312的時(shí)候遇到問(wèn)題: iconv: 未知 xx 處的非法輸入序列
在iconv中加入 -c 選項(xiàng),忽略無(wú)效的字符,竟然成功了。
/*--------------------------------我是分割線--------------------------------*/
以上參考http://hi.baidu.com/maleung/blog/item/a75403ed6ea19fd8b21cb1db.html
-----------------------------------------------------------------
這里還可以像php里一樣,參數(shù)中加入//IGNOR,如下
iconv -f gbk//IGNORE -t utf8//IGNORE hufu.csv> hufu-utf8.csv
也可以正常執(zhí)行
聯(lián)系客服