轉(zhuǎn)換文件的編碼方式
iconv命令 是用來(lái)轉(zhuǎn)換文件的編碼方式的,比如它可以將UTF8編碼的轉(zhuǎn)換成GB18030的編碼,反過(guò)來(lái)也行。JDK中也提供了類似的工具native2ascii。Linux下的iconv開(kāi)發(fā)庫(kù)包括iconv_open,iconv_close,iconv等C函數(shù),可以用來(lái)在C/C++程序中很方便的轉(zhuǎn)換字符編碼,這在抓取網(wǎng)頁(yè)的程序中很有用處,而iconv命令在調(diào)試此類程序時(shí)用得著。
iconv -f encoding [-t encoding] [inputfile]...
-f encoding :把字符從encoding編碼開(kāi)始轉(zhuǎn)換。
-t encoding :把字符轉(zhuǎn)換到encoding編碼。
-l :列出已知的編碼字符集合
-o file :指定輸出文件
-c :忽略輸出的非法字符
-s :禁止警告信息,但不是錯(cuò)誤信息
--verbose :顯示進(jìn)度信息
-f和-t所能指定的合法字符在-l選項(xiàng)的命令里面都列出來(lái)了。
列出當(dāng)前支持的字符編碼:?
iconv -l
將文件file1轉(zhuǎn)碼,轉(zhuǎn)后文件輸出到fil2中:?
iconv file1 -f EUC-JP-MS -t UTF-8 -o file2
這里,沒(méi)-o
那么會(huì)輸出到標(biāo)準(zhǔn)輸出。