[問題] iconv轉編碼後遇到的問題

作者: mu1007 (小橘)   2017-07-13 07:58:46
各位前輩好,我是linux的門外漢><
因緣際會之下碰到linux這個神奇的系統
有一個不太明白的問題想向大家請教~
麻煩各位m(_ _)m
由於需要把一個有四千多萬筆資料的csv檔他的編碼從utf8轉成big5
後來發現linux底下有個叫做iconv的指令可以輕輕鬆鬆轉!!!
透過指令轉換並產生新的檔案之後
我用"file -i 檔名"觀看
發現轉出後的檔案出現"Charest=iso-8859-1
為什麼不是big5 QAQ?
作者: SeamusBerloz (軒摩斯)   2017-07-13 09:04:00
大五碼要儲存時的第一 byte (0xA0-0xFE) ,正好用 iso8859-1 是可以涵蓋的,換句話說,用 iso8859-1 只是儲存的一種手段,而不是真正用了這個來編碼。大五碼本來就是用了ascii沒使用的部分來編成的。一個中文用了兩個iso8858-1,所以只要儲存排列不要錯位,讀取者可以直接當作大五碼來看懂。
作者: mu1007 (小橘)   2017-07-13 12:57:00
了解了!謝謝!!!

Links booklink

Contact Us: admin [ a t ] ucptt.com