我在這裡看到這篇文章(http://goo.gl/lYCk7r)
大意是說,有些big5中文字,轉換時 python 會報錯。
例如 在big5中是"恒"字
#python3.3.2
print(b'\xf9\xda'.decode('big5'))
#UnicodeDecodeError: 'big5' codec can't decode
byte 0xf9 in position 0: illegal multibyte sequence
文中有提到這個字可以用big5hkscs來解碼,還是有一些
字無法解。
因為我常要大量轉碼,其實遇到的這情況的機率比想像中
高,我也不想要直接 ignore。
我現在想到的是遇到exception 就再試試別的編碼,但是
這實在有點笨。
一般你們在處理這些字時,會怎麼做呢?
後記:再看到這篇https://goo.gl/BYnSHz我就崩潰了。
※ 編輯: ggirls (114.136.150.153), 07/01/2016 11:09:06
※ 編輯: ggirls (114.136.150.153), 07/01/2016 11:19:09