不知道你們有沒有遇過在PTT上的文章
突然就出現一大堆莫名的
然後奇怪的是用瀏覽器看網頁的時候就消失了
要觸發這個奇怪的行為,首先必須用 utf-8 上PTT
可以用 ssh [email protected]
或是在登入的時候在 ID 結尾加一個逗號
但因為PTT本身使用的編碼依舊是 big5-uao
在把 utf-8 轉換成 big5-uao 時
如果遇到不存在於 big5-uao 的字時,會轉換成 FFFD
代表不合法的字
轉換表可以看這裡: https://moztw.org/docs/big5/
但PTT在輸出的時候,因為沒有任何合法的字是以 FF 開頭
所以會直接忽略 FF 這個 byte
這就造成如果有連續兩個不合法的字
FFFD FFFD 就會變成 FDFD
而 FDFD 剛好是「肏」
所以才會突然出現連續很多個不應該存在的肏
另一方面,PTT的網頁在輸出時
知道 FFFD 是完整的一個不合法字元
所以會一次忽略兩個 byte
因此就不會出現奇怪的字元
大家知道下面這段亂碼是什麼嗎
https://www.youtube.com/watch?v=4Y1JySThWD8