[問題] 一種網址轉換碼

作者: home0303 (Blue night)   2016-01-21 09:38:50
(若是和其他不同軟體互動之問題 請記得一併填寫)
軟體:
版本:
例如http://tw.websaru.com/display.php?action=search&word=%E5%BE%AE%E8%BB%9F
其實後面的 %E5%BE%AE%E8%BB%9F
在原本的網址上顯示是【微軟】
而且類似的查詢都會這樣 原本顯示為中文字
經過複製貼上後就變成這種有%符號的字碼
請問這是甚麼 轉換邏輯又是如何
謝謝
作者: soyoso (我是耀宗)   2016-01-21 10:30:00
可google iso-8859-1,是國際標準化的字符集
作者: POWERPC (PPC)   2016-01-21 10:48:00
那叫UTF-8,只要是UTF-8用在網址上,每個BYTE前都加上 %除了標準的英文字不加;空格也會(空格是20所以是%20,HEX值
作者: soyoso (我是耀宗)   2016-01-21 10:59:00
請問p大,那"微軟"轉為%E5%BE%AE%E8%BB%9F和UTF-8的編碼有一致嗎?因為用"微軟"轉為utf-8為http://imgur.com/s2TXpr4查了一下以http://codex.wiki/post/108593-677提供方式來測試,http://imgur.com/CL3eo8z 以strlen來判斷時中文字為使用三個bytes編碼,再以ord()函數轉以ascii值
作者: POWERPC (PPC)   2016-01-21 15:59:00
微:UTF16=5FAE;UTF8=E5 BE AE;BIG5=B74C軟:UTF16=8EDF;UTF8=E8 BB 9F;BIG5=B36E所以你的第1圖是UTF16碼,漢字使用UTF8表示,通常是3BYTES而CJK EXT-B,C,D,E的UTF8是用4BYTES表示的
作者: soyoso (我是耀宗)   2016-01-21 16:03:00
轉換上是否可查詢的地方
作者: POWERPC (PPC)   2016-01-21 16:09:00
找一下 Babel Pad程式來用就很強大了
作者: soyoso (我是耀宗)   2016-01-21 16:10:00
另外第1圖上面雖然寫的是轉UTF-8但確為是UTF16的意思嗎?
作者: POWERPC (PPC)   2016-01-21 16:18:00
是的,可能是設定上問題
作者: soyoso (我是耀宗)   2016-01-21 16:20:00
已下載,從轉換→utf代碼→統一碼轉換成utf-8代碼處轉換http://imgur.com/TfXeHiQp大的為正確,請原po忽略我的回覆
作者: home0303 (Blue night)   2016-01-21 17:19:00
感謝指教

Links booklink

Contact Us: admin [ a t ] ucptt.com