※ 引述《blc (Anemos)》之銘言:
: 請問一下,最近在試fbchat時,有個unicode變數一直print出亂碼,
: 用repr印出來長這樣:
: u'\xe7\x9c\x8b\xe6\x9c\x89\xe6\xb2\x92\xe6\x9c\x89\xe8\xa3\x9dlzma'
: 看起來像是把str的內容塞進unicode了(明明只有json.loads()),
: 請問該怎麼把它的內容轉成正常的unicode印出來呢?
我又來了……
這次的unicode變數長這樣:
u'\u0107\x98\u017b\u013a\x95\x8a'
內容是utf-8的'是啊',但看起來就是某幾個unicode字元變成utf-8字串了。
直接給 .encode('iso-8859-1','ignore') 的話\u部份的就被省掉了……
如果是純字串的'是啊'會是下面的樣子:
'\xe6\x98\xaf\xe5\x95\x8a'
純unicode的話是:
u'\u662f\u554a'
請問這要怎麼解?