※ 引述《Aungk (菲依)》之銘言:
→ Aungk: 確定是s="b'abc\xe9\xa1\x9e'" 09/06 14:07
先把有的沒有的拿掉
stripped = s[2:-1] # 'abc\xe9\xa1\x9e'
encoded = stripped.encode('latin1') # b'abc\xe9\xa1\x9e'
result = encoded.decode('utf-8') # 'abc類'
關鍵在於 latin-1 是 lossless 的 8-bit encoding, 所以在實務上可以把一個
只包含 single-byte characters 的 Unicode 內容直接 map 到同樣 byte sequence
的 encoded data。這招很好用, 建議記起來。:P
相關討論:
https://www.ptt.cc/bbs/Python/M.1449994700.A.43C.html