[問題] 中文寫進MSSQL變成亂碼

作者: ReTryx   2022-11-03 15:46:33
想請教各位高手們有沒有遇到如標題的問題過?google完也試過網路上的解法,都無法成
功。
以下是環境以及問題
我用pymssql 連 mssql, 在連線的時候一定要把charset 也寫進去,不然會出現錯誤,而
我charset 是用CP950
接著在insert中文進SQL後,在SQL裡面看會發現insert進去的都是亂碼。但如果用Python
再select 出來卻會是中文。
但如果是SQL裡面本來就是中文的資料,從Python select 出來就也會變成亂碼在Python
上,同樣的,用Python 寫進去變成亂碼的中文由其他語言讀出來也會是亂碼。
簡單來說就是Python寫進去的中文亂碼只能由Python 自己讀來才能解碼成中文。而本來
在DB裡就是中文的資料Python 讀出來就會變成亂碼。
我試過用encode and decode,但還是無解。請問有人成功試過從中文從Python寫進MSSQL
裡面不會變成亂碼的嗎?
感謝幫忙
程式碼
conn = pymssql.connect(server = '', user = '', password =
'', database = '', charset='CP950')
.
.
.
cur.execute(f"Insert into dbo.ABC values ('中文', '中文二', '中文三')")
conn.commit()
以上charset如果省略不填則無法連線
作者: tzouandy2818 (Naked Bear)   2022-11-03 16:21:00
會不會是你編解碼選錯格式
作者: surimodo (好吃棉花糖)   2022-11-03 16:31:00
把完整程式碼貼出來
作者: Hsins (翔)   2022-11-03 17:52:00
你忽略了很多情境的敘述,無法判斷是哪邊出問題。聽起來比較像是你原先已經在裡面的中文,跟你選用的字元集
作者: Schottky (順風相送)   2022-11-03 17:55:00
charset 改用 UTF-8 就沒問題了
作者: Hsins (翔)   2022-11-03 17:55:00
並不一致除此之外,你也要檢查一下編輯器的編碼
作者: Schottky (順風相送)   2022-11-03 19:00:00
會使用 CP950 我猜是用 CMD 命令提示字元
作者: ReTryx   2022-11-04 09:42:00
我是用Spyder IDE, 預設編碼是UTF-8charset如果改用UTF-8則也是無法連線所有東西都用預設,用C, js or vba寫中文進SQL就都沒問題就是python進SQL中文有問題,也讀不瞭上述語言寫進的中文
作者: lycantrope (阿寬)   2022-11-04 11:11:00
把varchar轉nvarchar?
作者: Hsins (翔)   2022-11-04 12:14:00
他有提到原本有存中文, 應該不是 varchar/nvarchar 的差異比較可能是 encode 和 decode 沒做好你嘗試的 encode 跟 decode 是怎麼操作的?
作者: Schottky (順風相送)   2022-11-04 13:54:00
什麼叫作 charset 設成 UTF-8 就無法連線如果你的中文是寫在檔案內,檔案本身是 UTF-8 編碼嗎
作者: ReTryx   2022-11-04 13:57:00
datatype已經是nvarchar了a = '中文'.encode('utf-8').decode('utf-8')Python檔案裏面本身是utf-8沒錯 # -*- coding: utf-8 -*-也試過把decode encode交叉互換成big5也都是不行
作者: Hsins (翔)   2022-11-04 14:22:00
實話說,你可能沒搞清楚 encode 跟 decode 在幹嘛,另外是上下文提供的不夠明確跟精準
作者: ReTryx   2022-11-04 14:26:00
我再來研究一下編碼 感謝各位~
作者: Schottky (順風相送)   2022-11-04 14:52:00
......你先把中文字串 print 出來看看是不是正確的
作者: ReTryx   2022-11-06 16:26:00
Python 中print 出來是正確的,但SQL裡跟用其他語言print出來是亂碼

Links booklink

Contact Us: admin [ a t ] ucptt.com