作者:
derekhsu (è¯éº—的天下無雙)
2022-11-14 15:59:29對岸那邊IDEA研究院中的封神榜團隊釋出了第一個以中文為基礎的SD模型:太乙,已經可以在 Huggingface上面取得,這是基於SD1.4模型重新訓練了中文語言模型以取代原本的英文編碼器,但鎖定了圖像產生器,在一億級的中文語料庫上跑了24個epoch
https://www.51cto.com/article/721869.html
另外一個中英文混合的模型則是同時fine-tune了語言編碼器以及圖像產生器。
這是他們的第一個 checkpoints 而且進行了開源,不過由於他們修改過編碼器的結構,所以模型不能直接丟進去 webui 裡面跑,團隊有提供修改版本以及修改辦法。
根據他們給的測試樣本來看,這個模型不但能理解白話文,更能理解文言文,像是唐詩,宋詞甚至駢文都沒有問題。
像是飛流直下三千尺:
http://i.imgur.com/owoindP.jpg
君不見黃河之水天上來
http://i.imgur.com/Tu3STnI.jpg
小橋流水人家(馬致遠) crossover 梵谷
http://i.imgur.com/pBdRDYX.jpg