Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲?——圖形影像篇
https://bit.ly/3NDTPk7
近半年來,不論在網路上的搜尋量、新聞媒體熱度,抑或是研討會的主題,只要和
ChatGPT或「生成式AI」(AIGC: AI Generated Content自動生成)扯上關聯就有討論不
完的話題,這也連帶地牽動AI對未來產業的新興變革。2021年6月,OpenAI發表了一篇標
題為「Diffusion Models Beat GANs on Image Synthesis」(擴散模型在影像合成上打
敗對抗式生成網路)之論文,內容中的「Diffusion Model」(擴散模型)是自動生成文
句、圖像、音樂的要角,本文將先從擴散模型運用到文字生成圖像的整體架構,做簡單的
說明,然後論及目前所衍生著作權抄襲侵害方面的法律議題。
製作經營桌遊工作室 Incarnate Games的Jason Allen,2022年透過Midjourney創作了一
幅超逼真的圖像作品《太空歌劇院》(Théâtre D’opéra Spatial)畫作(見圖一),
在美國科羅拉多州博覽會的藝術競賽中,獲得數位藝術類別藍絲帶首獎。儘管該作品是由
AI創作,並非作者自己一筆一劃繪出,但是該作品饒富巴洛克風格,令人難以相信這是由
AI自動生成的畫作。
https://imgur.com/a/r22HS9u
圖一、Midjourney創作《Théâtre D’opéra Spatial》
來源:Jason Allen via Discord
一般來說,目前AIGC廣被應用的模型可分成兩大類,一種是藉由文字指令提示
(prompting) 就可生成圖像的AI模型,例如目前最為為熟知的Midjourney、Stable
Diffusion、DALL-E2或Google Brain;另一種則是藉由提示圖像來生成文字的AI模型,例
如CLIP(Contrastive Language-Image Pre-Training,這是一種對比學習,將圖像與文
字做連結後進行預訓練,待下一張新的圖像輸入至CLIP後,CLIP就能根據圖像中的情境去
「看圖說故事」)。
基本上,後者比較不會有爭論,因為要從圖像自動生成一段短文,基於其所進行之網路上
的文字接龍,在著作權法允許參考他人「概念」卻做出不同「文字表達」情況下,似可稀
鬆平常地用不同內容的一段話來表示,所以相對較不致有模仿或抄襲的爭論(參本刊之前
曾報導:AI聊天機器人ChatGPT引爆著作侵權疑雲?