戰程序判決吞敗
原文網址:
https://bit.ly/4c7EVwI
原文:
自ChatGPT崛起造就AIGC (AI Generated Content)的百花齊放,導致許多新創公司站在AI
浪尖上聲名大噪,像Midjourney和Stability AI推出的穩定擴散(Stable Diffusion)圖像
生成(還有OpenAI的DALL-E),可讓使用者以文生圖、以圖生圖,自動產生媲美專業畫家
的圖像,讓Midjourney夯到不行,是目前業界頂尖的龍頭代表。
但也正因太火而產生智財爭議訴訟,美國三位藝術家對Stability AI、DeviantArt和
Midjourney所開發之生成式AI工具,於2023年1月向北加州聯邦地院提告著作侵權 [1],
而各被告都提出駁回原告起訴之動議(motion to dismiss,被告於案發初始階段,主動
要求法院直接駁回起訴,目的在省卻曠日費時之冗長程序,如成功即可提早終結官司),
業經法院於2023年10月底,做成中間判決性質之程序裁定。本刊前已介紹Stability AI和
DeviantArt部分,本文續對Midjourney進行分析。
本案涉及之Midjourney產品
Midjourney公司總部位於舊金山,其於2022年7月推出的Midjourney產品,初期以測試版
形式問世隨後轉型為商業產品。Midjourney的AI工具能根據文本提示(prompt)生成專業水
準的圖像。起初是在Discord社群建立機器人,隨後快速轉向商業應用,短短半年內吸引
超過千萬付費註冊帳戶,成為引人矚目年營收達1億美元的企業(但這家傳奇性的公司正
式員工僅11人)。
原告聲稱,Midjourney產品是一款線上AI圖像生成器,透過不同迭代版本使用穩定擴散技
術,根據文本提示生成圖像。目前版本是在圖像子集上使用穩定擴散進行訓練,該圖像產
生器以文本提示輸入,生成數位圖像輸出,係完全依賴穩定擴散作為其生成圖像的基礎軟
體引擎,再向網路聊天系統Discord的線上使用者及透過應用程式之提供來收費。
Midjourney的執行長曾表示,該公司使用大型開放數據集,已「暗示」使用LAION數據集
進行訓練,2022年8月Midjourney發布使用穩定擴散之測試版。
本案涉及之擴散技術原理
原告起訴狀指出,「擴散」(diffusion)是一種特定機器學習應用的模型技術,以軟體生
成與訓練數據中圖像相似之輸出圖像,該模型存儲訓練數據集中每個項目的壓縮副本。此
擴散技術係由史丹佛大學Jascha Sohl-Dickstein領導的一組研究人員於2015年發明,並
在其論文中介紹「使用非平衡熱力學(Nonequilibrium Thermodynamics)的深度非監督式
學習 (Deep Unsupervised Learning)」,該技術可應用於任何類型的數據,但該論文是
集中在數位圖像之應用。
擴散分二個階段進行,第一階段是攝取圖像,並透過系列步驟逐漸向其添加更多雜訊(
noise即噪聲,指看到的而非聽到的東西,係混亂和無結構的隨機波動(random
fluctuations)),在每個步驟中,程式會添加噪聲(addition of noise,即「加噪」)
來改變圖像;到最後一步驟,圖像已經「擴散」成本質上隨機式的噪聲(random noise)。
第二階段與第一階段相似但次序相反,透過眾多步驟將特定圖像變成噪聲的過程後再回溯
運行,亦即,將隨機噪聲以相反順序應用這些步驟,隨著逐漸去除噪聲數據(denoises,
即「去噪」),程式最終還原重新組合成該原來之圖像。起訴狀中摘自Sohl-Dickstein論
文,使用螺旋圖像作為訓練數據說明擴散過程的二個階段如下圖。
https://imgur.com/a/9c0cd79
第一行(藍色螺旋)從左到右讀取,描繪擴散第一階段,噪音逐漸添加到螺旋圖像中(其
未顯示當中的每個步驟)。中間的圖像顯示擴散過程中途的螺旋,最右邊的圖像顯示擴散
過程結束- - 螺旋變成一隨機噪聲場域。
第二行(紅色螺旋)從右到左讀取顯示相反過程:隨機噪聲(最右邊的圖像)逐漸取消擴
散,透過反轉第一階段學習步驟的次序來「去噪」。中間的圖像顯示中途點(halfway
point)的去噪過程,第二行最左邊的圖像,顯示去噪過程的最終結果:原始螺旋再次回復
出現。
原告指控被告之AI生成工具,即以上述運作方式複製其著作權圖像來自動生成侵權圖像。
原告對Midjourney直接侵權之指控
原告指控:Midjourney的訂閱者可透過造訪其Web應用程式,然而問題在於,它是依賴盜
用藝術家創作之數百萬張圖像,並將這些圖像用作訓練圖像,因此是從他人受著作權保護
的作品中,重新混合組裝和拼貼產生侵權圖像。當被問及Midjourney如何使用數據集時,
Midjourney的執行長僅回答:「這是網路上的一個大規模掃描,我們使用已發布的開放數
據集進行訓練。」
原告針對Midjourney的直接侵權理論為:
(1) 透過抓取(即複製)受保護的作品,用於為Midjourney產品訓練圖像所製作出圖像,
而構成直接侵權;
(2) 透過發行包含訓練圖像壓縮副本的穩定擴散,作為Midjourney產品的一部分而構成直
接侵權;
(3) 透過製作和發行Midjourney產品而構成直接侵權,該Midjourney產品本身就是侵權之
衍生作品;
(4) 生成並發行屬於侵權衍生作品的輸出圖像。
針對原告指控Midjourney工具訓練數據集用來輸出圖像,包含接受訓練之受著作權保護作
品的壓縮副本,但Midjourney反駁這是不合理而難以置信的,因為50億張圖像龐大,不可
能被壓縮到一個可執行的程式。針對第一個理論,與關於同案被告Stability AI在LAION
中的角色,以及Stability AI抓取然後在穩定擴散中,使用訓練圖像做聯繫的詳細指控不
同請參本刊:美國畫家控告Stability AI生成式AI工具著作侵權之程序判決出爐,原告對
於Midjourney為其品進行哪些訓練,竟然並無任何事實之陳述。唯一提及的是Midjourney
首席執行官的評論,即Midjourney是使用開放數據集(原告假設這些數據集來自LAION)
,並且在這些數據集上進行訓練。然而,原告宣稱Midjourney所使用穩定擴散之方式,如
:「穩定擴散已在多個程式中被用作軟體庫(software library),包括Midjourney產品」
;「作品是指用於訓練任何穩定擴散版本的任何圖像,該圖像由被告直接提供或合併到另
一個產品中」云云。
北加州地院對直接侵權之程序裁定
但法院認為以上說法,就原告究竟是基於Midjourney使用穩定擴散,還是基於Midjourney
自己獨立使用訓練圖像來訓練產品,還是二者兼而有之?其主張都太含混不明需要澄清。
因此,法院認為原告對Midjourney的直接侵權指控不夠清楚,原告也未提供事實說明
Midjourney對其AI平台進行哪些訓練,因此在缺乏事實的情況下,法院無法確定
Midjourney是否不當使用原告受著作權保護的圖像。另外,原告對Midjourney的衍生作品
責任理論也有缺陷,原因與法院在討論DeviantArt案時所指出的原因相同請參本刊:美國
畫家控告DeviantArt生成式AI著作侵權首輪程序判決被告占上風。據此,法院核准
Midjourney所聲請駁回直接侵權的動議,但允許原告可予以修改(with leave to amend)
。
法院進而表示,原告除應添加被告產品使用受著作權保護之壓縮副本的事實外,
Midjourney將來可能會對直接侵權主張進行更針對性的攻擊。例如,不清楚的是,穩定擴
散是否僅包括可應用於建立圖像的演算法和指令,而這些圖像只含有受著作權保護之訓練
圖像的一小部分元素(a few elements);當Midjourney僅透過其應用程式和網站,將穩定
擴散作為「文庫」(library)提供客戶使用時,其為何需要負直接侵權之責?凡此種種法
院都認為不確定。然而,法院並未完全排除原告可辯護這一指控的可能性,特別指出原告
如能合理地主張,被告的AI產品可讓使用者,透過引用原告姓名的作品來創作新作品,以
及原告受保護的內容究竟係如何、以及有多少留在穩定擴散中被AI最終產品所使用的,則
其立論可能會更堅強。
原告對Midjourney代理侵權之指控
原告指控,使用者透過被告AI圖像工具,輸入原告姓名後就會產生冒充藝術家原作的圖像
,這些使用者可謂是「冒名頂替者」,而其依賴藝術家的原作品,輸入含有特定藝術家姓
名的提示回應,所產生的冒充圖像就是「偽造品」。因此,被告應知悉其AI工具的功能容
易用來生成偽造品。冒名頂替者出售偽造品使原告因受損,因而被告從AI工具中,直接或
間接地從冒名頂替者的侵權行為中獲利,故其應對第三者的侵權行為,承擔代理侵權
(vicarious infringement)責任。
但法院認為,法律上要對代理侵權行為負著作侵權責任,原告必須指控被告(1)擁有監
督侵權行為的權利和能力(right and ability to supervise),以及(2)在侵權活動中
獲具有直接的經濟利益。參Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d
788, 802 (9th Cir. 2007)。但問題在於,本案原告針對三位被告之起訴,無分軒輊地將
其看成一體、籠統指控其全都構成代理侵權,但具體上哪個被告基於第三人的何種行為,
得以構成代理侵權卻並未明確指出,且其起訴狀中對不同被告間無區別的指控,常將三位
被告混為一談,難以釐清每個被告究竟誰實際從事何項確切行為,導致法律上可造成間接
侵害,完全混淆不明。
Midjourney因而抗辯,原告指控其代理責任之主張應被駁回,因為依Sound & Color,
LLC v. Smith案例,No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal.
Feb. 28, 2023),被告不能對自己的直接侵權,承擔間接侵權中之次級責任(secondary
liability)。因而,當使用被告的生成式AI產品構成侵權時,只有在對每個被告提出的直
接侵權主張充分表達後,法院才能確定,原告是試圖讓被告對自己的直接侵權承擔次級侵
權之代理責任,還是讓被告對他人使用其產品的直接侵權來負間接侵權之責,凡此,原告
之主張都含糊不清應被駁回。
北加州地院對代理侵權之程序裁定
法院認為,原告基於「冒名頂替者」使用被告工具產生「偽造品」的代理侵權主張,還存
有其他重要問題。因原告的訴狀中未能指控,被告以原告作品製作出基於該作品實際存在
的「偽造品」為何。反之,原告自己起訴狀中還承認:「根據擴散過程的運作原理,一般
而言,對於特定文本指令提示所回應產生由穩定擴散輸出的圖像,不太可能與訓練數據中
的任何特定圖像相匹配而近似(close match)」。亦即原告無法舉出被告AI工具,能生成
任何「實際上」與其構成相同或近似的「偽造品。可見得,原告已不依賴具體作品之實質
相似理論,只能轉而攻擊所有輸出圖像都是衍生侵權作品,然後再補充指控:被告輸出圖
像與原告畫作的「風格」(in the styles)或藝術認同(artistic identities)相似關於風
格相似是否侵權請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑
雲?