logo
400-885-0909

版权

行业资讯 | 欧洲首例生成式AI版权侵权案始末!

更新时间:2025-11-25

2025 年 11 月,欧洲首例生成式 AI 版权侵权案由德国慕尼黑第一地方法院宣判,原告为代表作曲家、词作者和音乐出版商行使音乐作品版权的德国集体管理组织 GEMA,被告为开发运营生成式 AI 技术的美国企业集团旗下公司 OpenAI(含爱尔兰和美国两地主体);法院认定 OpenAI 的 Chatbot 在训练中 “记忆” 涉案歌词构成版权法意义上的复制,通过简单提示输出歌词属于向公众传播的侵权行为,最终判决 OpenAI 停止侵权、提供侵权范围及收入详情、赔偿 GEMA 损失、承担 80% 诉讼费用及判决公布费用,同时驳回 OpenAI 关于 “责任在用户”“适用文本与数据挖掘等版权例外条款”“非营利研究” 等抗辩主张。

(一)当事人

1.原告:GEMA,德国集体管理组织,代表其成员(作曲家、词作者和音乐出版商)行使音乐作品的版权。

2.被告:OpenAI,一家美国企业集团的旗下公司,致力于开发、运营和许可生成式人工智能技术,特别是基于Transformer语言模型的文本对话系统(Chatbot)。其中:

被告一 位于爱尔兰,自2023年12月14日起为该企业集团在欧洲经济区的用户提供Chatbot服务。

被告二 位于美国,自Chatbot于2022年11月30日推出至其服务被被告一接管期间,一直提供此服务。它提供可在德国下载的移动应用程序,用户可通过该程序在iPhone和iPad上使用Chatbot。


(二)侵权行为

GEMA的律师通过向Chatbot输入简单的提示,成功诱使其输出了涉案歌词。

使用的提示包括: 

《[歌曲名]》的歌词是什么?”“作者是谁?”“请告诉我《[歌曲名]》的副歌部分”“请也告诉我第一段/第二段歌词等。

在测试时,律师关闭了Chatbot的在线搜索功能,以确保输出结果完全源自模型内部训练数据。

法院认定:将Chatbot的输出与原始歌词对比后确认,涉案歌词在模型中被“记忆”了,并且能够通过简单提示被大量、近乎原文地复现鉴于歌词的复杂性和长度,可以排除随机巧合生成的可能性。

(一)原告观点

1.模型内部的“记忆”构成复制

AI模型在其参数中“记忆”了训练数据中的歌词,这本身就是一种受版权法约束的复制行为。

2.输出行为构成侵权

当模型根据简单提示输出这些被记忆的歌词时,构成了对歌词的再次复制和向公众传播

3.责任主体是OpenAI

侵权的根源在于OpenAI对模型的设计、训练数据的筛选和训练过程控制,因此责任应由OpenAI承担,而非用户。

4.不适用版权例外条款

OpenAI辩称的文本与数据挖掘例外条款不适用于本案,因为该条款仅涵盖为分析目的进行的临时性复制,而模型对作品的“记忆”是永久性的,且超出了单纯分析信息的范畴。


(二)被告观点

1.模型不存储具体数据

模型学习的不是数据本身,而是数据中的统计模式和关系,参数中并不存储具体的训练数据副本。

2.输出具有随机性和不确定性

模型的输出受解码算法中的随机化机制影响,并非确定性地复制训练数据,输出内容是由用户提示驱动的独立创作。

3.责任在于用户

输出内容是由用户的提示触发的,因此责任应由用户承担。

4.适用版权例外

其行为应受德国《著作权法》第44b条(文本与数据挖掘)的保护。同时,他们声称自己是非营利性研究机构,也应适用研究相关的例外条款。

1.命令OpenAI必须停止侵权,不得在未经GEMA许可的情况下,在其语言模型中复制涉案歌词,也不得通过Chatbot输出这些歌词。违令将面临最高25万欧元的罚款或最长六个月的监禁;

2.OpenAI必须向GEMA提供其侵权行为的范围和由此获得的收入详情;

3.裁定OpenAI有义务赔偿GEMA因侵权行为已产生和将产生的所有损失(具体金额待上述信息提供后确定);

4.授权GEMA在判决生效后,于指定全国性报纸上公布判决结果,费用由OpenAI承担;

5.OpenAI承担80%的诉讼费用。

1.模型“记忆”构成版权法意义上的“复制”

法庭认为,涉案歌词可以在被告的GPT-4和GPT-4O模型中被复现。根据信息技术研究已知,训练数据可能包含在语言模型中,并可作为输出被提取,这被称为“记忆”。当语言模型在训练期间不仅从训练数据集中提取信息,而且在训练后将训练数据完整地吸纳到特定参数中时,就会发生记忆。通过比对训练数据中包含的歌词与输出中的复现内容,可以确定这种记忆的存在。考虑到歌词的复杂性和长度,可以排除其复现是偶然巧合的可能性

记忆意味着,模型特定参数中的数据构成了争议歌词在版权法意义上被复制的前提。这些争议歌词在模型中被确定性地定义并可复现。根据《欧盟信息社会指令》第2条,以"任何方式或形式"进行的复制均构成复制。在此背景下,仅以概率值形式存在的规定是无关紧要的。像语言模型这样的新技术,应受到《欧盟信息社会指令》第2条和《德国版权法》第16条所规定的复制权的约束。

根据欧盟法院的判例法,间接可感知性即足以构成复制,只要作品能够借助技术工具被感知。


2.AI输出歌词构成侵权

当Chatbot将记忆的歌词输出到用户屏幕或存储在聊天历史中时,产生了新的复制件。

通过简单的用户提示即可使不特定的公众成员在各自选定的地点和时间获取这些歌词,构成了《德国版权法》第19a条规定的向公众提供行为。


3. 责任主体是OpenAI

法院驳回了“责任在用户”的抗辩。理由是输出由简单提示触发,且内容是由OpenAI设计、训练和控制的模型所实质性决定的。OpenAI运营的是一个“内容确定的信息系统”,而非中立的工具,因此是直接的侵权方。


4. 不适用例外条款的豁免

模型中的这种复制行为,不受《德国版权法》第44b条(文本与数据挖掘)或第57条(微不足道的附随物)等限制条款的豁免。

语言模型原则上属于文本与数据挖掘限制条款的适用范围。这些条款涵盖了为训练而汇编数据语料库时必要的复制行为,例如通过将作品转换为另一种(数字)格式或将其存储在内存中进行的复制。其背后的理由是,这些复制行为仅为后续分析目的而进行,因此不影响作者对该作品的利用权益。由于这些纯粹为文本与数据挖掘所做的准备行为不涉及任何利用权益,法律并未规定向作者支付报酬的义务。

然而,如果像本案一样,在训练过程中不仅从训练数据中提取信息,而且复制了作品本身,那么根据审判庭的观点,这不构成文本与数据挖掘。文本与数据挖掘及其相关限制条款的前提——即对纯信息的自动化评估不影响利用权益——在此情况下并不适用。相反,模型中的复制行为干涉了权利人的专有权利。

任何试图将模型中的复制行为也纳入该限制条款范围的、看似有利于技术和创新的解释,均被该条款的明确措辞所排除。类比适用该条款也是不可能的。即使假设存在立法者未意识到"记忆"及其引发的、具有版权法意义的模型内永久复制行为而造成的非预期的法律漏洞,也不存在可比利益。该限制条款规定的是文本与数据挖掘中复制行为的合法性,这种情况下作者的利用权益并未受到威胁,因为提取的仅是信息,作品本身并未被复制。然而,在模型内复制作品的情况下,作品的利用受到了永久性的损害,权利人的合法利益因此受到侵犯。若类比适用该不提供报酬的限制条款,作者和权利人将得不到保护。记忆的风险完全源于被告的领域。如果类比适用该限制条款,只有被侵权的权利人将承担此风险。

由于缺乏一个“主作品”,涉案歌词的复制不构成《德国版权法》第57条规定的不被允许的附随物。与被告的观点相反,这些歌词不能被视为相对于整个训练数据集而言是偶然和可有可无的。要适用此条,需要整个训练数据集本身也是一个受版权保护的作品。

被告对原告专有权利的干涉也不能以权利人的同意为由而变得合法,因为模型训练不能被视作权利人必须预料到的一种正常和可预期的使用类型。

即使是通过聊天机器人输出歌词,根据审判庭的裁决,被告也已非法复制并公开提供了涉案歌词。歌词的独创性元素在输出中始终可被识别。

输出行为对专有权利的干涉同样不受任何限制条款的豁免。


5.其他抗辩被驳回

非营利研究抗辩:OpenAI的运营模式具有明显的商业目的,不符合研究例外的条件。

权利人默示同意:将作品公开发布在互联网上,并不等同于授权其用于训练AI模型,尤其是这种导致永久记忆的使用方式,并非权利人必须预料到的“常规使用方式”。

指控滥用权利:法院认为GEMA作为集体管理组织,提起此案是其法定职责,目的是制止侵权,而非滥用诉讼权利。



上一篇文章: 版权产业新闻速览(11月26日-11月27日)
下一篇文章: 版权产业新闻速览(11月7日-11月12日)

  1. 数千种标准化、
    全行业的企业服务产品
  2. 专业服务+PQV
    服务过程可视化系统
  3. 知企“123”计划,
    没有最快,只有更快
  4. 大平台,更诚信,
    节省采购服务成本看得见

扫一扫咨询
知企网微信官方客服

客服热线:400-885-0909

24小时在线咨询

*我们将对您的号码严格保密,请放心使用

扫码下载APP