媒体与版权案例集锦

刘海明 · 发表于 2024-1-25 15:29:47

【案例】

胡泳丨《纽约时报》诉OpenAI和微软：人工智能与版权的分水岭

胡泳 2024-01-25 10:15 发表于河北

▁▂▃▄01▄▃▂▁

2023人工智能大年的

一个发人深省的尾声

2023年12月27日，《纽约时报》起诉[color=var(--weui-LINK)][url=]OpenAI[/url]和微软，指控它们未经许可使用该报数百万篇受版权保护的文章，帮助训练聊天机器人为读者提供信息并与该报展开竞争。

起诉书有明确的材料证明《纽约时报》的文章与[color=var(--weui-LINK)][url=]ChatGPT[/url]的输出之间的实质性相似。

以往的类似案例表明，需要证明人工智能输出结果与原始版权材料之间存在实质性相似。

《纽约时报》的起诉强调了OpenAI和微软的人工智能产品复制其大量内容的情况，超出了典型的搜索结果片段，有可能构成版权侵权。

诉讼的重点是内容的精准复制，这比仅仅指控人工智能的输出本身就是侵权作品更为有力。

《纽约时报》对OpenAI和微软的诉讼提供了

ChatGPT生成与该报文章类似文本的例子

▲来源：《纽约时报》

《纽约时报》指责说，“被告试图在《纽约时报》的大规模新闻业投资上搭便车”，在未经许可或付费的情况下利用这些投资来构建替代产品。

诉讼称OpenAI和微软将报纸的文章编码到它们的语言模型的内存中，以便ChatGPT和Bing Chat（现在称为Copilot）可以访问和重复这些信息——在一些例子中，聊天机器人向用户提供了《纽约时报》文章的近乎逐字摘录，并且没有适当的引用。而这些文章需要付费订阅才能阅读。

根据诉讼，《纽约时报》是Common Crawl中用于训练GPT的最大的单一专有数据集。

Common Crawl是一个非营利性组织，负责抓取网络内容并免费向公众提供其档案和数据集，其中包括自2011年以来收集的数千万亿字节的数据。Common Crawl数据集占GPT训练组合的60%，堪称“互联网的副本”。

在其中，www.nytimes.com域名是“最具代表性的专有来源”，总体上亦排名第三，仅次于维基百科和美国专利文献数据库。

在网上常见的垃圾内容海洋中，来自信誉良好的出版商的文章作为训练数据正开始具备新的意义，因为它们比通常在网上找到的其他内容更有可能写得出色且准确。

诉讼称，尽管OpenAI和微软“广泛地从许多来源进行了复制”，但在构建其大模型时，它们对《纽约时报》的内容给予了特殊的强调，显示出对这些作品价值的认可。

GPT-3中权重最高的数据集Common Crawl 是一个“互联网副本”。域名www.nytimes.com是代表性最高的专有来源，在所有资源中排名第三，仅次于维基百科和美国专利文件数据库

侵犯版权的结果是对报纸的多个收入来源造成了不利影响。

《纽约时报》总共拥有超过1000万订阅者，并计划在2027年底前达到1500万，但该报表示，科技公司的“非法行为威胁将读者（包括现有和潜在的订阅用户）从《时报》转移走，从而减少了订阅、广告、许可和联盟营收，而正是这些资金支持《时报》维持其目前的开创性新闻水平。”

一个例证是，必应搜索引擎使用ChatGPT生成的结果来自《纽约时报》拥有的内容，但却缺乏适当的归属或推荐链接。

诉讼中没有提出确切的赔偿要求，但起诉状称，被告应承担与“非法复制和使用《纽约时报》独一无二的宝贵作品”相关的“数十亿美元的法定和实际损失”。

诉讼还要求这两家公司销毁任何使用《纽约时报》版权材料的聊天机器人模型和训练数据。

《纽约时报》是美国第一家起诉流行人工智能平台的大型媒体机构。这起诉讼标志着2023年的一个发人深省的尾声，这一年人工智能行业不受限制、几乎没有监管地向前冲刺。

无论《纽约时报》诉OpenAI和微软一案的结果如何，大型语言模型免费使用新闻档案培训的时代似乎即将结束。

由于诉讼强调，《纽约时报》是用于训练人工智能系统的专有数据的重要来源，比其他出版商更重要，这一独特的地位可能会加强《时报》发起的诉讼，为该领域未来的法律挑战树立标杆。

随着新闻档案对科技公司变得越来越有价值，这起诉讼很可能是多起诉讼中的第一起。此案将为人工智能公司如何使用受版权保护的材料开创先例。

在人工智能反应越来越普遍的时代，高质量、可信赖的人工智能培训资源越来越重要。《纽约时报》对OpenAI的诉讼可能会阻碍人工智能2024年的雄心壮志。

许多科技业人士曾希望2024年人工智能系统能够得到更广泛的应用。但版权诉讼可能会减慢一切，因为法律风险构成人工智能公司计划如何以及何时发布新模型的一个更大因素。

训练数据会成为人工智能领域的一个致命弱点吗？

▲ 图源Pexels

▁▂▃▄02▄▃▂▁

谈判破裂《纽约时报》有备而来

在过去的一年里，媒体机构一直在研究生成式人工智能的蓬勃发展对新闻业内容和财务的影响。
新闻出版商对人工智能公司的态度多种多样：

彭博社拥有庞大的使用人工智能的数据终端业务，该公司正专注于发展自己的人工智能。

《华尔街日报》、新闻集团和 Gannett 希望将他们的故事授权给人工智能开发人员，而BBC、路透社和CNN等媒体已开始阻止人工智能公司访问其内容。

美联社在2023年7月份与OpenAI达成了一项许可协议，拥有Politico和Business Insider的德国出版商Axel Springer在12月也达成了同样的协议。这些协议的条款均未披露。

不过在10月，OpenAI的一位发言人表示，该公司的做法并不违反版权法，其正在谈判的交易仅仅是为了访问其无法在线获取的内容，或是要在ChatGPT中显示链接或文章的完整部分。
与此同时，美国法院或[color=var(--weui-LINK)][url=]联邦贸易委员会[/url]仍然有可能命令人工智能公司删除它们已经从网络上抓取的训练数据。毕竟，联邦贸易委员会在夏天确实对OpenAI的训练数据获取实践展开了调查。

2023年7月，美国联邦贸易委员会（FTC）开始调查OpenAI通过数据收集和发布虚假信息可能对消费者造成的伤害。FTC 希望了解 OpenAI收集和保护数据以及审核信息的详情

在这起诉讼之前，《纽约时报》与OpenAI进行了长达数月的谈判，但未能达成一项付费许可协议。
《纽约时报》称，它于4月开始谈判时，“提出知识产权方面的问题，并探讨友好解决的可能性，同时提出商业条款和技术保护措施，以实现被告和《纽约时报》之间互惠互利的价值交换”，然而“这些努力并未带来解决方案”。
我的猜测是，OpenAI的报价与《纽约时报》的预期相差过大。
不过，新闻机构现在如此计较OpenAI的部分原因是，过往的互联网历史发展表明，如果它们不小心，就会丢弃内容王国的钥匙。

十多年前，新闻出版商将大部分传统广告业务输给了谷歌和Facebook等科技新贵，新闻出版商与科技公司的关系一直不稳定。

《纽约时报》是少数从网络新闻中建立起成功商业模式的媒体之一，但也有多家机构因读者向互联网迁移而步履维艰。

以大型语言模型为代表的新一代人工智能技术之所以被称为生成式人工智能，是因为它们可以通过学习大型数据集来创建文本、图像和其他内容，由此对新闻行业进一步形成重击。

在这种新形势下，转型中的新闻机构将更难找到自己的立足点。因此，《纽约时报》和其他媒体完全有理由追究大科技公司对此应负的责任。

目前，投资者对OpenAI的估值已超过800亿美元。微软已向OpenAI投入130亿美元，而微软自身的价值高达2.89万亿美元，超过苹果公司，刚刚晋升全球市值最高的公司，原因恰恰在于其在人工智能领域的成功。

与此同时，分析师预计，奥克斯-苏兹伯格（Ochs-Sulzberger）家族控制的纽约时报公司2023年的收入将与前一年持平。

对非新闻业务的涉足，如对游戏Wordle的收购，尚未带来有意义的增长。而随着社交媒体公司（如TikTok）不断发展壮大并抢占眼球份额，广告业务也受到了威胁。

此外，曾帮助推动新读者的公司，如埃隆·马斯克（Elon Musk）的X公司，也在重新测试他们与新闻机构的关系。

由于《纽约时报》2023年的收入预计只有24亿美元，每一点收入都很重要。

《纽约时报》明白，它必须用自己的估值与OpenAI已同其他数据提供商签署的协议相比较。

如果《纽约时报》在法庭上证明了自己的估值，OpenAI（以及其他所有基础模型提供商）将会承担更高的数据合同费率。

对于基础模型提供商使用的数据产品而言，利润分享或版税是最合理的定价模式。它根据基础模型提供商的盈利方式对数据进行估值。

在数字模式中，公司对应用程序接口的访问（订阅）收费，或以一次性收费销售数据集下载。

因而，《纽约时报》数据集等数据产品的定价策略十分关键。

我之所以如此强调定价，是因为所有采用统一定价的公司将来都会后悔当初这样做。它们没有意识到自己的数据到底有多值钱，也没有意识到它们的货币化窗口有多小。

数据是一种新的资产类别，企业必须为数据产品定价，以反映新的货币化模式。

一个数据集可用于训练多个基础模型，这些模型可多次货币化。使用数字定价模式出售数据访问权会积淀大量资金。利润分享或特许权使用费可为数据集所有者提供经常性收入，这与基础模型提供者获得报酬的方式一致。

这里发生的是数据价值的根本性调整：

以前，人们的想法是，通过向所有人开放数据，赢得广告投放，以从数据中获取价值。

现在的新想法是，锁定自己的数据，因为当数据集所有者将其用作人工智能的输入时，可以提取更多的价值。

所以，《纽约时报》代表着最新的反对人工智能的数据叛乱：

人们重新认识到，网络信息——故事、艺术品、新闻报道、留言板帖子和照片/视频——可能具有巨大的未开发价值。

叛乱的宗旨是“不让机器收割”，而叛乱大军包括作家、演员、画家等创意人士，还有社交媒体及新闻机构。

所有人都对人工智能公司未经同意就刮取网络内容感到愤怒，抗议形式各不相同。

顶级作家联合起诉 OpenAI“大规模侵犯”小说版权，包括乔治·马丁与乔纳森·弗兰岑

作家和艺术家们正在锁定他们的文件以保护自己的作品，或者抵制某些发布人工智能生成内容的网站。而Twitter、Reddit等公司则希望对访问它们的数据收费。

针对人工智能公司的诉讼不断增多，艺术家指控它们未经同意就对自己的创意作品进行系统训练；盖蒂图片档案馆（Getty photo archive）起诉[color=var(--weui-LINK)][url=]Stability AI[/url]，指控其在未经许可或无补偿的情况下复制了1200万张图像以训练其AI模型。

现在轮到《纽约时报》出手，找了顶级律师事务所苏斯曼·戈弗雷（Susman Godfrey），它拥有对抗大科技公司的上佳记录。

显然，这并不是为了快速抢钱，而是一次战略性的法律挑战。

《纽约时报》在纽约南区法院对OpenAI和微软提起诉讼。它经过了深思熟虑，首先要求陪审团审判。

《纽约时报》认为，在版税问题上，陪审团比法官更有可能站在自己一边。法官更理性，会根据先例行事。陪审团的不可预测性要大得多，当他们看到一个大企业占他人便宜的案件时，判决的赔偿往往会更高。

要求陪审团审判增加了潜在结果的不确定性，更有可能开创一个新的先例。

此诉讼案还有一点很有意思，指控人工智能将“幻觉”或虚构事实归因于《纽约时报》，为案件增添了另一个维度。

《纽约时报》称，

来自OpenAI和微软聊天机器人的错误信息，以“人工智能幻觉”的形式出现，但却将这些信息归于报纸。
例如，针对要求撰写一篇关于各大报纸报道橙汁与非霍奇金淋巴瘤有关的信息性文章的提示，GPT模型完全捏造了一件事：它称《纽约时报》于2020年1月10日发表了一篇题为《研究发现橙汁与非霍奇金淋巴瘤之间可能存在联系》的文章，尽管这样的文章从未在报纸上出现过。

诉状继续说：

“这些‘幻觉'在用户获取信息的来源上进行误导，使他们错误地认为所提供的信息已经过《纽约时报》的审核和发布。用户向搜索引擎询问《纽约时报》就某一主题撰写了什么内容时，得到的不应该是报纸文章的未经授权的副本或不准确的伪造品，而应该是文章本身的链接。”

这样的虚假信息指控带给人们一个巧妙的转折，将大家所害怕的东西——幻觉——搬了出来，使《纽约时报》成为第一家强调“幻觉”可能对其品牌造成损害的出版商。此前，OpenAI及其主要竞争对手谷歌都承认它们的聊天机器人容易产生幻觉。

如果你花足够多的时间使用聊天机器人和内容生成器，用不了多久，你就会得到一些不相关、无意义的输出，有时甚至是完全错误的输出。这些情况被称为人工智能幻觉，是每个使用人工智能生成器获取信息和完成工作（并想要准确完成工作）的组织和个人都会遇到的问题

版权专家、康奈尔大学数字和信息法教授詹姆斯·格里梅尔曼（James Grimmelmann）评论说，《纽约时报》的起诉“非常专业”。“这绝对是迄今为止在生成式人工智能领域所见过的最彻底、最谨慎的诉讼。”

《纽约时报》的律师们有版权注册记录，有报纸上的作品被被告复制并出现在正在使用的模型中的明确枚举，有详细、广泛的证据证明人工智能模型是根据《纽约时报》的文章进行训练的。

而且，《纽约时报》也讲了一个足够合理的基本故事，说明对它的经济损害以及对新闻市场的影响。

▲ 图源Pexels

▁▂▃▄03▄▃▂▁

新闻基础设施摇摇欲坠新闻商业模式岌岌可危

这个故事的概貌是这样的：

《纽约时报》以侵犯版权为由起诉OpenAI和微软，这使得一家领先的媒体机构与一项变革性新技术的传播者对簿公堂。

从象征意义上讲，这起案件意味着一场模式之间的冲突：劳动密集型的人类新闻采集与人工智能按键式信息生产。

但在法律上，此案却代表着不同的东西：已有法律和新兴技术之间的经典差距。

版权法是一套可追溯到印刷术的规则，其设计初衷并不是为了涵盖像ChatGPT这样的大型语言模型。美国法院必须有意识地对其进行改变，甚至可以预计，最高法院的裁决基本上是不可避免的。

一些出版商将在一段时间内与人工智能平台达成和解——甚至《纽约时报》案也不排除和解的可能性——但只要有足够多的出版商不选择和解，这个新颖而关键的版权法问题迟早需要得到解决。

在过去的十年里，新闻出版商一直在游说国会寻求保护，以免大科技公司利用其内容开展社交媒体和搜索引擎业务。

人工智能的出现引发了新一轮的游说努力，新闻高管们认为科技公司无权根据现行版权法中的合理使用来抓取其内容。

由此，美国国会也极有可能干预，如果法院不能正确处理的话。这是因为，新闻基础设施本来就已摇摇欲坠，如果技术的变革彻底将其摧毁，民主将成为输家。

《纽约时报》深明这种利害关系。

在与OpenAI的谈判中，它希望“确保”其内容的使用“获得公平价值”，“促进健康的新闻生态系统的持续发展，并以负责任的方式帮助开发生成式人工智能技术，从而造福社会，为知情的公众提供支持”。

谈判破裂后的起诉书这样写道：

“如果《纽约时报》和其他新闻机构不能制作和保护其独立的新闻报道，就会出现计算机或人工智能都无法填补的真空。”

后果是，“新闻报道将减少，社会将付出巨大代价”。

《纽约时报》特别谴责人工智能公司在大规模新闻业投资方面免费搭便车的做法。

诉讼引用了OpenAI的GPT-4输出《纽约时报》大篇幅新闻文章的例子，包括一项针对纽约市出租车行业的获奖调查，历时18个月才告完成。

诉状称：

“《纽约时报》的新闻报道是数千名记者的心血，他们每年的工作成本高达数亿美元。”

被告通过未经许可或无偿使用《纽约时报》的新闻作品，有效地避免了该报为创作这些作品所投入的数十亿美元，因而都属于“不当受益于”报纸在新闻业的投资。

这背后的一个深远忧虑是，聊天机器人和其他人工智能工具的兴起将进一步侵蚀陷入困境的新闻业的收入，甚至使整个新闻业变得过时。

例如，搜索引擎Bing使用ChatGPT来支持其搜索。如果一个人向Bing提问，搜索引擎可以根据《纽约时报》的报道立即生成一个长而详细的答案，从而消除了此人访问《纽约时报》网站的需要，由此夺走了报纸的收入。

一般而言，出版商对新闻的直接流量感到最舒服，但像ChatGPT这样的大型语言模型可能根本不会将用户带到新闻网站。

方兴未艾的AIGC有可能削弱广告在内容经济中的地位，如果像必应这样的人工智能工具从网络上搜刮信息，而不需要用户点击转到信息源，那么它就取消了让许多网站维持下去的收入来源。

▲ 图源Pexels

▁▂▃▄04▄▃▂▁

《纽约时报》诉案的关键法律问题是合理使用原则
科技公司的抗辩会是，它们对新闻公司数据的使用属于美国版权法下的“合理使用”。
“合理使用”是一种允许在未经许可或付费的情况下有限使用受版权保护的材料的原则，特别是为了批评、评论、新闻报道、教学、学术或研究等目的。
版权案件中的被告需要证明它们对内容进行了实质性改造，并且没有作为原作者作品的替代品在同一市场进行竞争。
然而，就《纽约时报》一案而言，与之前案件中的被告相比，OpenAI和微软成功建立合理使用抗辩的可能性似乎较低。
现行美国版权法第107条规定，法院在评估合理使用抗辩时至少要考虑四个因素：

使用的目的和性质，包括这种使用是否具有商业性质或是为了非营利的教育目的；版权作品的性质；与受版权保护的作品整体相比，使用部分的数量和实质性；以及这种使用对版权作品的潜在市场或价值的影响。

在考虑合理使用测试的四个因素时，我们会发现：教育性和非营利性用途更有可能被认定为合理使用。
与技术写作或新闻相比，创意作品受到的版权保护更多。被复制作品的数量很重要，被复制材料与原始版权材料之间是否存在实质性相似也很重要。
最后，也许对《纽约时报》的诉讼来说最重要的是，法院还要考虑复制是否会损害被复制作品的当前或未来市场。
由以上规定来看，对原作进行“创新”使用、添加新元素且不替代原作用途的情形，更有可能被视作合理使用。而我们看到，OpenAI和微软的做法在这些方面都不大站得住脚。
首先，讨论使用的目的和性质时，被告的目的也反映了《纽约时报》的目的：向读者提供新闻信息。
这种情形缺乏合理使用论证通常所需的“变革性”（transformative）元素——即添加新的东西，或以显著的方式改变原始作品（通常是为了不同的目的）。
OpenAI和微软可能会辩称，训练它们的人工智能产品可被视为具有变革性，因为人工智能以不同于新闻报道或评论的最初目的的方式使用报纸内容。
但恰如《纽约时报》所指出的：

“无偿使用《纽约时报》的内容来创造替代《纽约时报》的产品，抢走《纽约时报》的受众，这毫无‘变革性’可言。”

此外，考虑到人工智能软件是为了盈利而出售的，其使用的商业性质是显而易见的。

其次，预计被告会辩称，人工智能将输入作品视为事实数据，新闻由事实组成，因此应该比创意材料得到更宽容的对待。
但考虑到《纽约时报》在呈现事实材料时所做的作者和编辑选择，无论人工智能如何处理，底层作品仍然具有本质上的创造性。
第三个因素对OpenAI和微软来说是一个挑战，因为它们很难断言仅使用了《纽约时报》作品的一小部分，特别是当该报的投诉强调出现了大量逐字使用的情况时。任何逐字输出的证据也会损害OpenAI和微软的“变革性”论点。
谈到第四个因素——对版权作品市场的影响时，《纽约时报》强烈认为OpenAI和微软对其内容的使用可能对内容的价值产生重大负面影响。
由于《纽约时报》的大部分报道都需要付费，因此读者无需支付《纽约时报》订阅费即可通过OpenAI访问相同的内容，这一事实影响了受版权保护作品的价值，它将为被告的合理使用辩护带来额外的障碍。
同时，与作家、艺术家等类似情况的原告相比，《纽约时报》提出了更强烈的反对合理使用的主张，因为不太可能有人会要求人工智能应用程序生成小说的完整副本。

科技公司的大型语言模型建立在从互联网各个角落搜罗的内容和数据的基础上，它们经常辩称，如果某些内容是公开的，那么用来训练模型就是合理的。

但基于这些模型的商业性，内容的创建者大多不同意这一观点。

据彭博社报道，OpenAI目前正在洽谈以1000亿美元的估值进行融资，高于其目前860亿美元的估值。

订阅ChatGPT Plus可以让用户使用功能更强大的聊天机器人，每月收费20美元。该公司还向企业客户出售服务。

据The Information报道，OpenAI最近的年化收入突破了16亿美元，主要来自这些订阅服务。

2024年1月11日，OpenAI商业化扩张之路再进一步，正式上线了基于其大模型GPT-4等搭建的定制应用程序商店——GPT Store。

与此同时，微软对Office软件中的[color=var(--weui-LINK)][url=]生成式AI[/url]功能收取每月30美元的费用，而订阅《纽约时报》的费用为每月25美元。

利益迥异的双方看待大模型的视角完全不同。格里梅尔曼指出：

“人工智能公司在一个心理空间中工作，它们认为将万事万物放入技术搅拌机中没有什么不可以。媒体公司从未完全接受这一点。它们一直认为，如果你正在使用我们的作品展开培训或者做一些能产生价值的事情，我们就应该有权获得其中的一部分。”

生成式人工智能可能是迫使这个问题得到法律解决的技术，《纽约时报》诉讼案的关键法律问题是合理使用原则。

OpenAI和微软将很难反驳合理使用测试的最后一点，即它们的产品依赖于《纽约时报》这样的新闻采集企业，必定会对这些企业的利益造成损害。

ChatGPT和其他大语言模型无法到外面的世界去收集和审核新的事实。在可预见的未来，它们只能从已经发布的信息中“学习”。

换个角度看，OpenAI和微软需要《纽约时报》和其他新闻机构的存在，才能提供可靠的新闻作为其服务的一部分。因此，从理性和经济的角度来看，它们应该有义务为所使用的信息付费。

更重要的是，为了让人们知道新闻是可以信赖的，需要新闻来自社会可以信任的机构——有着良好记录和声誉的机构，依靠商业利益来维护它们的存在与发展。否则，我们就不会有新闻。

我们将拥有一个与现实脱节的自我迭代的回音室，以及多个无法保证其准确性的大模型。这就是维护新闻自由的基本公共利益与合理使用问题的关系所在。

《纽约时报》对OpenAI/微软的诉讼案和其他案例表明，法院目前正试图解决人工智能技术对版权、隐私和数据使用法律的复杂影响，法律格局也在不断变化之中。

每个案例都将有助于界定将在线内容用于人工智能训练目的的界限和可接受的做法。而观察“合理使用”等论点是否足以顶住来自多方的压力，将是一件非常有趣的事情。

同样有趣的是，如果OpenAI和其他科技公司的行为被认为是有问题的，那么在可能的赔偿和/或销毁整个模型和训练集方面，什么样的处罚才是合适的。

这场诉讼凸显了促进人工智能创新与保护版权之间错综复杂的平衡。

随着人工智能技术越来越多地展现出生成类人内容的能力，一个具有挑战性的问题也随之凸显：

在不违反版权法的情况下，现有内容在多大程度上可用于人工智能开发。

无论结果如何，这场诉讼都可能对人工智能行业产生持久影响，影响人工智能公司、内容创作者和法律专家如何驾驭人工智能技术与版权法之间复杂的相互作用。

它还将人工智能开发中的伦理考量的重要性推到了风口浪尖，强调了在各个领域负责任地合法使用人工智能技术的必要性。

来源：胡泳（公众号）

链接：https://mp.weixin.qq.com/s/RuAGssbDRmWEQvKsHWX30g
编辑：李梦瑶

刘海明 · 发表于 2024-1-31 23:47:16

【案例】

主播被指抄袭，道歉有用吗？

近日，百万粉丝博主“杨藩讲艺术”发布视频，称“与辉同行”直播间大规模抄袭自己的文案。在杨藩发布的两条视频中，列举了多处“与辉同行”主播董董解说时，与自己早年间视频的相似之处，包括内容、架构、用语都与自己发布的视频几乎一样，相似度超过90%。杨藩强调“与辉同行”是在卖货时商用，也完全没有声明引用来源。涉事主播董董在直播时称“讲解艺术时可能会用到一些老师的作品但无意冒犯……大家互相成就”。目前，与辉同行账号暂未对抄袭争议做出回应，但争议视频疑似已经下架，在作品栏中已找不到该视频。

这样的疑似道歉有用吗？

杨藩在直播中表示，会考虑“报警”。

事态还在发酵中，已引发网络舆论热潮，开启了一场关于文案抄袭和知识产权保护的热议。

一些人认为，直播间应该注重原创内容的创作和保护，尊重他人的知识产权，不能随意抄袭和侵犯他人的权益。

另一些人则认为，网络内容为公共知识，直播间的内容创作应该注重实用性和趣味性，而不是过于追求原创性，对于一些创意和内容的借鉴并不等同于抄袭……

随着新媒体发展，步入“万众皆媒”时代，传播生态发生了巨变。

根据中国网络视听节目服务协会发布的《中国网络视听发展研究报告（2023）》显示，截至2022年12月，我国网络视听用户规模已达10.4亿，网络视听成为第一大互联网应用。UGC（用户生产内容）成为许多平台发展壮大的支柱。传播主体多元化，给公众信息获得带来更多便利，但同时，因在技术、认知、专业性等方面的参差，造成部分自媒体内容制作和传播行为失范。尤其在直播和短视频领域，文案、视频等创意内容意味着流量，流量就意味着利益，涉及抄袭的情况屡见不鲜，形式也更为多样化，侵权行为和短视频一同“野蛮生长”。

01花式抄袭

直接“克隆”搬运

作为直播界头部网红带货达人的主播“疯狂小杨哥”，就遇到了“李鬼”——“暴躁小鹏哥“，包括主播发型、服饰、风格等，几乎是被一比一复刻，甚至连直播间装饰都被像素级模仿。如此简单粗暴的“克隆”行为，惊呆了网友。

靠模仿蹭流量的直播方式，一直争议不断，包括名称、风格、场景搭建、选品陈列等方面，是以“借鉴”之名，行“抄袭”之实。虽然靠山寨等手段可以快速、低成本打造一个公号，但是也必然会迎来更多批评和谴责，不仅被网友认定为缺乏创意，也会被贴上不诚实和偷窃的标签，而失去真正发展壮大的机会。东方甄选爆火后，自身也深受抄袭困扰。“西方臻选”短视频账号，模仿搬动东方甄选和董宇辉，开播不久就被平台封号。另外一个高仿号“东方绿选”更是被东方甄选诉至法庭，被法院判决停止侵权行为，并赔偿东方甄选公司经济损失及合理开支。

视频文案抄袭

和直接复制搬运相比，文案抄袭则更为隐蔽。

2022年5月，轰动一时的某企业与明星合作的宣传短片《人生小满》全网爆火。起初，暖心的视频收获很多网友点赞，获得巨大的浏览量。然而，很快视频被扒出与网名为“北大满哥”的原创视频文案高度雷同，相关话题一度冲上了微博热搜第一。随后涉事公司全面下架该视频，视频的创意代理公司也发表了道歉声明。大公司尚且如此，多如牛毛的各路主播们，更是打了“信息差”，赌被抄袭的主播和粉丝发现不了，大玩文案抄袭。更有甚者，有大主播抄袭小主播文案，后者因为影响力小，反而还被人误认为是抄袭者，陷入“谁粉丝多谁有理”的怪圈。比如，财经博主珍大户指控一名拥有近千万的博主抄袭，曾一度成为热门话题。

02 法律如何界定

直播和视频抄袭事件，其关乎的不仅仅是道德，也涉及法律责任问题，可能涉及知识产权侵权。
中国政法大学传播法研究中心副主任朱巍，就此事件接受媒体采访时指出，直播、短视频的文案是有版权的，如果脚本和文案高度重合则有可能涉及侵权问题。朱巍还强调，如果是纯知识的学习则不涉及商业使用侵权问题，但需要标明出处；如果是商业宣传或销售使用则要承担相应的法律责任。对于抄袭的认定，我国《图书期刊保护试行条例实施细则》有两个关于“十分之一”的认定标准，即：一、引用别人作品，不得超过被引用作品的十分之一；二、引用的总量，不得超过本人创作作品总量的十分之一。随着新媒体发展，短视频平台的兴起，海量信息背后常常伴随着海量侵权，不管是对作者也好，还是相关方来说，各种维权成本居高不下，往往导致不了了之。

03 如何破局

流量就是吸引力，是变现最直接的手段。

从文字传播时代开始，便是如此。到了视频时代，靠恶俗、抄袭等赚取流量野蛮生长，依然大行其道。

视频内容抄袭跟文字和图片抄袭相比，识别难度更大。

各短视频平台应积极通过提升技术手段，建立完善的版权审核机制，对上传的视频进行严格的版权查验，防止侵权内容发布。

设立版权投诉渠道，方便原创作者对侵权内容进行举报。

出台相关政策，对搬运、抄袭行为进行明确禁止，鼓励用户创作原创内容并尊重他人的知识产权。

比如，某视频平台2023年颁布新规，对抄袭进行严控：与他人发布内容完全一致或仅进行了变速等操作；与他人发布过的内容文案部分一致，且一致的部分占比较大，占比超过30%，字数超过100字；与他人发布过的文案主旨一致，仅更改语序结构，疑似洗稿。以上这些行为均可被判定为抄袭。

另外还需要加大处罚力度，如果违反相关规定，被判定为抄袭，则对侵权内容实施有效处罚，包括但不限于删除、下架、禁言、封号等措施。

如果把希望完全寄托在平台身上，似乎不是万能灵药。对平台来说，原创流量也好，“非原创”流量也好，对他们来说都是流量，本质上没有好与坏的区别；而且，面对海量侵权纠纷中，也很难做到事无巨细处理妥当，这势必需要投入大量人力财力。

对于主播而言，忍无可忍时才会诉诸法律，这同样也是一条成本极高的维权之路，时间和精力都是极大消耗。

显然，随着短视频的急速膨胀，需要相关法律法规和行政规则进一步健全和完善，需要创新更多办法来解决这一领域的版权纠纷。

中宣部版权管理局相关负责人2023年在答记者问时提到：党的二十大明确提出“加强知识产权法治保障，形成支持全面创新的基础制度”。……强化版权保护，加强对主要网络服务商和新媒体业态的版权重点监管，加强两法衔接，完善版权纠纷多元化解决机制。

当然，我们还可以期待用户法律意识的提高。

面对各类媒体平台的海量信息，网络受众需要具备一定的知识产权意识，提升辨别力，区别借鉴和抄袭的界限。

当监管、平台、主播、用户四方合力，那么短视频领域的侵权行为，或许会找到破局之道。

创作是艰辛的过程，是智慧的结晶，每一位原创者的努力都值得敬佩，希望每个人都能尊重和保护他人的创造力，为建设一个更加健康、公正和富有创造力的知识创作环境和传播生态而共同努力。

校对｜李立军

来源：新京报传媒研究（公众号）

链接：https://mp.weixin.qq.com/s/R6fLR30tB1J0Z-EEIkJgeA

编辑：王晨雅

刘海明 · 发表于 2024-2-1 10:26:14

【案例】

“与辉同行”直播间陷抄袭风波律师建议：短视频创意借鉴应标明出处

1月29日晚间，拥有235万粉丝的视频博主“杨藩讲艺术”发布视频，称董宇辉负责的“与辉同行”直播间大规模抄袭自己文案，该视频迅速引发关注。事情发酵后，“与辉同行”主播董董在直播时表示，自己在讲解艺术时可能会用到一些老师的作品，但无意冒犯，有什么问题可以及时沟通，疑似回应抄袭事件。

红星新闻记者梳理发现，近些年不管是影视剧还是短视频亦或者文学作品，都不断发生抄袭事件，比如奥迪广告营销视频被指抄袭、知名影视剧《三生三世十里桃花》《甄嬛传》深陷抄袭风波等。

▲杨藩称“与辉同行”抄袭自己文案网络截图

有律师在接受红星新闻记者采访时表示，仅依据当前相关新闻报道来看，“杨藩讲艺术”所指控的对方所使用的内容构成侵权的可能性较小。如果“杨藩讲艺术”能够证明“与辉同行”所使用的具体表达，与其具有独创性的表达内容构成相同或实质性近似，则需要根据具体情况进行讨论。律师认为，短视频和直播的制作者应尊重知识产权、尊重原创作者的劳动。

①“与辉同行”被指抄袭文案

主播疑似回应抄袭事件

人文艺术科普博主杨藩在两条视频中列举了三段“与辉同行”主播董董解说米开朗基罗时，与自己早年间介绍米开朗基罗视频的相似之处。首先是米开朗基罗师徒关系部分，杨藩称对方内容、架构、用语与自己视频几乎一模一样，自己是最早在国内网络平台按照中国师徒关系模式讲解文艺复兴三杰的，关系图也是通过查找十多个文献才整理出的。其次“与辉同行”主播董董向直播间网友展示的法乌努斯雕塑图片，是自己的视频截图。董董称该雕塑是米开朗基罗的作品，实际上原雕塑已经不存在了，那张图是自己找的其他雕塑范例。

杨藩称，自己在解释米开朗基罗全名含义的时候，取了一个不靠谱的中文名“富贵”来搞笑，并按照名字的语言因素来解释名字的含义，“与辉同行”直播间也是如此。

杨藩说，讲知识借鉴别人的内容在所难免，但需要在使用时注明参考作者或者灵感来源。“与辉同行”主播的讲解视频与自己的内容重合度达90%，在卖货的时候商用并切片做成短视频属于抄袭行为。

▲疑似主播董董在杨藩评论区回应此事网络截图

事情发酵后，“与辉同行”主播董董在直播时表示，自己在讲解艺术时可能会用到一些老师的作品，但无意冒犯，有什么问题可以及时沟通，疑似回应抄袭事件。

有截图显示，疑似主播董董在杨藩评论区表示：“我大学时期一直看您的视频。我特别喜欢您，您讲的很多东西我都很受用也很喜欢，也很感谢您分享。抱歉我才看到您发的视频，因为抖音直播这边提及某个创作者的话，会涉及引流会违规。所以我没提及您，所以我希望您别生气哈，我一直很尊重您的创作，以后如果使用的话我会告知您。”这条评论后被删除。面对质疑，杨藩在1月29日的直播中表示没有看到这条评论，也不是他删除的。

“杨藩讲艺术”称，商用抄袭自己可以不追究，但希望对方声明引用来源。杨藩发出视频后，“与辉同行”并没有删除争议视频片段。而杨藩之后在接受记者采访时表示，事件发酵以来自己和粉丝受到了网暴，希望得到正面回应。

②奥迪广告、知名影视剧等

也曾陷入抄袭风波

红星新闻记者梳理发现，近些年不管是影视剧还是短视频亦或者文学作品，都不断发生抄袭争议事件，比如奥迪广告营销视频被指抄袭、知名影视剧《三生三世十里桃花》《甄嬛传》深陷抄袭风波等。

2022年5月21日，正值小满节气，奥迪官方发布了一条与影视明星刘德华合作的广告视频《人生小满》，引发广泛关注。但随后，一位名为“北大满哥”的博主发布视频，称《人生小满》这条商业广告抄袭他在一年前发布的一条视频的文案。

面对质疑，一汽奥迪发布一则官方致歉声明，表示：“就该事件中因监管不力、审核不严给刘德华先生、北大满哥及相关方造成的困扰表示诚挚的歉意。”

在诸多抄袭事件中，知名电视剧剧《三生三世十里桃花》《甄嬛传》陷抄袭风波引发的关注尤甚。

2017年上映的电视剧《三生三世十里桃花》改编自唐七公子同名小说，早在2008年小说开始连载时就争议不断，被指抄袭“大风刮过”的《桃花债》，仅抄袭一事的微博话题阅读量就超过3000万。

2015年，“三生三世”签约影视版权后，唐七公子称“是在致敬《桃花债》”，“大风刮过”却对这种致敬不买账，反讽道：“一般抄袭的人，是默默抄完，很怕被发现，事发不承认。T小姐（指唐七公子）则刚刚相反，她是抄一点，然后大张旗鼓发声明，自己说致敬。”不少网友表示心疼“大风刮过”，“一直被抄袭，从未被超越！”

此后，唐七公子委托机构出具了《著作权司法鉴定意见书》，鉴定结果为：文学作品小说《三生三世十里桃花》和《桃花债》，其故事梗概、人物设置、人物关系、情节发展不同，不构成著作权意义上的抄袭。

③律师认为据相关新闻报道来看

“与辉同行”构成侵权可能性小

大成律师事务所上海办公室合伙人李伟华在接受红星新闻记者采访时表示，目前并未看到杨藩所主张的原始视频以及“与辉同行”所使用的完整视频，仅依据当前相关新闻报道来看，杨藩所指控的对方所使用的内容构成侵权的可能性较小。

李伟华表示，目前杨藩指控对方所使用的自己的内容主要有：1、借鉴中国师徒关系的模式比照米开朗琪罗的师徒关系；2、法乌努斯雕塑视频截图；3、将米开朗琪罗称呼为“米富贵”这个名称。《著作权法》保护的是具体表达，而不保护思想、创意。杨藩所主张的前述第1和第3项内容，更像是某种创意而不是具体的表达，比如，每个人都可以借鉴中国师徒关系来讲解米开朗琪罗的师徒关系，只要所讲解的具体内容不构成相同或实质性近似，这是《著作权法》在合理保护著作权人的利益与促进公共文化传播方面所寻求的一种利益平衡。

▲“杨藩讲艺术”网络截图

至于杨藩所主张的法乌努斯的视频截图，如果该张图片是杨藩从公开的渠道所寻找的图片是用在了自己所制作的视频中，那么其对该图片并不享有著作权。

李伟华认为，《著作权法》并不保护其首先将这一图片称之为或比作“法乌努斯”雕塑作品这一行为。当然，如果杨藩能够证明“与辉同行”所使用的具体表达，与其具有独创性的表达内容构成相同或实质性近似，则需要根据具体情况进行讨论。

④律师提醒：

短视频文案创意借鉴应标明出处

北京市伟博律师事务所主任律师李伟民对红星新闻记者表示，常见抄袭分为基本不变的抄袭和改头换面的抄袭，前者指将他人享有著作权的原作品不作任何改变的“搬运”；后者指抄袭者对所抄袭的作品进行不同程度的修改和组装，也就是所说的“洗稿”。抄袭手段主要表现为直接照抄、复制粘贴、查找替换、拼凑融合等方式。

李伟民表示，后作品对原作品在法律上是否构成抄袭，应以两部作品之间是否存在实质性相似关系为判断标准。首先需要明确的是，著作权保护表达，不保护思想，即“内容为王”。在判断是否侵权时，特别是前后作品在体裁和表现形式方面已经出现显著变化的情形，比较的参照对象不应局限于文字、符号层面（比如，具体的措辞、语句、台词等），而应追寻至体现作者作品表达内容又具有作品独创性的部分，比如，具有独创意义的人物设置、人物关系、故事情节及基于特定逻辑布局形成的情节串联整体等。

北京市中永律师事务所律师王韵表示，著作权法有一个“思想表达二分法”的原则，即著作权法只保护思想的表达，而不保护表达出来的思想。举例来说，这篇文章中提到的按照师徒关系模式讲解文艺复兴三杰，这就属于思想层面，不受著作权法的保护，任何人受到启发之后都可用这个模式来讲解，但是讲解的具体内容、前后结构顺序措辞等属于表达，应当受到著作权法的保护。再比如视频中的法乌努斯雕塑，杨藩说该图片是自己找的错误范例，被对方抄走。但是该雕塑图片并非杨藩创作，不属于他的作品，所以其他人也可以使用，只不过是以讹传讹了而已。

对于杨藩文中提到解释米开朗基罗的全名含义，用了一个不靠谱的中文名“富贵”来搞笑，也被董的团队直播使用。王韵表示，因为没有看到杨藩视频的具体内容，所以不太容易下判断。一般来说，如果具有独创性的翻译，也是可以受到著作权法保护的，但是不仅仅限于一个名字，而是要参考更多的因素。

“短视频和直播的制作者应尊重知识产权、尊重原创作者的劳动。在制作过程中，如果是创意或知识来源的借鉴，应当尽量标明来源出处或如实向公众说明，避免不必要的争议，也避免以讹传讹，误导公众。这也是传播者应当尽到的社会责任。”王韵说。

红星新闻记者祁彪

编辑郭庄责编冯玲玲

来源：红星新闻

链接：https://www.sohu.com/a/755576168_116237?edtsign=7B368D44AF59DE52A0E5940905F9EDCDD422C1E3&edtcode=2PBU%2BTiMwCHq%2FwmFSXvzFA%3D%3D&scm=10001.663_14-200000.0.0.10006_&_f=index_cpc_1_0&spm=smpc.channel_258.block4_314_Y6ubu8_1_fd.8.1706749541794D2px5tQ_1090

编辑：王晨雅

刘海明 · 发表于 2024-2-19 20:35:38

【案例】新文速递|张湖月&杨颂: 生成式人工智能版权问题的动态分析

背景：2023年11月，北京互联网法院针对中国首例“人工智能文生图”版权侵权案做出具有里程碑意义的判决。法院明确指出，利用生成式人工智能大模型生成的图片属于“作品”，受到版权法保护，且版权归属于用户。这一判决迅速掀起巨大波澜，引发了全球关注和激烈辩论。同期，在太平洋彼岸，即使有用户深度参与创作并获得艺术大奖，人工智能生成的图片仍然被美国版权局和地方法院拒绝赋予版权。
与此同时，中国各界正在热烈探讨人工智能公司使用受版权保护的作品训练人工智能模型是否存在合法性。其中，最核心的争议点在于生成式人工智能模型训练是否构成合理使用。若不构成，人工智能公司则可能需要向版权所有者获取单独授权，并支付约定费用。在中国版权法下，合理使用的适用范围非常狭窄。因此，许多行业专家呼吁对其进行扩大解释，或者引入例外条款，以保障人工智能产业的健康发展。同样的问题在欧美也引起了关注。在欧洲，人工智能模型训练受特殊例外条款的保护，但版权所有者有权将其作品从训练数据中移除；欧盟正在起草的《人工智能法案》要求人工智能提供者进行版权信息披露，以便版权所有者行使其退出权。在美国，尽管合理使用的适用范围颇为宽泛，但已经有数十例诉讼围绕生成式人工智能的合理使用问题展开，其中备受关注的案例包括纽约时报指控Open AI和微软侵犯其版权，并索要数十亿美元的赔偿。

作者介绍

张湖月

香港大学法律学院副教授

黄乾亨中国法研究中心主任

杨颂

伦敦商学院管理学教授

新文简要迄今为止，学界对于生成式人工智能合理使用和可版权性这两大问题的讨论，主要集中在现有版权法的教义和原则领域内。然而，关于不同政策和法律设计之间的利弊权衡和经济影响分析却鲜有关注，而这恰恰是许多业界人士关心的焦点。譬如在合理使用问题上，有人担忧，如果人工智能公司在获取训练数据时，必须逐一取得版权所有人的授权并支付补偿，这会显著增加数据获取成本，进而阻碍人工智能产业的整体发展。然而，如果内容创作者完全得不到补偿，这又可能导致创意产业的衰落。在可版权性问题上，以中国“人工智能文生图”第一案为例，主审法官认为，对人工智能生成内容给予版权保护，可以激励人们更多地使用人工智能，从而带动投资并促进产业发展。但这种做法也可能打击人类自主创作作品的积极性，导致人类生成的训练数据短缺。现有诸多研究表明，人工智能模型质量的持续提升依赖于人类生成的高质量数据内容。如果仅向大模型投喂人工智能生成的数据或作品，模型的表现只会趋于下降。最终，这将降低人工智能模型的质量并阻碍人工智能的长远发展。
本文是首个通过经济建模的方法对生成式人工智能背景下版权监管设计进行分析的研究。作者以生成式人工智能的合理使用和可版权性两大核心争议为主线，深入探究了以下三个问题：第一，针对合理使用和可版权性的不同监管制度设计，将如何影响人工智能公司和内容创作者的行为及盈利空间？其对整体社会福利的影响又是什么？第二，合理使用和可版权性之间如何相互作用？这种互动对政策的制定有何影响？第三，以上作用如何受到各种商业与技术因素的影响？
为解答这些问题，作者建立了一个动态分析模型，涵盖监管者、内容创作者和生成式人工智能公司这三大主体。通过研究监管政策对创作者生产内容的模式和人工智能公司模型改进的影响，文章呈现了诸多创新性的发现。具体概括如下：

第一，关于合理使用的制度设计。在生成式人工智能的新兴领域，当现有的训练数据还相当丰富，监管本身并不直接影响人工智能公司以后能够获取多少训练数据。此时，如果将人工智能模型训练视为合理使用，人工智能公司在获取训练数据时，就不需要考虑授权与补偿的问题。这有利于人工智能公司提高模型的质量，从而增加公司和内容创作者的利润，最终提高消费者的整体福利。
然而，在人工智能技术较为成熟，训练数据已经变得稀缺的场景，人工智能模型的持续改进将非常依赖后续生成的新内容。例如，OpenAI公司目前高度依赖不断更新的新闻来改进ChatGPT。在这种情况下，如果将人工智能模型训练视为合理使用，那么在受版权保护的作品被用于模型训练时，人类创作者将无法获得任何补偿。这种做法将削弱人类继续创作新内容的动力，从而导致人工智能训练数据的短缺。在竞争激烈的市场环境中，由于对新的人工智能训练数据需求量更大，训练数据的短缺问题将尤为严重。此外，随着人工智能模型质量的不断提升，创作者可能愈发依赖人工智能生成内容，进一步加剧训练数据的短缺危机。
第二，关于可版权性的制度设计。在人工智能训练数据丰富的情况下，通过版权保护人工智能生成内容，短期内将激励人们更多地使用人工智能进行创作，吸引更多人成为创作者，并提升创作效率。这样一来，人工智能公司的利润和内容创作者的总收入都将得到提升。然而，由于人工智能生成的内容被赋予排他性权利，过度的版权保护最终可能减少消费者剩余，从而降低整体社会福利。此外，虽然对人工智能生成的内容实施版权保护可以刺激市场对人工智能工具的需求，但这也可能削弱人工智能公司持续优化模型的动力，从而阻碍这项技术的长期发展，尤其是在头部公司形成垄断的市场环境中。
在训练数据稀缺的情况下，除以上作用之外，可版权性还会对训练数据的生成造成影响。具体而言，对人工智能生成内容实施版权保护，虽然可以直接提高市场对人工智能工具的需求，但也会导致人类生成内容的供应减少。这将不利于人工智能模型的进一步发展，长远来看也会阻碍人工智能内容的生成。
第三，关于合理使用与可版权性的互动关系。在人工智能训练数据丰富的情况下，合理使用与可版权性的制度设计具有一定的可替代性。例如，人工智能模型训练被视为合理使用，有利于人工智能公司获得更多的训练数据，从而提升模型质量；在市场竞争激烈的环境中，即使人工智能模型训练不再被视为合理使用，但如果对人工智能生成内容实施全面的版权保护，也可以达到提升人工智能模型质量的效果。在市场垄断的环境中，这种可替代性主要体现在对人工智能公司利润的影响。
在训练数据稀缺的情况下，合理使用与可版权性之间的互动变得更加复杂。例如，当人工智能生成内容不受版权保护时，允许人工智能公司通过合理使用获得广泛的训练数据，将有助于推动人工智能的发展，并提高社会福利。然而，当人工智能生成内容受到版权保护时，如果仍然允许人工智能公司通过合理使用获取训练数据，反而可能会对人工智能的发展产生不利影响，并导致社会福利降低。这是因为在后一场景中，人类自主创作内容的激励被极大地削弱，从而严重制约了后续可用的训练数据。
基于以上研究成果，两位作者提出了几点具体的政策建议：
首先，生成式人工智能的治理应遵循灵活敏捷的原则，充分考虑不同行业和地区的独特环境因素。例如，欧盟的《人工智能法案》为成员国的各个行业制定了统一的规则。但由于未充分考虑各国的国情以及各行业和应用场景中人工智能训练数据的稀缺程度、人工智能模型的发展水平和市场竞争格局等差异，这种“一刀切”的做法可能导致一些意料之外的负面后果。相较而言，在普通法系下，法官根据具体情况对个案做出判断可能是一个更理想的制度选择。尽管中国并非普通法系国家，但中国法官仍可以在个案中做出灵活的指导。在监管模式选择上，中国应慎重立法，避免采用类似欧盟的立法模式。

*针对欧盟人工智能监管“一刀切”的问题，两位作者在Project Syndicate专门撰写批判性评论: The Case For Regulating Generative AI Through Common Law, http://tinyurl.com/ze7p9tzv

第二，在现有法律框架下，人工智能的治理方法应当充分考虑合理使用与可版权性之间的互动关系。例如，在美国版权法下，合理使用的适用范围相当广泛，人工智能模型训练可能大多落入其中。在训练数据稀缺的情形，再为人工智能生成内容提供全面的版权保护，很可能对人工智能的发展产生负面影响。因此，美国的法院和版权局对生成式人工智能内容的可版权性要求设定较高，也具有一定的合理性。在中国版权法下，尽管合理使用的适用范围非常狭窄，但实际上，现有大模型的训练基本遵循合理使用思路，没有向版权人支付费用。在这种情况下，再对人工智能生成内容实施版权保护，将进一步削弱人类自主创作的积极性，从而导致高质量训练数据的稀缺。从长远来看，这种做法可能对中国大模型的发展不利，同时也会导致社会福利降低。
第三，中国的相关监管者在借鉴他国经验时，应当考虑各国出发点的差异，从而决定最适合中国国情的制度设计。各国的法律制度设计受其具体的政策目标和优先事项影响。例如，中国和美国优先关注产业发展，尤其是人工智能的壮大。相反，欧盟由于没有强大的人工智能产业，更注重保障消费者和内容创作者。这些政策偏好的差异将直接影响各国最佳监管决策的选择。此外，在参考欧盟做法时，需要特别强调一点。作为一个超国家机构，欧盟成立的根本宗旨是建立统一的欧洲市场(a single market)。为实现此政策目标，欧盟主要依靠统一各成员国的法律。然而，这种统一的法律制度也缺乏灵活性，在很多情况下不利于人工智能的发展。因此，中国在借鉴欧盟的立法经验时需要特别谨慎。

来源： [url=]HKUCCL[/url]

链接：https://mp.weixin.qq.com/s/qRFzxFX22S6Rr0czJX513w

编辑：程正元

刘海明 · 发表于 2024-2-20 19:55:31

【案例】

国家版权局：2023年全国著作权登记总量同比增长40.46%

人民网北京2月20日电（记者任妍、车柯蒙）近日，国家版权局发布关于2023年全国著作权登记情况的通报。其中，2023年全国著作权登记总量达8923901件，同比增长40.46%。

据悉，2023年全国共完成作品著作权登记6428277件，同比增长42.30%。全国作品著作权登记量总体呈现大幅增长趋势，登记量较多的分别是：北京市1101072件，占登记总量的17.13%；山东省873826件，占登记总量的13.59%；福建省710648件，占登记总量的11.06%；中国版权保护中心493070件，占登记总量的7.67%；上海市412660件，占登记总量的6.42%。以上登记量占全国登记总量的55.87%。相较于2022年，河南、西藏、山东、福建、河北、江西、云南、青海的作品著作权登记量增长率超过100%；新疆、湖南、广西、内蒙古、辽宁、天津、吉林的作品著作权登记量增长率超过50%。

从作品类型看，登记量最多的是美术作品3296437件，占登记总量的51.28%；第二是摄影作品2501968件，占登记总量的38.92%；第三是文字作品329128件，占登记总量的5.12%；第四是影视作品118544件，占登记总量的1.84%。以上类型的作品著作权登记量占登记总量的97.17%。此外，还有录像制品42793件，占登记总量的0.67%；图形作品35547件，占登记总量的0.55%；音乐作品25766件，占登记总量的0.40%；录音制品19446件，占登记总量的0.30%；模型、戏剧、曲艺、建筑作品等共计5946件，占登记总量的0.09%。

2023年全国共完成计算机软件著作权登记 2495213件，同比增长35.95 %，登记数量和增速均创5年来新高。从各地区登记数量看，计算机软件著作权登记量较多的省（市）依次为：广东、北京、江苏、浙江、上海、四川、山东、湖北、安徽、陕西。上述地区共登记软件著作权约175万件，占登记总量的70%。其中，广东省登记软件著作权超过26万件，占登记总量的11%。

2023年全国共完成著作权质权登记411件，同比增长17.43%；涉及合同数量382个，同比增长31.27%；涉及作品数量2082件，同比增长36.88%；涉及主债务金额995817.4万元，同比增长82.82%；涉及担保金额985783.88万元，同比增长80.85%。计算机软件著作权质权登记361件，同比增长28.01%；涉及合同数量361个，同比增长28.01%；涉及软件数量2032件，同比增长39.85%；涉及主债务金额917149.06万元，同比增长148.30%；涉及担保金额907399.56万元，同比增长145.83%。作品（除计算机软件之外）著作权质权登记50件，同比下降26.47%；涉及合同数量21个，同比增长133.33%；涉及作品数量50件，同比下降26.47%；涉及主债务金额78668.34万元，同比下降55.13%；涉及担保金额78384.32万元，同比下降55.46%。

来源：人民网

链接：https://www.sohu.com/a/758884383_114731?scm=10001.1588_13-100000-0_8000.0-0.0.10095_0_6662&spm=smpc.channel_258.block8_93_Qq9dRe_1_fd.2.1708415109829P09EqLI_1090

编辑：程正元

刘海明 · 发表于 2024-3-27 20:10:17

【案例】违规使用新闻出版商数据训练大模型，谷歌在法被罚2.5亿欧

当地时间3月20日，法国竞争管理局（Autorité de la concurrence）发布公告称，由于谷歌公司在未经许可的情况下，使用法国新闻机构和出版商提供的内容训练其旗下人工智能服务Bard的基础模型，违反了欧盟版权法相关规定，决定对谷歌处以2.5亿欧元罚款。对此，谷歌回应称接受处罚，但对罚款金额提出质疑，认为监管机构忽略了其之前为满足各方需求付出的努力。

南都记者梳理发现，谷歌公司这场版权官司的起因可以追溯至2019年。据了解，彼时法国新实施的版权法要求，大型科技公司与新闻出版机构需就使用后者发布内容及支付报酬等事项达成协议，从而实现新闻机构、出版商、数字平台之间的平衡。面对以法新社为代表的多家新闻出版机构的投诉，2020年，法国竞争管理局要求谷歌在一定时限内与相关新闻出版机构展开谈判。
据悉，然而，谷歌对内容付费的做法表达了强烈不满，谈判宣告破产，并因此收到了法国竞争管理局开出的5亿欧元罚单，理由之一是谈判态度不够真诚。谷歌曾试图上诉推翻判决，但在2022年暂时妥协，与新闻出版机构达成和解协议。和解协议中作出的承诺有效期为五年，可延长一次。
法国竞争管理局公告显示，如今谷歌违反了与新闻出版机构达成的和解协议，其未能遵守七项承诺中的四项，包括秉承透明、客观和非歧视性原则在三个月内开展真诚的谈判；向新闻出版机构提供透明的相关报酬信息；采取必要措施，确保谈判不会影响谷歌与新闻出版商之间的其他利益关系等。
公告还特别指出，Bard使用新闻出版机构发布的内容训练其基础模型，却不告知这些机构及监管部门，也没有为新闻出版机构提供避免内容被使用的“选择退出”技术机制等，这些做法阻碍了新闻出版机构就报酬问题与其公平地展开谈判。于是，法国竞争管理局决定对谷歌、其母公司Alphabet以及两家子公司共处以2.5 亿欧元（折合人民币约19.6亿元）罚款。
公告发布当日，谷歌方面也发文作出回应，称接受这一处罚结果，但认为罚款金额不合理，原因是监管机构忽略了其在缺乏明确监管措施等不确定环境中为满足各方需求所付出的努力。“谷歌是第一个也是唯一一个与280余家法国新闻出版机构签署协议的平台，每年支付数千万欧元。尽管取得了这些进展，法国竞争管理局依然对谷歌处以2.5亿欧元罚款，原因只在于我们谈判的方式。”
南都记者梳理发现，AIGC的版权问题在全球范围内都一直饱受争议，相关侵权诉讼屡见不鲜。
今年1月，国内首例“AI文生图”侵权案已作出一审判决。案件中，原告利用开源AI工具生成图片并发布在小红书，被告未经许可使用该图片并删除原作者署名。北京互联网法院经审理认为，涉案图片符合作品的定义，属于作品；原告是涉案图片的作者，享有涉案图片的著作权；被告侵害了原告享有的权利，应当承担侵权责任。因此，法院判决被告赔礼道歉并赔偿原告500元。
据央视报道，去年12月，《纽约时报》指控OpenAI及其投资者微软公司未经授权使用其文章训练ChatGPT等聊天机器人，以创造替代《纽约时报》的产品。今年2月，OpenAI要求联邦法官驳回部分原告诉求，称《纽约时报》雇佣黑客操纵ChatGPT等人工智能系统生成“误导性证据”，目前该案尚未有定论。

来源：隐私护卫队

链接：https://mp.weixin.qq.com/s/taJbcDIIzS0tMUGDrY_v3g

编辑：程正元

刘海明 · 发表于 2024-4-4 20:07:46

刘海明 · 发表于 2024-4-4 20:10:11

刘海明 · 发表于 2024-4-4 20:12:53

【案例】

鲁迅在上海时曾用笔名

编辑：李梦瑶

刘海明 · 发表于 2024-4-8 17:29:29

【案例】

苹果从Shutterstock获数百万张图片授权，训练其人工智能模型

苹果公司已经达成一项协议，从Shutterstock获得数百万张图片的授权，以训练其人工智能模型。

其他科技公司也从Shutterstock获得了类似的协议，帮助开发视觉人工智能引擎，包括谷歌、Meta和亚马逊。苹果在2022年底签署协议后很久才有消息传出，预计苹果将为此付出高达5000万美元的费用。

此前有消息称，苹果与多家出版商就使用新闻文章内容进行类似的人工智能大语言模型(LLM)培训进行了谈判。据称，康泰纳仕IAC（Conde Nast IAC）和美国全国广播公司(NBC)等大型媒体公司一直在与苹果公司就其内容的授权进行谈判。

苹果公司预计将在今年6月的全球开发者大会上发布一些关于在其操作系统中加入更多人工智能技术的重大声明。尽管苹果在人工智能整合方面经常被认为落后于竞争对手，但它自己也进行了一些创新。

在过去的一年里，苹果设备用户可能已经注意到苹果“机器学习”技术的小幅改进。机器学习是指通过不断将新数据纳入现有的统计模型，从而提高自身设备性能的过程。例如，预测文本在适应特定用户偏好的词汇方面已经稳步提高了准确性，Siri也提高了翻译常用短语的能力。据传，苹果的下一代处理器将包括更强大的神经引擎。

苹果全球营销高级副总裁格雷格·乔斯维亚克（Greg Joswiak）在社交媒体上打趣说，下一届WWDC大会将“绝对不可思议”，暗示大会将重点关注iOS 18和其他苹果操作系统中添加的人工智能功能。

此前Gurman预测，苹果新发布iOS 18将使用生成式AI技术，显著提高Siri和Messages应用的问答和自动补全句子方面的能力。他还表示，苹果还在探索将生成式人工智能功能应用于其平台上的其他应用，包括Apple Music、Pages、Keynote和Xcode。

另外据The Information报道，苹果计划将大规模的语言模型集成到Siri中，以允许用户自动执行复杂的任务。这一功能将与快捷方式应用进行更深入的整合。这一功能预计将出现在2024年发布的iPhone软件更新中，很可能是iOS 18。

苹果公司首席执行官蒂姆·库克最近透露了该公司对人工智能(AI)的高度关注，暗示今年下旬将公布重大进展，可能是在备受期待的iOS 18更新中增加生成式AI。

苹果在使用人工智能技术方面面临的最大挑战是维持其用户隐私标准，这是其他使用人工智能的大型科技公司不关心的问题。苹果最近透露，它打算开发能够尽可能多地使用设备上技术的大型语言模型。

来源：SevenTech（公众号）

链接：https://mp.weixin.qq.com/s/kZuqppbBEF_3gOqNAiMObg

编辑：王晨雅

帐号		自动登录	找回密码
密码			实名注册