人工智能与新闻业案例集锦

刘海明 · 发表于 2024-2-21 21:00:00

【案例】

编辑：程正元

刘海明 · 发表于 2024-2-21 21:13:51

【案例】

视频记者的工作会被Sora代替吗？

文｜魏圆来源｜庖丁解news
“我们一直在说，传播业已经发生了‘视觉转向’（a visual turn），但ChatGPT、Midjourney、 Stable Diffusion 和Sora似乎告诉我们，文字是一切媒介之母。影视业和短视频从业者仍然不能抛弃文字，而要精通文字表达。”

去年，ChatGPT横空出世，让文字记者颤抖不已，直呼“饭碗不保”。

今年，沉浸在过年喜悦氛围中还没缓过神来的视频记者，就被OpenAI最新推出的AI文（图）生视频模型Sora给了“当头一棒”——

通过简单的文本指令，Sora就可以直接输出长达60秒的视频，不仅背景细致入微，而且包含了复杂的多角度镜头和富有情感的多个角色。

file:///C:/Users/Dell/AppData/Local/Temp/ksohtml8672/wps1.png

对此，复旦大学新闻学院教授、博士生导师邓建国表示，“视频记者”这四个字中重要的不是“视频”而是“记者”。

新闻报道追求真实（facts），而Sora全是虚拟（fictional），因此它从本质上对新闻业只有坏处没有好处。它唯一可以被新闻业利用的也许是建构在新闻事实基础上的情景再现。

▍突破性：Sora是向着元宇宙方向的迈进

相较于Runway Gen 2、Pika等还在突破几秒内连贯性、单镜头生成的AI视频工具，Sora已经可以生成60秒一镜到底的视频。

在OpenAI发布的示例中，视频中的女主角及背景人物栩栩如生、细节丰富，各种镜头随意切换，人物都保持了稳定性，Sora的AI视频效果几乎和人工拍摄不相上下。

“Sora可以基于一段文字、图片和视频提示（prompt），理解它并根据相应的物理原理在时空上向过去或未来推演，因此而形成60秒钟的视频。”邓建国表示，Sora不是一些人所说的“导致了物理原理的消失”，而是证明了物理原理的强大。

也正是因为这一能力，Sora被称为“世界模型”（world model）或者“世界模拟器”（world simulator），因为它具有根据已有信息建模出一个未来可能的世界的能力。

邓建国进一步指出，我们此前用文字建构世界，比如曹雪芹用美轮美奂的文字建构了“大观园”，我们通过自己的想象力对其进行可视化；今天同样用文字，我们则可以用技术对其进行可视化。

Sora 所基于的技术，如芯片算力、算法以及图形渲染引擎Unreal Engine 5等，都是建设元宇宙的基础设施，因此Sora是向着元宇宙方向的迈进。

▍冲击性：视频记者不必瑟瑟发抖

如果说ChatGPT是语言大师，那么Sora则是一个多模态数据的通才。

有学者提出，Sora的出现将深刻影响10个行业，包括短视频行业、影视行业、游戏行业、广告行业、教育行业、电商行业、制造业、科学研究、建筑行业、艺术创作行业等。

在人才培养方面，邓建国预测，Sora将对大学影视专业的人才培养形成较大的冲击。

中国人民大学吴玉章讲席教授、国家发展与战略研究院研究员刘永谋在《新京报》评论撰文认为，短视频时代，Sora既然可与人工媲美，制造短视频的专门团队可能就面临下岗危险。要知道，短视频的摄影、导演、剪辑等任务，Sora“一个人”费点电就全包了。

对于媒体而言，不少视频记者担心自己的工作会被Sora代替。

“‘视频记者’这四个字中重要的不是‘视频’而是‘记者’。如果记者没有脚力、眼力、脑力和笔力，而仅仅满足于坐在空调房里进行网络内容搜索、编辑和发布，这样的记者在任何时候都不具备不可替代性。”

与此同时，邓建国也表示，目前Sora生成的视频还不能做到完全真实，有的细节破绽用肉眼可以识别，有的通过AI能识别，所以创作者如何使用文字精确地控制视频的细节和效果，目前还有待Sora迭代发展。

“我们一直在说，传播业已经发生了‘视觉转向’（a visual turn），但ChatGPT、Midjourney、 Stable Diffusion 和Sora似乎告诉我们，文字是一切媒介之母。影视业和短视频从业者仍然不能抛弃文字，而要精通文字表达。”

▍危险性：警惕深度造伪风险

图文时代，都说“有图有真相”，结果发现图可以P；到了视频时代，又有人说“有视频有真相”，结果现在视频也可以AI生成了。

最近美国巨星Taylor Swift就被深度伪造色情内容而引发舆论关注，X（原名“Twitter”）也被迫禁止用户对她名字的检索。

“过于逼真的AI视频很有可能会造成假新闻泛滥，给新闻伦理和新闻治理带来巨大挑战。”邓建国表示，人工智能技术被用于多模态的内容生产（AIGC）可以降本增效，但同时也引入了深度伪造的风险。

“新闻报道追求真实（facts），而Sora全是虚拟（fictional），因此它从本质上对新闻业只有坏处没有好处。我想，它唯一可以被新闻业利用的也许是建构在新闻事实基础上的情景再现。”

“让事情更为棘手的是，从平台算法开始到现在的人工智能，由于涉及到海量数据、极为复杂的算法，以及众多用户与ChatGPT及Sora的个性化互动，即使是人工智能专家也无法精确预测和解释人工智能给出的每一个输出背后的原因，这给对AI的规制带来了前所未有的挑战。”

邓建国表示，从文字开始，媒介技术就是生产复制品（化身、幻影、鬼魂）的工具，所以我们要从技术生产者、政策制定者、新闻媒体、教育机构和用户等多方面共同规制AIGC。

参考文章：《Sora一夜刷屏，这只是开始！》作者：胡炜

发布平台：新京报传媒研究

来源：广电独家

链接：https://mp.weixin.qq.com/s/sKlwzyHoU-O3ZAATlY9mOQ

编辑：程正元

刘海明 · 发表于 2024-2-22 21:08:50

【案例】

编辑：程正元

刘海明 · 发表于 2024-2-23 21:42:52

【案例】OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman) 终于承认人工智能行业正在走向能源危机！

来源：https://www.nature.com/articles/d41586-024-00478-x

作者：By Kate Crawford

上个月，OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman) 终于承认了研究人员多年来一直在说的——人工智能 (AI) 行业正在走向能源危机。这是一个不寻常的承认。

在瑞士达沃斯举行的世界经济论坛年会上，奥特曼警告说，下一波生成型人工智能系统消耗的电力将远远超出预期，能源系统将难以应对。

“如果没有突破，就不可能实现这一目标，”他说。

自从我在 2018 年开始发表有关人工智能行业环境成本的文章以来，我看到人们一直在淡化和否认人工智能行业的环境成本。

Altman 的承认让研究人员、监管机构和行业巨头开始谈论生成式人工智能对环境的影响。

那么奥特曼指望实现什么能源突破呢？不是设计和部署更可持续的人工智能系统，而是核聚变。

他也参与了这场游戏：2021 年，Altman 开始投资位于华盛顿埃弗里特的核聚变公司 Helion Energy。

大多数专家都认为，核聚变不会对本世纪中叶应对气候危机的脱碳这一关键目标做出重大贡献。

Helion最乐观的估计是，到2029年，它将产生足够为40,000个美国普通家庭供电的能源；

一项评估表明，OpenAI 在加利福尼亚州旧金山创建的聊天机器人 ChatGPT 已经消耗了 33,000 个家庭的能源。

据估计，由生成式人工智能驱动的搜索所消耗的能量是传统网络搜索的四到五倍。几年之内，大型人工智能系统可能需要与整个国家一样多的能源。

这不仅仅是能源。生成式人工智能系统需要大量淡水来冷却处理器并发电。在爱荷华州西得梅因，一个巨大的数据中心集群为 OpenAI 最先进的模型 GPT-4 提供服务。

当地居民的一项诉讼显示，2022 年 7 月，即 OpenAI 完成模型训练的前一个月，该集群使用了该地区约 6% 的水。根据谷歌和微软的环境报告，随着谷歌和微软准备他们的 Bard 和 Bing 大型语言模型，这两个模型的用水量都出现了大幅增长——在一年内分别增加了 20% 和 34%。

一份预印本表明，到 2027 年，全球人工智能对水的需求可能是英国的一半。在另一份预印本中，Facebook 人工智能研究人员将该行业追求规模的环境影响称为“房间里的大象”。

我们现在需要的不是白日梦技术，而是务实的行动来限制人工智能对生态的影响。

没有理由不能做到这一点。该行业可以优先考虑使用更少的能源，建立更高效的模型，并重新考虑如何设计和使用数据中心。正如法国 BigScience 项目以其 BLOOM 模型所展示的那样，可以构建与 OpenAI 的 GPT-3 大小相似且碳足迹低得多的模型。但整个行业的情况并非如此。

获得准确、完整的环境影响数据仍然非常困难。生成式人工智能的全部全球成本是严格保密的企业机密。数据来源于 Emma Strubell和Sasha Luccioni等研究人员的实验室研究；有限公司报告；以及地方政府公布的数据。目前，公司几乎没有动力做出改变。

但立法者终于注意到了这一点。2月1日，以马萨诸塞州参议员埃德·马基为首的美国民主党提出了《2024年人工智能环境影响法案》。该法案指示国家标准与技术研究所与学术界、工业界和民间社会合作，制定评估人工智能环境影响的标准，并为人工智能开发商和运营商创建自愿报告框架。该立法是否会通过仍不确定。

自愿措施很少能产生持久的问责文化和一致采用，因为它们依赖于善意。鉴于紧迫性，还需要做更多工作。

要真正解决人工智能对环境的影响，需要采取多方面的方法，包括人工智能行业、研究人员和立法者。在工业领域，可持续实践势在必行，并应包括测量和公开报告能源和水的使用情况；优先发展节能硬件、算法和数据中心；并仅使用可再生能源。独立机构的定期环境审计将支持透明度和对标准的遵守。

研究人员可以优化神经网络架构以实现可持续性，并与社会和环境科学家合作，指导技术设计实现更大的生态可持续性。

最后，立法者应该同时提供胡萝卜和大棒。首先，他们可以设定能源和水的使用基准，激励可再生能源的采用，并强制要求进行全面的环境报告和影响评估。《人工智能环境影响法案》只是一个开始，但还需要更多的努力。

来源：书上的蜗牛

链接：https://mp.weixin.qq.com/s/eJHu9vNjPbE6GH0OXH-SDQ

编辑：程正元

刘海明 · 发表于 2024-2-24 20:10:52

【案例】中国首部！文生视频AI系列动画片《千秋诗颂》启播，中央广播电视总台人工智能工作室揭牌

2月23日，中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式举行。中宣部副部长、中央广播电视总台台长慎海雄出席，并与中国工程院院士、清华大学信息科学技术学院院长、中国人工智能学会理事长戴琼海为总台人工智能工作室揭牌，和嘉宾共同为节目启播。

中央广播电视总台综合频道牵头策划的系列动画片《千秋诗颂》，聚焦国家统编语文教材200多首诗词，依托中央广播电视总台“央视听媒体大模型”，运用AI人工智能技术将国家统编语文教材中的诗词转化制作为唯美的国风动画。节目首批推出《咏鹅》等六集诗词动画，沉浸式再现诗词中的家国情怀和人间真情，让更多的人尤其是青少年，感受中华文脉的勃勃生机和独有魅力，在内心根植深厚的文化自信。

中央广播电视总台编务会议成员姜文波在致辞中表示，总台成立六年来，坚持向科技创新要生产力，持续深化“思想+艺术+技术”融合传播，4K/8K频道、“百城千屏”和央视频、央视新闻等新媒体平台快速发展。总台媒体科技水平在全球媒体竞争中的优势地位不断巩固，成功走出一条高质量发展之路。创新关乎命运，科技引领未来。生成式人工智能给媒体发展带来严峻挑战的同时，更是千载难逢的重大发展机遇。中央广播电视总台将按照习近平总书记重要指示精神，紧紧抓住科技创新这一关键变量，用科技赋能中华优秀传统文化创造性转化、创新性发展，生产出更多的令人耳目一新、观之折服的精品力作，让总台在全球媒体竞争中始终保持领先地位。

活动上，中央广播电视总台牵头发起成立“央视听媒体大模型”研发共同体，通过开放平台与国内一流的科研机构、高校和企业在科研攻关、需求应用、安全发展、产业生态等方面加强合作，联动产业链上下游，运用生成式人工智能技术为视听媒体科研创新提供支持，打造新质生产力，助力总台高质量发展。

为加快AIGC核心技术研究和创新应用开发，中央广播电视总台人工智能工作室正式揭牌。工作室将整合总台广播电视和新媒体媒资平台资源，按照节目制作需求对“央视听媒体大模型”进行训练，使之快速形成具备针对特定业务的能力，打造视听节目创新创作的大平台。

《千秋诗颂》是首部以我国自主AIGC技术支撑制作的系列动画片，基于总台提供的丰富视听数据进行模型训练，综合运用可控图像生成、人物动态生成、文生视频等最新技术成果，支持了从美术设计到动效生成，再到后期成片的各个环节。在生成式人工智能技术的加持下，《千秋诗颂》高度再现了中国古诗词中的人物造型、场景和道具，呈现了一部将中华古典诗词的博大精深与现代视听艺术相结合的动画作品。节目将于2月26日在总台央视综合频道（CCTV-1）首播，央视频、央视网同步上线。

央视一套

中央广播电视总台、教育部、科技部相关部门负责人，清华大学、北京大学、上海交通大学、人民教育出版社、上海人工智能实验室等有关部门负责同志，以及华为、科大讯飞、智谱AI等企业代表参加活动。

来源：全媒体采访与写作

链接：https://mp.weixin.qq.com/s/px-C9t9UIBCG3LIrNHM0qw

编辑：程正元

刘海明 · 发表于 2024-2-26 23:14:17

Sora“内测”提前开放！好莱坞导演急撤掉8亿美元摄影棚
报人刘亚东 2024-02-26 19:07 内蒙古

来源：新智元
作者：新智元

新智元报道
【新智元导读】刚刚，Sora第二波视频放出了！稳定的一致性和模拟现实的逼真度，简直让人惊掉下巴。在好莱坞，已经有导演撤掉自己的8亿美元工作室扩建计划了。
就在昨天，Sora又有全新「神作」炸出了！
两位Sora作者，Bill Peebles、Tim Brooks纷纷甩出全新图片。（顺便还秀了一把基友情？）
「一只小熊猫和一只巨嘴鸟是最好的朋友，在蓝色时刻漫步在圣托里尼岛」，Peebles称这个场景简直就和两人走到[color=var(--weui-LINK)][url=]OpenAI[/url]办公室的画面一模一样。

a red panda and a toucan are best friends taking a stroll through santorini during the blue hour

这个视频的连贯性简直令人惊呼：在每一帧中，小熊猫和巨嘴鸟的形象始终保持着一致性。
当然仔细看还是有不少破绽。比如小熊猫的腿有时会交织在一起，画面看起来更像卡通图像，而不像逼真的现实世界。
但总的来说，这种视频质量已经足以让我们对AI视频的未来放飞想象。
有网友立刻做出了配音版，贴切的配音一出，视频更有那个味儿了！

难怪好莱坞大导Tyler Perry直言，自己在看完Sora制作的视频后，直接搁置了自己影师工作室8亿美元的扩建计划！
更多「神作」来袭
这次两位作者放出的第二批视频，效果更加逼真、更加炸裂。

网友们接连不断发出惊叹：Sora是怎么做到一次比一次迭代得更好的？
这个视频是「一名潜水员发现了一艘隐藏的未来沉船，里面有控制论海洋生物和先进的外星技术」。

a scuba diver discovers a hidden futuristic shipwreck, with cybernetic marine life and advanced alien technology

潜水员、海底景观、沉船外壳、内部的外星技术都生成得十分逼真。
当然，这个场景也不是100%完美。立刻有人发现破绽——
比如，潜水员没有摆动脚蹼就能游动起来，也没有吐出气泡。

一位好莱坞电影制片人吐槽说：人的动作看起来没有灵魂，有些像僵尸。

但对于不那么挑剔的观众，这个20秒视频的质量已经够了。

有人满意地说：看起来像《深海迷航》的高分辨率版本
在以往，这个场景无疑要耗费巨资。而现在，好莱坞大片中烧金的高难度场景，都可以用Sora视频替代了，AI淘汰影视行业真不是说说而已！
这条闪着珠光的银色鳞片、有着冰蓝的眼睛和象牙龙角、吐出白气的小白龙，也让网友们惊呼，太太太震撼了！

Close-up of a majestic white dragon with pearlescent, silver-edged scales, icy blue eyes, elegant ivory horns, and misty breath. Focus on detailed facial features and textured scales, set against a softly blurred background

它的拟人化做得很好，眼睛水汪汪的，传达了非常动人的情感，仿佛能听懂人话一样。
《[color=var(--weui-LINK)][url=]权力的游戏[/url]》中的巨龙，是这样的。跟它比起来，小白龙的差距并不太大。
有的网友表示，自己对这条小白龙爱不释手，直接给它配了个音——

现实场景，是给Sora最难的考题。
下面这个「一个男人在夏威夷热带水域上空定点跳伞，宠物金刚鹦鹉在旁边飞翔」的视频，Sora再次交出了让人印象深刻的答卷。

a man BASE jumping over tropical hawaii waters. His pet macaw flies alongside him

场景如此逼真，直接有人发问：「是真的视频还是AI做的？」

配上音后是这样的，就问会有多少人发现——这并不是真实的场景？

如果非要找茬，就是金刚鹦鹉的照明不太对，看起来像是单独做出来的动画，并不像自然条件下的光照。

定点跳伞的动作生成得不够准确，降落伞太小。

下面是一只玻璃乌龟，裂缝用金繕工艺修复，在日落时分走在黑色的沙滩上。

画面的一致性很完美，沙子的物理学特性也完全还原出来了。
不过美中不足的是：乌龟似乎只有三条腿？😂

也有人发现「华点」：把沙丘做出崎岖不平的样子，是为了让海龟爬过沙丘后不会留下痕迹吗？

相比之下，Midjourney生成的玻璃乌龟是这样的，别有一番风味。

精美的纸艺世界中的一艘船，海面还有海洋动物跃出。

in a beautifully rendered papercraft world, a steamboat travels across a vast ocean with wispy clouds in the sky. vast grassy hills lie in the distant background, and some sealife is visible near the papercraft ocean's surface

黑暗的霓虹灯雨林里，闪耀着奇幻的动植物。

a dark neon rainforest aglow with fantastical fauna and animals

不过对于这个视频，也有人挑刺说：「这是我见过的Sora最差的demo，它不知为什么就生成了矢量动画的风格。」
一只戴着眼镜的猫，出现在20世纪60年代谍战电影中。

cat in glasses in a 1960s spy movie

黄昏时分，一只巨大的半透明水母优雅地飘浮在荒芜的城市中，还是用35毫米胶片拍摄的超现实场景。

A surreal scene unfolds as a giant, translucent jellyfish floats gracefully through a deserted cityscape at dusk. The scene is shot on 35mm film

这是一个精心制作的立体模型：江户时代，木结构建筑前，一个孤独的武士慢慢穿过小镇。

A meticulously crafted diorama depicting a serene scene from Edo-period Japan. Traditional wooden architecture. A lone samurai, clad in intricate armor, walks slowly through the town

一只戴着护目镜的小胖哈巴狗，坐在一辆旧摩托车旁边的凳子上。
仔细看可以发现，狗肚子一呼一吸的样子，显得非常真实。

a small chubby Pug dog in goggles is sitting on a stool next to an old motorcycle

一只棕色边牧戴着太阳镜，滑着滑板。

a brown and white border collie stands on a skateboard, wearing sunglasses

可怕的事来了，有人在底下留言称，棕色边牧是自己的狗，这个视频是自己拍的。
而我们，竟有那么一刻恍惚了：他说的究竟是真是假？

总之，网友们迫不及待等待公测了。
还有人给Sora出了神考题——「一部手机正在直播进入黑洞的过程」。

网友猜测：虚幻引擎被用来生成部分数据集？
随着这些视频被放出，网友们心中的疑问也越来越强烈——
Sora模型究竟是用什么数据训练的？

不少网友也觉得，怎么Sora生成的画面，看起来有些似曾相识？仿佛就是直接用虚幻引擎做出来的一样。

随后，越来越多人公认：Sora训练的数据集，应该就是用UE产生的。

其实，在Sora刚诞生时大佬就纷纷预测——Sora是由游戏引擎提供支持的。
Pytorch联合创始人Soumith Chintala就这样认为。
数据科学家和机器学习工程师Ralph Brooks也给出了自己的分析：

如果要创建大量不同角度的高清视频，就需要进行模拟。其中，有很多线索让我相信，UE5在一定程度上就是用来创建训练数据的。

比如这段广为人知的樱花漫步视频中，人物移动的方式跟UE5中非常相似。现实中的人走路是不会用恒定速度的。

英伟达高级科学家同样表示，「如果Sora接受过大量UE5合成数据的训练，我不会感到惊讶的！」

当然，它可能没有明确调用UE5，但非常有可能将UE5生成的文本、视频对作为合成数据，添加到训练集中。

早有预言帝猜中，Sora的推理管道是用的CLIP底座、文本转3D对象，和游戏引擎模拟。

果然，「人工训练数据耗尽」不会阻止LLM的发展，合成数据才是AI的未来！

「精简版」体验，就藏在技术报告里！
网友们看到这些一代比一代强的demo，已经心痒难耐了。
好消息是：虽然Sora还没有正式开放功能，但在技术报告里，已经可以小体验一把了！

报告地址：https://openai.com/research/vide ... as-world-simulators
通过选择不同的关键词，比如人物、衣着、天气环境、地理位置等选项，就可以体验Sora生成的不同视频。
这样我们就可以看到——a穿着b样子的衣服，在c地点的d天气下，惬意地散步。

好莱坞大佬直言很害怕，影视行业真完蛋了？
这也难怪，好莱坞知名导演、制片人、演员Tyler Perry因为Sora，决定搁置自己亚特兰大工作室耗资8亿美元的扩建计划。

本来，Perry导演在过去四年里，一直计划斥资8亿美元扩建自己的工作室，为占地330英亩的土地增加12个摄影棚。
然而，在2月16日看过Sora做出的视频后，他决定撤销自己的8亿美元计划，因为他拍摄的大片中，可能并不需要找取景地，或者搭建实景了。
「以前，我们只是被告知AI可以做这些事，但是真的看到它做出来的场景，还是太令人震惊了！」

Perry导演表示，因为Sora给自己带来的冲击太过强烈，8亿美元扩建计划已被无限期推迟。
现在，拍电影时再也不需要亲自前往拍摄地点了。
不论是想要科罗拉多的雪地场景、月球上的场景，还是山中客厅中拍摄两个人的场景，都再也不要搭建真实布景，只要在办公室的电脑上，就能完成一切！
而这也就意味着，巨大的变化将波及行业的每一个角落，影响到演员、灯光、运输、音效和剪辑等所有从业者的饭碗。
现在，Perry导演已经在两部电影中的现场拍摄和后期制作中使用了AI，避免了耗费数小时给演员画老年妆。
Sora的出现彻底改变了游戏规则。
在以往，HBO的试播可能需要耗资1500万、2000万乃至3500万美元，而现在，这个成本低到不可想象。公司显然会选择成本更低的方案。
在不远的将来，很多工作岗位都会消失。
影视行业该建立怎样的安全防护措施，保住大家的饭碗？

参考资料：
https://www.hollywoodreporter.co ... i-alarm-1235833276/
https://twitter.com/JMT3/status/1761443473218240558
https://twitter.com/_tim_brooks/status/1761236971186438178
https://twitter.com/model_mechanic/status/1761198301482021084

来源：新智元（公众号）
链接：https://mp.weixin.qq.com/s/JLQSUSAWqQaxl418shwQNw
编辑：李梦瑶

刘海明 · 发表于 2024-2-28 21:18:35

“全球AIGC版权侵权首判”留下的三个问题

生成式人工智能长期以来面临版权争议，一方面，此类人工智能的训练数据为文字、图片、视频等在传统上受版权保护的作品内容；另一方面，AICG的文学艺术表现力愈发接近人类创作的水准。人工智能大模型的出现加剧了此类争议：在预训练阶段，大模型以无监督的方式广泛获取各类型的版权内容，高质量的内容还能在监督微调阶段激发模型能力，更强大的模型则能够在简单的指令下生成更为“逼真”的内容。不论是文本、图像甚至视频，大模型生成内容的能力都发展到了惊艳甚至让人惊讶的程度，也让历经技术变革的版权制度再次面临诸多挑战。

作为回应，北京互联网法院在2023年11月率先做出裁判，认定用户使用提示词通过扩散模型生成的图片受版权保护，也是我国首例由司法判定人工智能“文生图”受版权保护的案例。而在2024年2月8日，广州互联网法院率先回应AIGC版权侵权问题，实现了“全球首判”。

近期大洋彼岸纽约时报版权人等也以侵犯版权为由起诉OpenAI和微软，繁杂的证据、多样的诉求、巨额的赔偿要求引发了全球热议。相比之下，广互案案情比较简单。此案原告为奥特曼系列作品的版权独占授权人（版权人为日本圆谷制作株式会社），被告通过PI接口调用大模型服务，用户通过输入提示词“生成奥特曼”即显示和奥特曼形象一致的图片，也可生成包含奥特曼局部特征或具有特殊风格（如插画风）的图片。

法院认定被告侵权，AIGC生成和奥特曼类似的图片构成违法“复制”，基于奥特曼元素的AIGC再创作构成违法“改编”。被告被判令要求停止生成侵权图片，即用户正常使用与奥特曼相关的提示词，不能生成与案涉奥特曼作品实质性相似的图片。因被告未实际进行模型训练，法院没有支持删除训练数据的诉求。在计算损害赔偿方面，判决认定被告存在过错，原因是被告未按照《生成式人工智能服务管理办法》要求建立投诉举报机制，未对潜在风险进行提示，缺乏对生成内容的显著标识，判令被告赔偿原告损失合计10000元。

判决虽然认定调用API接口生成实质性相似的图片侵犯了原作品版权人的复制权和改编权，但受限于被告并非模型训练者，而仅仅提供图片生成服务这一事实，判决留下了三个未解决的问题。

一、能否从合理使用角度回应AIGC技术带来的版权侵权挑战法院从最终生成图片的结果“近似”推导出AIGC对原作品进行了“复制”，但扩散模型对原始图像的“还原”或“再现”与版权法长期以来禁止的直接“拷贝”式的复制差异明显。此外“改编”在传统版权法含义里指的是利用原作品进行的“再创作”，有先后的顺序之分，但在AIGC技术中并没有此类差别。对此法院并未回应AIGC技术带来的核心差异，以及此类技术是否构成合理使用（包括转换性使用）。目前大模型生成能力愈发强大，一方面在各类场景中用户期待模型能够生成更为逼真的图片，而另一方面AIGC侵犯版权的风险依然普遍存在，对于各方期待的通过合理使用制度进行平衡，本案并没讨论。

二、在生成内容侵犯版权的情况下是否应当删除训练数据判决不支持删除训练数据的原因是被告为AIGC服务提供者而不是大模型开发者，不涉及模型训练。但是判决并没有直接否定删除训练数据的可能性，在判决中也强调提示词阻断不能完全消除侵权图片的生成。值得指出的是，采用此前数字内容平台版权保护常用的“侵权通知-删除”规则并不适用与大模型输出内容的管理。大模型训练数据规模庞大、来源多样，判断所有数据的版权合规性难度很大，而且大模型版本往往经过多次迭代，模型的使用基本脱离了原始训练数据，删除原始数据的手段并不能解决输出端的版权侵权问题。

三、AIGC服务提供者的版权注意义务为什么和人工智能合规责任相关判决认定被告的“过错”时，援引的并非版权法的规定，而是认定被告没有按照《生成式人工智能服务管理暂行办法》建立投诉举报机制，未对潜在风险进行提示，缺乏对生成内容的显著标识，从而构成版权法意义上的“过错”。然而《暂行办法》核心在于要求提供者承担内容管理责任，保护用户的合法权益，其出发点并不是把提供者作为“平台”，要求其按照避风港规则处理版权人的保护请求。而从《深度合成服务管理规定》开始建立的人工智能生成内容水印和标识制度，也并未在本意上用于识别、追踪和保护版权作品。判决将版权注意义务和人工智能合规责任混同，其内在原因和适用边界还待进一步探讨。

总体来看，大模型研发投入大、迭代快、竞争强，在多模态发展的关键阶段亟需稳定、可预期的制度环境，扩大模型数据供给，降低模型数据合规压力。本判例适用范围有限，也未能解决各方关注的大模型版权侵权中的核心问题。如何平衡用户对AIGC更准更真的实际需求和版权保护的要求，应当采取哪些更为合理的手段控制侵权内容生成，以及怎么界分AIGC服务提供者版权责任和其他合规义务，还期待进一步的探讨和澄清。

来源：阿里研究院（公众号）
链接：https://mp.weixin.qq.com/s/CJkKEi7U2GfTNnF8MI6MaQ
编辑：李梦瑶

刘海明 · 发表于 2024-2-28 22:02:44

多家电视台成立人工智能工作室，都有哪些打算

近日，中央广播电视总台、上海广播电视台、成都市广播电视台纷纷举行人工智能工作室揭牌仪式，标志在人工智能领域的探索和实践驶入“快车道”。

据了解，中央广播电视总台人工智能工作室将整合总台广播电视和新媒体媒资平台资源，按照节目制作需求对“央视听媒体大模型”进行训练，使之快速形成具备针对特定业务的能力，打造视听节目创新创作的大平台。

上海广播电视台挂牌成立“生成式人工智能媒体融合创新工作室”。工作室将重点布局文化传媒领域人工智能重大应用场景建设，加快推进人工智能大视听垂类模型的研发应用，推动基于AIGC的沉浸式、交互式视音频内容生成的示范应用，开展面向传媒文化类的AIGC内容生成范式探索。工作室确立了财经媒体专属AI大模型、新闻资讯类大模型应用、智能语音和大语言模型应用、智能手语数字人、生成式智能与多媒体通信、人工智能应用下的传媒伦理研究等六大重点攻坚方向，著力推动传媒领域语料数据库的共建共享，推动数据处理工具的开发与维护，编制大模型传媒语料数据地方标准，发布传媒领域高质量语料数据集，加强人工智能媒体融合领域的理论研究和人才培养，助力上海打造人工智能世界级产业集群。

成都市广播电视台“AIGC创新应用工作室”举行了首期培训会。工作室将采取“项目驱动、团队协作、创新引领”的工作机制，计划于2024年系统推出涵盖主题创新报道、AI动画、AI城市宣传片、AI短剧等系列广电AI内容。还将积极开展多种形式的人工智能社会实验，以数字文化全力助推新型智慧城市建设。

来源：传媒见闻（公众号）

链接：https://mp.weixin.qq.com/s/RSG2maFYrHM_dCHF_2s0IQ

编辑：李梦瑶

刘海明 · 发表于 2024-2-29 22:44:22

影响几何？会挤占市场但也能辅助生产——Sora引发的“出版四问”系列报道之一

　　编者按

　　输入简短的文字便能生产“大片”级别的视频。美国开放人工智能研究中心（OpenAI）近日发布的文生视频模型Sora震惊全球。

　　前有ChatGPT，后有Sora，突飞猛进的AI热潮席卷各行各业，出版业也被裹挟向前。AI对出版业影响几何？能否替代现有职业？带来哪些问题和风险？我们该如何应对？即日起，《中国新闻出版广电报》推出Sora引发的“出版四问”系列报道，试图求解。

　　“全网疯传，全球热议，想不知道都难。”近日，文生视频模型Sora生成的60秒高清流畅视频震撼发布，效果炸裂。在回答《中国新闻出版广电报》记者提出的“你是怎样知道Sora的”这一问题时，华侨大学副校长、北京师范大学数字出版研究院执行院长万安伦这样调侃。

　　多位出版人表示，Sora对出版业的影响没有ChatGPT大，它直接冲击的是影视、动画、广告行业。辩证来看，Sora在对出版市场造成一定冲击的同时，也将会引发出版业生产方式的变革，其中融合出版受影响最大。

　　或挤压出版市场空间

　　“打败你的，往往不是你的对手，而是来自行业外的跨界者。”循着这样的思路，多位出版人居安思危，提出Sora将对出版业造成一定冲击的观点。

　　人民交通出版社总编辑陈志敏对人工智能发展一直保持高度关注，他有这样的忧虑：Sora等人工智能生成的内容可能会降低市场对传统出版物的需求，并可能会对传统出版物的质量和价值产生挑战。

　　上海教育出版社副社长刘芳也提出，从早期的BBS（网络论坛）到微博、微信公众号，再到目前的以短视频为代表的“类出版”，知识生产和发布方式越来越方便和快捷，读者的注意力和时间留给纸质阅读的会越来越少。她不无忧虑地说：“如果Sora之类的人工智能广泛应用，优质短视频等‘类出版’的生产方式将带来革命性的提升，内容发布周期短、审核相对宽松的优势将更为显著，出版业靠书号等准入门槛而带来的行业‘护城河’可能越来越脆弱。”

　　不仅是传统出版人，数字出版人亦有这样的担心。数传集团常务副总裁温亚莉直言：“Sora等人工智能技术带来海量、免费、优质的内容，将直接挤占图书的生存空间。”

　　北京童立方文化品牌有限公司董事长杨文轩认为，Sora这种多模态的人工智能不仅会挤占纸质图书市场，就连数字图书也会受到巨大挑战，“数字图书也是以文本形式存在，只是没有印在书上”。他由此提出“范式变革”的概念，“我们几千年来用文本的形式进行知识和信息传播的方式将改变，出版业的产品形态会发生变化，我们的产品不只是书。”

　　将改变内容生产方式

　　传统的出版业主要依赖于文字和图像来传达信息，而Sora则可以通过生成高质量的视频内容来提供更加生动、直观的阅读体验，这将使得出版业在内容创作方式上发生变革。中国出版集团公司党组成员、中国出版传媒股份有限公司副总经理于殿利就认为，Sora将进一步推动内容创作的多元化和多形态展现，为出版行业提供更多的内容创作手段，同时也会进一步带动市场对于视频内容的需求。

　　“Sora生成视频的便捷、逼真、传播快、成本低等优势，必将运用于出版业中的信息采集、产品制作和传播推广等各个生产环节，因此它对传统出版业产生的影响是立体的、全产业链的。”中国编辑学会原副会长郭德征也表示。

　　内容创作方式的变革将带来出版形式的多样化。陈志敏认为，Sora能够生成包含多个角色、复杂场景和特定运动的视频，这将为出版业带来更多的内容形式选择。他举例说：“教育类出版物可以利用Sora生成更加生动的教学视频、仿真实验，科普类出版物可以通过视频来展示复杂的科学原理等。”

　　同时，多位出版人提到Sora降本增效的作用。中国工信出版传媒集团副总经理张立科认为，技术成熟期，出版业可以利用Sora生成视频内容并将其应用在新形态图书、数字教材、富媒体电子书以及视频课程等方向，减少拍摄和后期制作的成本，从而降本增效。不过他认为，现阶段还不行，初期成本应该非常高。

　　温亚莉也认为，传统的出版业需要作者和出版人投入大量的人力、物力和时间来创作、出版图书等出版物，而Sora则可以通过人工智能技术，快速地将文字描述转化为视频内容，这将使得内容创作变得更加高效和便捷，也将大大提高出版效率，降低出版成本。

　　融合产品受影响最大

　　“Sora的推出，可能会极大地影响数字出版的各个方面，正像2022年11月推出的ChatGPT对图书出版的影响一样。”中央广播电视大学音像出版社原社长徐锦培这样判断。

　　同为电子音像出版工作者，山东电子音像出版社社长刁戈也观察到这个改变，“3D模型、高质量视频对于出版行业的加持作用已被广泛重视，但不菲的成本影响了应用的广泛性和产品的精细度。Sora将有可能大幅降低VR、元宇宙产品的制作成本，大大提升融合出版产品的质量和数量。”

　　新华文轩四川数字出版传媒副总经理刘天骄也认为，Sora对推动融合出版的发展将有促进作用，为AR、VR及视频与文字内容的融合提供了新的技术模式，有望为出版物的新场景提供可行的新手段。

　　出版营销专家三石则从相反方向进行提醒：“我认为Sora让我们重新洗牌的首先是图书AR领域，当下不少图书AR产品的内容创作质量低、读者使用的体验感低，但是价格高，有的还用‘元宇宙阅读’做‘噱头’，这类图书AR产品会被迅速淘汰。”另外，三石认为，Sora对低端且同质化的图文内容及视频类融媒体出版是个极大的冲击。当然，他也从图书营销方面积极提出，Sora会成为营销传播利器，会促进出版营销能力的提升。“从出版业的角度来看，Sora较低水平的插画师和视频创作者更强大。”

责任编辑: 张泽月

来源：中国新闻出版广电报
链接：http://www.zgjx.cn/2024-02/29/c_1310765834.htm
编辑：李梦瑶

刘海明 · 发表于 2024-3-1 21:43:38

【案例】

中国初创公司元语智能首发ChatYuan，向ChatGPT“宣战’

编辑：李梦瑶

帐号		自动登录	找回密码
密码			实名注册

人工智能与新闻业案例集锦

【案例】OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman) 终于承认人工智能行业正在...