传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
731#
 楼主| 发表于 2023-9-8 14:19:54 | 只看该作者
循迹网络:深度造假与新闻真实体制


曾作为新闻业铁律的新闻真实原则正变得日益“令人困惑”。本文在厘清新闻真实的相关讨论之后,引入网络化的视角,以深度伪造为研究对象,重新审视新闻真实实践。研究提出将新闻真实看作一个开放的、动态的“网络”,网络不断发生着“去中心化”和“再中心化”的动态变化。网络中主体多元,不同主体作为节点,各节点通过展示自身能力来提升自己的地位。网络中节点的主要行动逻辑为“循迹”,“迹”主要指数字痕迹。数字痕迹作为证据,通过建立公开透明的分布式记录并接受公众共识机制的监督开展“循证实践”,凸显了技术物的能动性。


本文来自微信公众号:[color=var(--c-black-50) !important]全球传媒学刊(ID:GJMS2014)原文刊载于《全球传媒学刊》2023年第3期“新闻学—事实核查”专栏,作者:徐笛(复旦大学新闻学院副教授)、梁鹤(复旦大学新闻学院硕士研究生),题图来源:《真相》


“真相需要记者”(the truth takes a journalist),这是2021年《纽约时报》为自己写下的广告词。在生产主体多元、“后真相文化”(於红梅、潘忠党,2018)弥散的当下,《纽约时报》仍使用“真相”为自己代言。新闻业曾与真相休戚相关,正因如此,新闻业才成为与众不同的社会建制。


文章摘要

本文通过引入网络化的视角,以深度伪造为研究对象,重新审视新闻真实实践。研究提出将新闻真实看作一个开放的、动态的“网络”,网络中主体多元,节点通过展示自身能力来提升地位。网络中节点的主要行动逻辑为“循迹”,即数字痕迹。文章探讨了数字痕迹作为证据的重要性,并介绍了区块链技术在新闻真实中的应用。

• 重新审视新闻真实实践,将其看作一个开放的、动态的网络

• 强调网络中节点的行动逻辑为“循迹”,即数字痕迹

• 探讨了区块链技术在新闻真实中的应用,提供数字痕迹作为证据的可靠性


然而《纽约时报》这一充满怀旧意味的举动似乎难以挽回新闻业作为“真相捍卫者”的历史地位。新闻生产正在从“职业范式”转向“网络化范式”(黄旦,2015),真相不仅仅掌握在建制主体手中。此外,数字技术深度卷入信息生产与流通,一方面真相似乎更加唾手可得,但另一方面真相也愈加稀缺和珍贵(科瓦奇、罗森斯蒂尔,2014)。不断涌现的数字技术对“真相生产”带来诸多挑战,深度伪造即是典型表征。深度伪造是人工智能深度学习领域的一个分支,依靠算法,它可以生成“以假乱真”的视频,冲击“眼见为实”的真相观念,也给核实等实践操作带来挑战。长久以来,新闻抵达真相依赖的是新闻真实性理论指导下的职业规范,包括信源检验、事实核查等。但面对深度伪造的冲击,职业规范略显无力,真实性理论也亟需更新。

本研究采用案例分析的方法,以深度伪造为研究对象,在进行文献讨论后,提出从网络化的视角重新审视数字时代的新闻真实,并重点考察技术物在求真实践中的能动性。文章提出“新闻真实网络”的概念,网络中存在多元主体,如机构、公众、从业者、技术物等。多元主体构成网络中的节点,节点变动逻辑在于“循迹”,“迹”指数字痕迹。网络中节点越多,其价值也就越大,越容易生成持续的“真实网络”。


[color=rgb(48, 48, 48) !important]一、文献回顾


真实是新闻的生命,然而进入数字新闻时代,经验主义认识论遭遇较大挑战,真实逐渐成为“首要又令人困惑”的原则(科瓦奇、罗森斯蒂尔,2014)。对这一“古老的新问题”(王辰瑶,2022),学术探讨颇为热烈,我们将其总结为两种路径。一种路径是从本体论出发,尝试拆解何为新闻真实(芮必峰,2004;杨保军,2008;姜华,2022);另一种努力是从认识论的角度,试图重新阐释新闻真实,由此诞生了若干个“××真实”的阐释语簇与概念集群(杨奇光、周楚珺,2021),比如包容了媒介技术面向的“体验真实”(华维慧,2020),吸纳了传受双方的“收受真实”(杨保军,2017),以符号学为理论渊源的“符号之真”(蒋晓丽、李玮,2013)等。

(一)何为新闻真实


“新闻真实”是由“新闻”和“真实”两个复杂概念组合而成的,它具有多维度的解读空间。李良荣所著《新闻学概论》中曾提出新闻的两种界定方式,其一将新闻视作“新近事实的信息”,即“信息说”;另一种认为“新闻是新近事实的报道”,也被称为“报道说”。对新闻真实的讨论也沿着两条路线展开。如果新闻是“信息”,是人类在日常实践中经验和关注的新近事实,那么在此意义上的“新闻”属于社会存在范畴,是一种记者无法改变的“客观实在”,那也就意味着讨论“新闻是否真实”没有必要。但如果说新闻是“报道”,那就是对“经验事实”的表象和陈述,在此意义上的“新闻”属于社会意识范畴,是一种被物化之后的“物质实体”(芮必峰,2004)。

芮必峰认为新闻学所研究的事实是在社会实践中与人相遇,并且能够被人感知的“经验事实”。这种区分有利于明晰新闻真实的概念对象,我们取其实践的面向,将数字时代的新闻置于公共知识生产范畴,它超越社会意识范畴,是面向公众的、持续的信息交流实践。真实则是另一个棘手的概念,其英文写作truth,有时也译作真理或真相,但这些概念在不同语境下有不同所指,这里不展开论述,我们以“真实”作为文中探讨的概念。

哲学研究中存在着三种主要的真实观——符合论(the correspondence theory)、自洽论(the coherence theory)以及实用主义(the pragmatist theory)的真实观(Glanzberg,2021)。符合论真实观认为“与实在相一致、与事实相符合”即是真实的。而自洽论真实观(也译作融贯论)则认为真实与否不在于是否符合事实,而在于是否在命题系统中自洽,不会自相矛盾。实用主义真实观侧重于真实的实际价值,它是能够被验证的、有益处的,是人类经验的创造(Glanzberg,2021)。那么新闻真实到底是何种意义上的真实呢?

长久以来,新闻学中将新闻真实的判定标准界定为“新闻报道与客观事实是否相符合”,也就是“客体之真”(蒋晓丽、李玮,2013),足以见得符合论真实观对新闻真实理念的深刻影响。黄旦认为这种“主客二分”的新闻真实论已落后于学术界的认知,事实并非客观之物,而是对外在事物的判断和陈述(黄旦,2015)。姜华(2022)阐释了新闻真实的一般构造,尝试厘清真实、现实、真相、事实之间的关系。他认为新闻真实是通过对事实的人为揭示,呈现真相、接近现实的实践过程。而无论自然事实还是社会事实都有“不可通达”的面向,这就导致了新闻真相呈现出极其复杂的状态。

(二)重新阐释新闻真实


面对“客体之真”的诸多困境,研究者们尝试从不同维度解困,于是围绕新闻真实生发出数十个概念语簇。有研究者认为新闻报道要能够穿透复杂的现象,揭示出事物的本质规律,即追求“本质真实”(王武录,1981)。有的提出“微观真实”和“整体真实”,微观上要反映具体新闻事实的整体面目,宏观上要呈现出目标报道领域新闻事实的整体图景。还有研究者关注实现新闻真实的“程序”,据此提出“依据真实”,认为新闻报道的内容必须是由他人所提供的或者新闻从业者亲身经历的新闻事件,而不能是新闻记者凭空想像或编造出来的。不管依据是否符合客观事实,但依据本身必须真实存在并经过记者和新闻传播机构的判断和认定(吴晓春,2005)。

另有研究将新闻真实放置于数字新闻业背景下,将受众纳入到新闻真实构建中,提出“收受真实”(杨保军,2017)的概念。而实践中,新闻真实是层层符号化过程中传受多方主体在对符号解释的互动一致中构建的,其核心在于寻找一种“新闻符码”,能够建立起不同的符号解释主体之间感知、解释和审美上的共鸣,因而学者们又提出用“符号之真”代替“客体之真”(蒋晓丽、李玮,2013)。

操瑞青(2017)认为新闻求真的过程并非真实本身,而是在实践中获得的新闻收受者的“信任”,由此新闻真实是一种“假设真实”。更进一步,借用马克思关于有机报刊的阐述,杨保军(2022)又提出“有机真实”,即在新兴媒介环境中,新闻真实不再像传统新闻业时代那样,是由单一的职业新闻传播主体决定的,而是由所有参与新闻生产传播的多元主体共同决定的。

上述研究提升了新闻真实的研究热度,在概念层面丰富了新闻真实的理解面向。但繁多的概念语簇使得“新闻真实”日趋碎片化,其概念对象似乎更加飘渺不定,在实践层面难以观照现实,无法成为引领新闻践行真实的纲领。现仅以“收受真实”为例,展开些论述。其观照了受众的能动性,认为实现新闻真实需要传受双方达成认同,但现实中传受关系往往是复杂而多样的。首先,在收受真实概念的论述中“传者”仍以职业新闻从业者为主体,而在数字时代,传受双方的位置往往是动态的。其次,受众并非千人一面,受众不能化约为一个“共同体”,其认知是复杂而多样的,如何判定传者与受众达成认同,这似乎是个无法完成的任务。此外,根据“动机性推理”,人们倾向于接受与自己观点一致的信息,对于与自己信念背道而驰的信息会选择性回避和无视(Oppong,2019),因而即便达成认同,是否抵达了真实也有待商榷。

“有机真实”的概念精准把握了当下的传播环境,但未能明确多元主体如何共同展开求真实践。无论是对“客体之真”的追求,还是转向受众视角,都是以“传”与“受”的二元关系作为前提,然而在数字时代,新闻真实正逐渐演变为多元新闻传播主体之间的对话和博弈,参与者既包括职业新闻从业者,也包括民众个体和脱媒主体(杨保军,2016),甚至还包括非人类行动者,比如技术物的参与。黄旦(2015)指出,新闻真实的概念需要在网络化关系下“重新考量”。因循这一路径,我们将引入网络化的研究视角。

(三)网络化的研究视角


分析数字时代的知识时,温伯格(2014)提出知识呈现出网络化的特征。因特网是知识的新的基础设施,超文本链接改变了知识的结构,每一个链接都指向与源文本相关的背景或人,链接的累积使得网络上累积的内容更有价值,而知识就存在于网络本身。网络连接起异质的人,共同解决问题。由此权威也不再仅由资质和证书来确认,而取决于其在网络中的贡献(温伯格,2014)。新闻业曾享有宣称真相的权威,在网络时代,这种权威也日渐稀释。

黄旦(2015,p.79)曾援引延森的论述提出,当下的媒介世界是三种媒介平台交错混杂而形成的网络,即人的身体的媒介平台、大众媒介平台和以数字技术为核心的元技术平台的相互叠加。在这个网络中存在着不同的节点,节点通过吸收信息并处理信息来增强其在网络中的地位,节点的重要性并不在于其自身的属性,而在于其展现的能力,如果节点表现不佳,其任务则会被其他节点接收。作为职业传播者的新闻业也是网络中的一个节点,但它并不天然占据高地,其位置仍然取决于吸收能力、连接能力和处理能力。

知识的基础——事实也正在网络化,温伯格将近代历史上的事实区分为三个阶段,首先是经典事实阶段,其代表是使用解剖工具的达尔文和印制权威内容的蓝皮书,此时事实相对稀缺。接下来是数据事实阶段,由部分人为我们挑选知识,知识相对受限。最后是网络化事实时期,事实只有连接在网络内才能被人们理解,比如科学论文会链接到数据库或科学实验说明。网络中有各种层面的诠释群体,真实与客观等理念需要重新考量,网络化的事实开启了一个充满纷争的认知时代(温伯格,2014)。这或许能部分地解释新闻真实为何变得令人困惑,因为真实的体制发生了变迁(Foucault,1977),启蒙时代以来确立的以科学理性为根基的真实观正在瓦解(Waisbord,2018)。数字时代的新闻真实不宜再被视作一套规范、一种标准或是一种方向明确的可达成之静止状态,它更是一种动态的网络化实践。

本研究以网络化的视角重新审视新闻真实,试图揭示网络中节点的特点和变动逻辑。尤为值得关注的是数字时代,技术已成为衡量新闻真实的“特殊界碑”(刘海明、付莎莎,2019)。已有研究关注到技术对新闻真实的塑造,提出VR新闻带来的“体验真实”“具身真实”(华维慧,2020),大数据新闻中呈现出的“前瞻真实”(杨保军、孙新,2019)等概念。但这些概念是对技术物能动性的抽象概括,而不是对过程的描述。我们也将在研究中特别观照技术物的行动特征。为实现上述研究目标,深度伪造无疑是有效的研究对象。一方面围绕深度伪造展开的确证实践是一个持续不断的知识生产过程;另一方面,确证过程中技术物也起到独特而关键的作用,有利于对其展开描摹。

二、研究方法


本研究采用案例分析的方法,选取近年来围绕深度伪造产生较大影响的典型案例,包括深度伪造视频的传播案例、新闻界和计算机界对于深度伪造的应对案例等,分析网络化的实践过程。

深度伪造被应用于政治和社会领域大约自2018年4月开始,本研究选取2018年4月至2022年3月间引发公众热议的典型案例共4个,包括对奥巴马、佩洛西、扎克伯格和伊丽莎白的深度伪造视频,同时抓取视频平台上奥巴马深度伪造视频下的相关评论。

此外,研究者也选取了在应对深度伪造时取得显著成效的相关案例,包括深度伪造检测(F3-Net等)、“开放核证”(“法证建筑”和“贝灵猫”)以及区块链(“新闻出处溯源”项目和Civil平台)等,分析其确证实践过程。

三、深度伪造引发的真实危机


深度伪造的出现颠覆了“眼见为实”的信念。深度伪造一词从英语中的组合词deepfake翻译过来,由“深度学习”(deep learning)和“伪造”(fake)合成。顾名思义,深度伪造是一种经由人工智能深度学习后用于合成伪造视频的技术,也称合成媒体(synthetic media)技术(陈昌凤、徐芳依,2020)

2017年,一名名为“Reddit”的用户运用人工智能技术将娱乐明星的脸换到色情视频中的人物上,一时间引起轰动(姬德强,2020)。自此,深度伪造逐渐被人知晓。但当深度伪造开始用于生产政治和社会领域的内容,或会带来较严重政治后果。

(一)深度伪造蔓延


深度伪造视频引发广泛关注始自2018年。美国导演乔丹·皮勒(Jordan Peele)运用深度伪造技术生成了美国前总统巴拉克·奥巴马的演说视频,视频中奥巴马用污秽语言攻击他的继任者唐纳德·特朗普(Donald Trump)。2019年,一段美国国会众议院议长南希·佩洛西(Nancy Pelosi)谈论总统特朗普的视频同样被证实是由深度伪造技术生成。伪造者将视频速度放慢至75%左右,使得佩洛西看起来像喝醉了酒,语速和语调异常且滑稽。不久之后,脸书首席执行官马克·扎克伯格(Mark Zuckerberg)也成为伪造视频中的主角。视频中他吹嘘自己“控制着数十亿人被盗的数据,掌握着他们所有的秘密、生活和未来”。

2020年美国演员黛布拉·斯蒂芬森(Debbie Stephenson)运用深度伪造技术拍摄短片《另类的圣诞致辞》(Alternative Christmas Message)。在片中,她的脸被换成了英国女王伊丽莎白二世(Elizabeth II)。视频中主人公坐在后期合成的白金汉宫里发表圣诞致辞,致辞结束后她突然跳上桌子,秀起了TikTok热舞。该短片的导演威廉姆·巴特利特(William Bartlett)希望用这种方式发出对深度伪造和虚假新闻的“严厉警告”。

深度伪造在国内受到关注,源于一款名为Zao的应用,这款应用可以让用户将自己的脸换到经典的影视作品片段上并合成视频。这款应用上线后,很快就冲上应用商店免费榜排名前二。但随后因严重侵犯用户隐私而下架。

从技术角度来看,深度伪造是指将照片、声音和视频输入到机器模型中,机器可以将视频中的人脸替换为照片中的人脸,合成极为真实的换脸视频,轻易地实现“面部操作”(face manipulation;姬德强,2020)。该技术最早出现在20世纪90年代,由学术科研机构研发,但随着机器学习算法和移动应用软件的普及,用深度伪造制作虚假视频变得越来越简单。亚利桑那州立大学人工智能方向教授苏巴拉奥·坎巴姆帕蒂(Subbarao Kambhampati)称,“不需要大量的训练数据,短短10秒的视频就足够实现换脸”(Skibba,2020)。

深度伪造对个人、企业、媒体和国家安全都可能带来负面影响。对个人而言,深度伪造制作的换脸色情视频一旦在社交媒体上传播,会损害受害者名誉,甚至可能被用于污名化女性和“色情报复”。对企业来说,深度伪造可以篡改企业管理者的公开视频,任意表达某种观点,从而损害企业的信誉和利益(曹建峰、方龄曼,2020)。对于新闻媒体,深度伪造会以收割社交媒体流量的方式,将公众的视线转移至社交媒体上的虚假视频,从而使新闻媒体的权威信源“边缘化”,间接导致政治和社会议题讨论的“去中心化”(姬德强,2020)。对于国家安全来说,深度伪造的负面影响主要包含四个维度:威胁政治安全,包括抹黑政治人物、伪造政治制度和破坏国家间关系;威胁经济安全,包括破坏企业形象和干扰金融稳定;威胁社会安全,包括激化社会信任危机、导致法律举证困难和容易被恐怖主义利用;威胁国民安全,包括从生命、财产和心理三方面威胁公众安全(龙坤等,2019)。

(二)挑战新闻职业权威


深度伪造引发普遍的信任危机。皮尤研究中心(Pew Research)于2019年6月发布的一项报告中指出,63%的美国人认为被篡改的视频或图像是误导公众的主要原因,足以见得深度伪造让公众对于基本事实的理解产生了极大的困惑。

深度伪造的误导性严重损害了公众的新闻体验,43%的美国人因为担忧虚假新闻(made-up news)而减少了获取新闻的总量,改变了新闻消费习惯。并且,超过一半的受访者认为,在未来五年内,因虚假新闻而产生的问题将会变得更糟。同时,编造的虚假新闻内容影响了美国民众对于媒体的信任,超过一半的美国民众认为新闻媒体最有理由对此负责,应当采取措施减少虚假新闻的生产和传播,这也解释了为什么很多深度伪造的相关事件看似与媒体无关,但公众仍然将问题归咎于媒体。

为观察公众对于深度伪造的感知情况,本研究抓取了网络视频平台油管(Youtube)上,由导演皮勒在2018年发布的奥巴马演讲深度伪造视频下的热门评论。用户The Mr Tischbein引用亚伯拉罕·林肯(Abraham Lincoln)的一句话“不要相信互联网上的任何东西!”获得了近万名网友的点赞。公众的不信任并不是只针对深度伪造视频本身,而是延伸到整个互联网和新闻业,比如用户ghost walk发布的评论:

虽然这段视频很搞笑,但实际上很有教育意义。它告诉我们,我们不能相信我们在互联网或电视(尤其是新闻)上看到或听到的任何东西,即使这些话似乎是直接从这个人的嘴里说出来的。

深度伪造动摇了公众长期以来建立的对视觉影像的信任。对新闻业来说,更为重要的是公众并不会区分新闻的来源是网络还是电视,是专业媒体还是自媒体。公众会泛化地认为“视频”这种形式的真实性有待考量。这就导致公众对整体传播环境的不信任,损伤新闻业的“公信力”。当公众对于互联网信息不再信任时,网络空间便被分裂成一个个碎片化的社区,不同社区的用户之间难以达成共识,治理虚假新闻的难度会提升。

面对深度伪造对何为真实的冲击,媒体的解决方案依然是坚守专业操作,完善信源检验以尽可能地接近真实。首先,用更精细的标准核验视频素材真伪,比如用非线性视频编辑软件逐帧检查脚本,寻找那些细微处的“小问题”,比如唇部的模糊或不自然的光线(姬德强,2020)。其次,人工追溯信源在网络空间的“数字足迹”,或者反向查找视频的旧版资源,观察存疑视频来自何种消息渠道,根据视频来源判定资源可靠性(Bayer & Bouwmeester,2022)。

但这两种方法耗时耗力,对于核查人员的能力要求也较高,真正实施起来较为困难。德国和意大利研究者曾组织核查团队进行实验,在经过了1000段“换脸视频”的测试后提出,只有经过特殊训练的人才可以准确辨别视频内容的真假,说明鉴别此类视频对人才的要求较高(贺毅、冯菊香,2021)。在深度伪造等自动化内容生成技术面前,仅依靠新闻室内部“封闭作业”可能无法充分应对其挑战,甚至可以认为新闻从业者对于深度伪造视频的识别能力与普通的非专业人士并无二致。


(三)应对深度伪造


目前,应对深度伪造有两类可行对策。一类是“事后检测”,另一类是“事前防御”。

事后检测可以理解为“验真”,也就是对已经制作完成并传播的视频进行检测,判断存疑视频是否由深度伪造制作而来。在事后检测方法中,又可以从垂直和水平两个维度入手。垂直维度是指对一个存疑视频深入研究,排查视频是否存在某些特定伪造特征的方法,比如“深度伪造检测”方法;水平维度是指收集同一事件的多个分散证据,交叉检验不同视角下的视频以求得真相,比如“开放核证”方法。

而事前防御则属于另一种逻辑,可以理解为“防伪”,也就是建立一个可信任的机制,使得深度伪造的视频无法在该机制下传播,从根本上杜绝深度伪造的隐患,比如“区块链”方法,如图1所示。




1.  技术方案:深度伪造检测

一种相对直接的对策就是采用计算机领域的其他技术手段检测视频是否经过了深度伪造。在技术层面,深度伪造检测是指从人脸视频本身提取特征,根据这些特征将视频进行二分类鉴别,即分成真实视频和伪造视频两类。早期的被动检测依赖于人工选取特征,比如眼部异常、牙齿异常、边界融合异常等等(Matern et al.,2019)。但随着伪造视频越来越逼真,想要从这些直观特征上区分真伪变得愈发困难。这是因为,深度伪造应用“生成对抗网络”(Generative Adversarial Nets,简称GAN)这种算法模型,它由一组对抗性的神经网络组成,是目前为止最成功的生成模型之一(林懿伦等,2018)。深度伪造之所以难被肉眼看出或被检测出来,就是因为其算法本身就包含了“伪造”和“检测”的二元对立逻辑。

GAN在传统的生成模型的基础上引入了“对抗”机制,由一个生成模型(generative model)和一个判别模型(discriminative model)构成,二者互相博弈学习产生输出。一个常见的比喻是,生成模型好比一个制造假钞的团伙,他们的目标是制作更加逼真的假钞,让警察无法识别。而判别模型就是警察,专门识别假钞。因此两者是对抗关系,相互博弈,不断对自身能力进行优化,最终达到均衡。算法在执行中不断自我优化,让“假视频”看起来更加“真实”,更不易被检测出来。

由于GAN技术的复杂性,计算机学界和新闻业界对深度伪造检测技术(deepfake detection)进行了长期的探索,来减轻深度伪造带来的危害。社交媒体脸书联合微软公司等知名企业以及麻省理工等高校在卡格尔(Kaggle)竞赛平台上发布了奖金丰厚的深度伪造检测挑战赛(Deepfake Detection Challenge,简称DFDC),吸引了全球超过2200支队伍参赛。

在现有的技术水平下,深度伪造检测能够将人工选取特征转为基于深度学习技术的提取特征。具体的方法是向深度学习模型输入事先伪造好的人脸视频,让模型在空域、时域、频域三个维度上学习伪造视频的特征,再根据这些特征在验证集上作判断,输出二分类的结果。以这些经过数字视频信号处理和傅立叶变换后的数据作为二分类的依据来判断视频真伪。比如检测深度伪造视频的F3-Net方法,在模型中设计了频域信息提取模块,使用频率感知分解和局部频率统计信息来放大视频帧图像的频域中由深度伪造过程带来的周期性伪影。存在伪影,这条视频为假;不存在伪影,这条视频为真。

目前F3-Net方法对于高压缩率的伪造视频检测取得了良好的效果(Qian et al.,2020)。现阶段投入应用的对于深度伪造的应对措施大多是基于深度伪造检测的方法(周文柏等,2021)。但目前看来,深度伪造检测技术并不是最优的可行对策。

首先,深度伪造检测技术准确性不高。深度伪造检测技术并不总是能作出正确的判断。非营利组织“目击者”(Witness)的深度伪造专家萨姆·格雷戈里(Sam Gregory)表示,检测技术并没有那么可靠,即使是脸书专门为检测深度伪造而创建的最优算法也只有65%的准确率(Knight,2021)。

其次,深度伪造检测属于“黑箱”性检测。深度伪造检测模型依据何种特征作出的真伪判断,无论是算法设计者还是使用者都不得而知,属于算法“黑箱”。而对“黑箱”给出的真伪判断也只能接受,无从纠偏。

最后,深度伪造检测具有滞后性,即每一类问题的解决都需要一段时间的针对性技术攻关才能投入应用。因此伪造技术的发展总是超过检测技术。在没有可用的针对性检测技术之前,新闻从业者仍然需要凭借自身有限的能力去核查新闻。正如纽约州立大学教授吕思伟(Siwei Lyu)所比喻的,生产和识别虚假视频的竞争关系类似一场国际象棋,谁能最终胜出还需要看对方招数(Fillion,2019)

2.  社会化证据生产:开放核证

开放核证(open verification)为检测深度伪造提供了新的思路。开放核证是采取开放和社会化生产证据的方法和流程,收集和分析线上或其他公开来源的素材,还原事件的“真相”(Weizman,2019)。对媒体来说,在庞杂繁复的碎片化消息中发现关键碎片,以及在海量碎片的拼贴过程中还原事件全貌的“碎片整合能力”尤为重要(彭兰,2020)。

当事件发生时,不同的拍摄者在不同地点、不同角度同时拍摄,每个视频都为事件提供了一个独立的视角。视频中包含着大量的旁观者、场景、车辆等元素,通过元素之间的相互位置关系可以还原出每个视频拍摄者的位置和视角,以及多个拍摄者的空间关系,进而依照空间关系将多个视频进行连通。其中,真实视频更容易与其他视频连通,视频中的细节也能够与其他视频成功匹配,而深度伪造等虚假视频却无法融入其他视频中,据此可以判断视频的真伪。

开放核证的工作就像在特写镜头和超广角镜头之间来回切换,在各个视点、视角之间横向移动(Weizman,2019)。“法证建筑”(Forensic Architecture)和“贝灵猫”(Bellingcat)是开放核证调查领域的佼佼者。“法证建筑”是伦敦大学金史密斯学院于2010年成立的空间调查研究团队,创始人是以色列建筑师埃亚勒·魏兹曼(Eyal Weizman)。在这个团队中,有建筑师、科学家、律师、电影制作人、记者、软件开发人员、考古学家等。团队成员充分发挥跨学科的优势,在案件调查和审判过程中提供可视化的信息作为证据,利用3D模型作为动态数字环境定位摄影机。

2018年6月1日,在加沙的汗尤尼斯附近的抗议活动中,20岁的军医鲁赞·纳贾尔(Rouzanal-Najjar)被以色列狙击手射杀。“法证建筑”同步了可用的镜头素材,反向计算出每个摄像头的运动以模拟个人的位置,并建立一个可能的“弹道锥束”。一旦某个视频反求出空间关系与摄影机的位置,其他视频就很容易匹配到同一3D空间中,3D空间中的视频或图像越多,对事件的看法就越完整,虚假视频混入的风险也会越低。“贝灵猫”是艾略特·希金斯(EliotHiggins)于2014年创立的公民记者网站。

与“法证建筑”相似,“贝灵猫”擅长利用卫星地图、社交媒体文章、油管平台视频和在线数据库等公开资料进行开源调查,以揭示争议事件的“真相”。2020年1月8日,乌克兰国际航空公司的PS752航班在德黑兰坠毁,机上乘客和机组人员全部遇难。“贝灵猫”收集、验证和分析公开可用的照片、视频以及谷歌街景,寻找事件的蛛丝马迹,通过完整而严密的证据链推翻了伊朗官方宣称的“引擎故障”,证明失事客机是被伊朗人为击落的。

调查人员通过横向比较互联网上的碎片化信息,能够交叉验证不同“碎片”的真实性,从而寻找“真相”的拼图。开放核证的调查员们通常并不具备专业媒体在界定真实上的话语权,缺少新闻机构资质和声誉的加持。他们所宣称的“真实”需要在开放核证的过程中体现,尽可能保证确定事实的过程公开透明,从而获得公众的信任。

开放核证需要全面曝光团队的工作流程,包括情境、参与人员、素材使用、每一块证据材料如何和在何地被发现、验真模型以及不同证据如何组合的整体叙述。开放核证的实现依赖于构建一个“实践社区”,调查的公开过程相当于建立了一个社会契约,所有的参与者形成了一个独特的生产和传播的聚合“网络”,将调查研究的过程“去中心化”。

3.  无中心节点的网络:区块链

区块链由“区块”和“链”组成,创建了一个独特的、不可更改的元数据块链。它由去中心网络组成,没有中心节点,每个节点区块包含“块头”和“块体”,如图2所示。块头包含时间戳、哈希值(节点的唯一标识)、父哈希值(父节点的唯一标识)等信息,块体主要包含自身携带的内容。这些信息用于记录发布者身份和发布时间,通过时间戳和节点间的链接就可以追溯到每条深度伪造视频的传播路径,追踪视频信息在哪个节点被篡改和破坏,显著地提高了数字视频传播过程中的安全性。区块链通过其独特的技术机制实现了对伪造视频的“标本兼治”,也就是不管伪造技术如何发展,区块链都能够追溯到伪造视频的源头,从而遏制深度伪造的扩散。


近年来,学界和业界都在积极进行“区块链+新闻”的探索,借助区块链技术实现深度伪造视频的溯源。尚文倩等将数据溯源和新闻传播过程结合,提出了一种基于区块链的新闻跟踪模型,覆盖了新闻生产、传播和溯源的全过程(Shang et al.,2018)。

哈亚·R.哈桑(Haya R. Hasan)等提出用区块链和智能契约(Smart Contract)来检测深度伪造视频,将每个视频关联上各自唯一的智能契约,通过智能契约便能追溯到原始视频的来源(Hasan & Salah,2019)。《纽约时报》在2019年和国际商业机器公司合作推出了“新闻出处溯源”(The News Provenance Project)的开源区块链新闻项目,追溯网络空间中的视频传播路径(Koren,2019),分析视频的元数据是否存在编辑、调速、合成等伪造行为,改变了传统新闻媒体相对低效的事实核查模式。

2016年成立于美国的初创公司“公民”(Civil)是“区块链+新闻”的先行者。Civil的目标是借助区块链技术创新新闻平台商业模式,建立一个“去中心化”的新闻社区(万可等,2020)。Civil平台推出代币,称为CVL,主要用于内容生产和分发中的微支付。每个在Civil平台拥有“通证”(token)的用户都可以阅读新闻内容、参与新闻生产环节的各项决策、监督并惩罚不实内容等。因此在公众的通证投票下,诚实、专业的新闻报道会得到肯定和CVL奖励,虚假新闻则会被惩罚和排斥,以促进公正客观的新闻报道的呈现(汤屈等,2021)。

四、循迹网络


无论是通过检测技术,还是开放核证,抑或是“区块链+新闻”的溯源过程,都呈现出网络化的实践过程。追求更好的检测技术,需要引入由多元主体参与的竞赛。开放核证中,异质的要素共同参与其中,包括:不同身份的人,比如建筑师、设计人员、记者、商业人员、极客等;还有各种技术物,比如卫星地图、3D空间等。

而在“区块链+新闻”的尝试中,时间戳、通证等技术物以及公开透明、代币奖励等制度措施,作为不同的节点构成了一个动态的网络。在这个网络中,每个节点不断贡献自身的力量,好似泛起涟漪,这些波动叠加延展,网络也在节点的持续作用和变化中变动不居。那么求真网络中节点的变动逻辑又是什么呢?在网络中,技术物的能动性日益凸显。技术物提供了达成信任的开放环境,也提供了可供公众和媒体追寻的痕迹,由此连接起更多的节点。

受到循证医学概念的启发,研究者提出“循迹网络”的概念来解释求真网络的变动逻辑。“循证医学”(Evidence-based Medicine)诞生于20世纪80年代,其强调决策过程透明,要求尽可能搜集一切证据并进行证据分级,遵循现有最佳的证据展开实践。“循证社会科学”“循证新闻”等概念也应运而生。新闻作为一种“公共知识”,所遵循的应当是能够被公众所认可的公开证据,是一种多元主体参与下的证据“网络”。

新华社总编辑、党组书记傅华(2016)指出,循证新闻是指运用互联网思维、大数据技术以及实证方法的新闻生产方式,力求基于一切相关证据,进行全景化、立体式的新闻呈现。“法证建筑”和“贝灵猫”团队所开展的开放核证调查即是“循证新闻”的实践,通过公开、广泛地搜集事件发生的一切证据来求真。而这些证据存在且只能存在于网络中,网络中的证据便是循迹中的“迹”。它是指具有独特性的数字痕迹,比如时间戳、特征码等,可以被认为是区块链信任下的“最佳证据”。循迹网络的最佳实践是指通过分布式的区块链技术构建一个数字痕迹可追溯、数字内容防篡改、集体维护的新闻真实网络。

本研究提出“循迹网络”的概念来解释数字时代新闻真实实践过程。这个概念不仅适用于深度造假事例中,它的生命力还在于循迹也能够阐释新闻真实的历史变迁。纵观媒介技术的演进过程,“循迹”在不同的历史阶段有不同表征。

在印刷媒体时代,新闻真实的合法化证据为印刷文字。17世纪的欧洲,报纸的诞生标志着公共知识体系的建立,将报纸与市井闲聊、小说等其他早期传播渠道区分开来,形成了“新闻”与“非新闻”的界定标准,确立了现代意义上的“新闻”观念,新闻的真实性和时效性特征也逐渐显露。如杰里米·边沁(Jeremy Bentham)所说,报纸是唯一常规性的公共知识和真实的贡献者。几乎所有报纸的出版人和编辑都会高度宣扬自家报纸能够提供真实可信的报道,将真实作为一个重要的卖点。英国作家丹尼尔·笛福(Daniel Defoe)在出版《伦敦每日邮报》(London Daily Post)时就承诺,这份报纸会用简单的话语呈现纯粹的事实(王敏,2020)。因此在某些意义上,小范围的口口相传、私人信件刊载登报之时,便具有了公共场域的“真相”进行传播的条件。公众愿意相信,一则刊载在报纸上的消息,相比口述、手抄新闻、宣传册、小说等形式具有更强的真实性,能够成为新闻真实的合法化证据。

进入影像媒体时代,视觉影像成为新闻真实的证据痕迹。与印刷文字相比,视觉影像能够让公众间接“目击”到事件发生的现场,有效弥补了文字描述的不足,并催生了一套以“目击”为核心的实践策略。19世纪摄影术的发明,通过其内在的技术逻辑,将客观世界的光学痕迹定格成为影像,使得现实主义的公众“目击”得以实现。图片建立的“在场感”更为突出,对于现实世界的呈现相比文字和绘画要真实得多,甚至被神化为呈现一切场景的“宣誓证人”(sworn witness)或“沉默的目击者”(silent witness)(Schwartz,1992)。《哈泼斯周刊》(Harper's Weekly)对于美国内战中的“安提坦之战”的报道中,就大量地使用了照片这一形式,并且强烈表示照片对于现实世界的呈现能力与简单的文字描述相比要真实成千上万倍(Zelizer,2007)。

电视媒介的问世让公众直观“看见”生动的现场,更为直接地呈现动态事件和感性形象,与真实世界“距离”最近。由此催生出的现场直播,更让屏幕前的观众感到“身临其境”,塑造更为强烈的“临场感”。现场直播将当时发生的事情不加任何修饰地直接展现给观众,因此不存在剪辑、后期合成的时间。甚至对于观众来说,那些原生态、背景声嘈杂、镜头摇晃、画质低劣的视频更能够产生“身临其境”的效果(王敏,2020)。这种“临场”的感觉让观众更倾向于相信新闻内容,相信媒体提供的视觉影像证据,从而形成了一种高度“客观”的“循迹”实践。

数字时代,数字痕迹开始作为新闻真实的证据痕迹。借用循证社会科学中证据分级的视角,数字痕迹证据的级别高于视觉影像证据,视觉影像证据又高于印刷文字证据。在互联网时代,碎片化的文字和影像内容真假难辨,大量充斥着网络信息环境。区块链技术的产生为数字时代新闻真实的循证实践提供了数字痕迹,以此来标记内容生产和传播的全流程,供其他用户溯源验真。

英国《经济学人》(The Economist)杂志把区块链技术比作“一台创造信任的机器”。其实,数字痕迹早已有之。互联网环境下用户的任何行为都会产生数字痕迹,比如浏览记录、使用时长、转载信息等。但这种非结构化的数字痕迹并不全面,也不具备通用性,因此不能作为新闻真实的证据。而区块链技术提供的数字痕迹能够唯一标识某一节点,能够准确全面记录每次新闻生产和传播的过程,且不会被轻易篡改。因此这种技术机制保证了区块链提供的数字痕迹能够作为新闻真实的证据。

数字时代,理解新闻真实需要借助“新闻真实网络”的视角,将新闻真实的实践过程看作是开放的、动态的网络化过程,网络中的节点为抵达真实贡献自己的力量,而这一过程的主要逻辑是“循迹”,本研究重点考察了求真网络中技术物发挥能动作用的过程。而福柯(Foucault,1979)提示我们,真实是权力的产物,每个社会都有其真实体制,即真实的一般政治。在后真相文化弥漫的情境中,求真意味着把目光从特定的主体转移到拆解真实体制的结构,为后续研究提供了方向。

本文来自微信公众号:[color=rgb(96, 96, 96) !important]全球传媒学刊(ID:GJMS2014)原文刊载于《全球传媒学刊》2023年第3期“新闻学—事实核查”专栏,作者:徐笛(复旦大学新闻学院副教授)、梁鹤(复旦大学新闻学院硕士研究生)

来源:全球传媒学刊(虎嗅APP)
编辑:潘洁
732#
 楼主| 发表于 2023-9-9 10:51:29 | 只看该作者
【案例】

腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

百模大战”新增又一巨头:腾讯官宣参战。

9月7日,在2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放。


资料显示,腾讯混元大模型是腾讯自研的一款通用大模型,目前已经接入腾讯50多个业务测试,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。


值得注意的是,这并非是腾讯首次公开大模型相关进展。此前6月19日,腾讯曾发布依托腾讯云TI平台打造行业大模型精选商店,提供MaaS(Model-as-a-Service)一站式服务,构建专属大模型及智能应用。


“大模型竞争还在马拉松的第一公里,这个行业太新了,不存在清晰的市场份额或占比。”9月7日,在接受澎湃新闻等媒体采访时,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生坦言,“大家动不动就喜欢发布通用大模型,在我看来这条路有点走偏了,不能解决产业实际问题和痛点。”


对于大模型落地前景,他也直言:“有些前沿投入和布局,可能要3到5年才能看到商业回报,现在谈大模型的商业前景还为时过早。”


腾讯的大模型“路线图”

今年上半年,多家大厂扎堆发布大模型,“百模大战”一度成为舆论焦点,而腾讯一直到9月份才发布通用大模型,似乎显得有些姗姗来迟。


“腾讯做大模型只看自己,不看别人。”9月7日,对于发布时间,腾讯副总裁蒋杰向澎湃新闻记者坦言,“混元大模型在腾讯内部已经内测很久,在推出时间上,没有考虑过和同行进行赛跑。”

从基本参数来看,目前腾讯混元的参数规模超千亿,预训练语料超2万亿tokens,具备中文创作能力,复杂语境下的逻辑推理能力,以及任务执行能力。


和其他模型相比,混元大模型的特点和优势是什么?澎湃新闻记者梳理发现,其最大特点是在解决“幻觉”能力上表现较为突出。所谓的“幻觉”,指的是大模型在回答提问时会出现答非所问、胡说八道的现象,腾讯混元大模型在预训练阶段通过“探真”算法进行事实修正,实测幻觉率可以降低30%-50%。


“其他厂商往往会通过知识图谱或是搜索外挂来让大模型的检索能力变得更加准确,但使用外挂会导致新的幻觉出现,因此腾讯决定在大模型预训练阶段就解决这个问题。”蒋杰表示。





此外,混元大模型还具备超长文本的处理能力,能够提供超过4000字的长文回答,而在同样的命题下GPT-3.5只能提供超过1000字的问答。在数据源头方面,蒋杰介绍,腾讯做小模型、大模型甚至大语言模型,都不会使用个人隐私数据。此外,腾讯的内容产品,也为腾讯混元大模型提供了大规模、多样化的语料库,能够学习到各类应用场景中的语言知识和语境理解能力。
在具体指标上,混元大模型在多个指标上超越了GPT-3.5,包括代码子项、STEM子项、高考题子项和数学子项上,但和GPT-4还有距离。蒋杰表示,国内的厂商在做大语言模型的时候,需要循序渐进,脚踏实地做好每一项技术突破,并且坦诚面对和国际厂商在技术上的一些差距。





外界好奇的是,为何腾讯在推出行业大模型后再次推出通用大模型?


此前汤道生曾提到,通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。相比盲目使用通用大模型,企业基于行业大模型构建自己的专属模型,也许是更优的选项。模型参数比通用大模型少,训练和推理的成本更低,优化也更容易。


对此,汤道生告诉澎湃新闻记者,推出时间较晚是因为腾讯一直在研发和应用的过程中。其实腾讯内部早已开始内测混元大模型,但在没有经历充分的应用融合和实践前不会对外公布其具体进展,最终公布的成品,是经过充分打磨后的,但依然会不断更新和迭代。


大模型商业化究竟路在何方?

在“百模大战”的热度略有减退后,大模型的实际落地效能成为外界考量的重点。


谈到混元大模型未来商业前景时,蒋杰坦言,在To B(企业)端产生商业收入还有待探索,因为目前混元大模型在面对成熟度和复杂任务的处理能力还不够全面,因此对于较多专业场景不能充分解锁,应用有待完善。


“混元大模型一开始就不是为了发布而发布,而是根据腾讯自身应用,例如微信、QQ等进行相关研发和匹配,提供互相深度融合的能力,才能抵消大模型背后的高昂设备、训练和人力成本。”蒋杰表示。


此前,百度智能云副总裁朱也在接受澎湃新闻记者在内的媒体采访时曾表示:“从衡量大模型本身的商业价值角度看,如果应用不起来,整个大模型很难持续下去,确实是需要投入,整个生态起来、应用繁荣很重要。我们判断,偏向于营销服务、办公提效这两个场景,可能会首先实现大规模落地,我认为接下来几个月能够看到应用逐渐落地,规模逐渐增大。”


对于大模型研发的高额成本,汤道生透露,腾讯内部对于资源分配有倾斜性,混元大模型是腾讯内部最重要的项目之一,因此会以第一优先级进行考虑,目前公司内部的人员配置和资源合作“跑得很顺利”,但大模型的竞争尚在马拉松的第一公里,可能要到3到5年后才能看到相应回报。


就在不久前,百度宣布“文心一言”向全社会全面开放,还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。


混元大模型是否也将对外开放?对此,蒋杰表示,是否提供C端(消费者端)服务仅仅是时间和选择的问题,“目前我们还是侧重在内部应用场景中做尝试,TO C与否只是一种‘开关’,做好自身能力、提高准确性才是我们最为关注的。”


来源:澎湃新闻
链接:https://www.thepaper.cn/newsDetail_forward_24525760
编辑:潘洁



733#
 楼主| 发表于 2023-9-10 16:35:22 | 只看该作者
【案例】

从满心期待到受到群嘲,AI还能改变新闻业吗?
文 | 陈根

AIGC在新闻领域的应用,正在引起广泛的担忧。


近日,美国最大新闻出版商Gannett宣布,将暂停使用人工智能工具撰写体育新闻。而此前,该公司由LedeAI撰写的报道则在社交媒体上疯传,引发了大量网友的讨论和嘲讽。网友评价称,这些AI所发布的报道缺乏关键细节,内容大量重复,使用奇怪的语言,并且读起来就好像从未看过有关的体育比赛一样。


要知道,2022年底,OpenAI刚刚发布ChatGPT时,人们还满心期待ChatGPT能给新闻采编带来前所未有的放和效率提升。从满心期待到受到群嘲,人工智能还能改变新闻业吗?人们还放心将人工智能引入新闻业或者其他行业吗?


“海啸”即将来临

人工智能对新闻行业最大的改变,就是推动了新闻自动化生产的发展,而这一改变从十年前就已经开始。


美联社是最早利用人工智能和自动化来支持其核心新闻报道的新闻媒体之一。2014年,美联社开始使用人工智能程序处理有关企业收益的报道,令新闻业面貌为之一新。


在使用人工智能之前,美联社的编辑和记者在其中花费了无数资源制作财务报告,也因此分散了对有更大影响力的新闻的关注。即使大量投入,美联社每季度也只能制作300份财务报告,还有数千份潜在的公司收益报告未能成文。采用人工智能平台Automated Insights的Wordsmith,他们在几秒钟内就可以将那些投资研究的收益数据转换为可发布的新闻报道,效率大大提升,美联社制作的季度收益报告一下子达到4,400个,效率是手动工作的近15倍。


当然,美联社只是使用人工智能的一家媒体,实际上,同时期使用人工智能的媒体还包括彭博社、路透社、福布斯、纽约时报、华盛顿邮报、英国广播公司等大型媒体。这些大型媒体的人工智能应用主要是将机器学习运用于采集、制作和分发新闻等各个流程。


比如,华盛顿邮报利用名为Heliograf的自动化编辑器,使得机器可以生成简单的新闻故事,尤其是涉及大规模的数据报告或比赛统计数据。


福布斯业推出了一个名为“Bertie”的全新网站, Bertie是一个AI内容发布平台,该网站采用内容管理系统驱动,专门为内部新闻编辑室和合作伙伴打造。通过Bertie,可以生成更具吸引力的标题,进行图片与故事内容的精准匹配,还能对阅读难度进行评估。


对于国内的媒体机构来说,早在2015年,腾讯财经就已推出自动化新闻写作机器人Dream Writer,据Dream Writer的研发团队透露,它的内容生产方式主要是基于大数据分析平台,在短时间内选出新闻点、抓取相关资料,通过学习固定的新闻模板生成稿件,它的优势在于适用在信息量巨大的财经资讯类新闻,在准确率和时效性上都完胜人类记者编辑。


除了腾讯Dream Writer,类似的还有新华社的机器新闻生产系统“快笔小新”。它通过对数据采集、加工,并进行自动写稿、编辑签发,以最快的速度地完成例如体育赛事、中英文稿件和财经新闻的自动撰写等。


不过,在大模型还未爆发之前,相比普通的新闻记者,人工智能新闻采编虽然在时效性、准确性上更具优势,还处于比较基础的状态,缺乏共情力、调查力、创造力和思想力,能做到效率的提高,还未能进行更加深度的分析和解释,因此很难写出富有创意的报道。


直到2022年以来,以ChatGPT为代表的大型语言模型和基础模型得到突破性进展,人工智能新闻采编才有了明显的改变。和过去的任何一个人工智能产品都不同,以ChatGPT为代表的大型语言模型擅长于各种各样的任务,并且展现出不输于人类的性能和水平。


英国的新闻网站journalism.co.uk在今年1月专门发表了一篇文章,总结了ChatGPT可以为记者完成八项任务:生成大文本和文档的摘要;生成问题和答案;提供报价;制造标题;将文章翻译成不同的语言;生成邮件主题和写邮件;生成社交帖子;为文章提供上下文。美国《内幕》(Insider)全球总编辑卡尔森甚至将ChatGPT称为“海啸”:海啸即将来临,我们要么驾驭它,要么被它消灭。他认为人工智能会让新闻业变得更快更好。


ChatGPT给新闻业带来了什么?

ChatGPT横空出世,对新闻业的震撼非同小可。


在国际上,许多媒体已经开展了相关尝试。新闻聚合网站BuzzFeed发布由AI作答的测试栏目quizzes,并表示将使用AIGC编写测试类内容,以替代部分人力。5月24日,《华盛顿邮报》宣布成立跨部门AI协同机制,包括战略决策团队AITaskforce和执行团队AIHub,以更好地适应AI创新实践。国内媒体如澎湃新闻、封面新闻、上游新闻等百余家媒体机构在今年2月宣布接入AIGC产品。


新闻工作者已经从ChatGPT获得助力。《纽约时报》观点专栏作家曼珠认为,ChatGPT这样的应用将成为许多记者工具包的常规应用。他在自己的文章将ChatGPT比喻为新闻工作者获得的新型喷气飞行器,虽然有时它会崩掉,但有时它则会翱翔、升腾,能够在几秒钟、几分钟内完成过去数小时才能完成的任务。


目前,以ChatGPT为代表的AIGC对于新闻业的影响主要集中于新闻生产阶段。而随着ChatGPT等AIGC技术能力的提升以及应用程度的加深,它对于新闻业的影响也会日益深化。


一方面,AIGC将优化新闻信息的采集与处理。借助plugins等插件,ChatGPT可以快速抓取和采集海量数据,并进行自动处理,如快速浏览文本和生成摘要,为新闻工作者提供有力的数据分析,从而提供见解或启发,帮助记者寻找更独特的角度、更有洞察力的思考方向。这种能力提供了一种提升信息获取效率的可能,在资料检索阶段,记者和编辑无需阅读大量全文资料,而可利用ChatGPT的数据分析和语义分析能力生成摘要,快速获取核心信息,以提高工作的效率。


ChatGPT的语言生成能力还可用于翻译跨语言文本,方便记者和编辑获取不同语种的资料与信息。同时,AIGC工具能辅助记者进行采访音视频内容识别与整理,提高生产力并优化创作流程。


另一方面,AIGC还能直接进行新闻内容的生成,提升报道效率。


ChatGPT具有较强的学习能力和文本生成能力,在联网之后,还能迅速采集互联网资料进行新闻内容的生成。通过提示词的设置,ChatGPT还可以生成特定风格的新闻报道。除此之外,ChatGPT可以应用于生成访谈提纲、文章框架和标题等内容,还能将新闻报道翻译成多种语言,打破语言边界。


部分媒体已将AIGC纳入到新闻内容的生产流程中。如BuzzFeed将ChatGPT用于测验类内容的生成;2023年情人节前,《纽约时报》使用ChatGPT创建了一个情人节消息生成器,用户只需要输入几个提示指令,程序就可以自动生成情书;德国出版集团AxelSpringer和英国出版商Reach,近期也在地方新闻网站上发布了由AI撰写的文章。


全球首个完全由人工智能生成新闻报道的平台NewsGPT.com也已经上线。根据声明,该网站没有人工记者,由NewsGPT实时扫描、分析来自世界各地的新闻来源,包括社交媒体、新闻网站等,并创建新闻报道和报告。其创始人声称,NewsGPT“不受广告主、个人观点的影响”,7*24小时提供“可靠的”新闻。


不准确的假新闻?

看起来,ChatGPT等生成式人工智能为新闻业的效率与革新带来了前所未有的发展,但在机会到来的同时,挑战也在到来。
究其原因,ChatGPT等生成式人工智能本质上依然只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复。
由于数据和模式的种种缺陷,生成式人工智能存在系统性偏见、价值观对抗、“观点霸权”、刻板印象、虚假信息等问题。而模型本身也有其局限性。大型语言模型缺乏常识性的推理能力,由此带来了其能力的局限性。这类局限的最大困境是:生成式人工智能不理解其生成的文本的含义。


当生成式人工智能面对细微差别、歧义或讽刺之类的内容时,它难以理解其中的真实意义;它可以生成似是而非但不正确甚至荒谬的文本;它无法验证其输出的真实性;它的输出可能是公式化的,可能会单调乏味、缺乏想象力;它可以生成带有偏见、歧视性或有毒的文本。这也就是所谓的AI幻觉,即人工智能的“胡言乱语”。


然而,对于专业媒体来说,新闻报道最重要的就是严谨性和真实性,任何新闻报道都要对读者负责,也要为机构声誉负责,信息源混乱的AIGC显然不是理想的选择。如彭博传媒首席数字官JuliaBeizer所评价的,媒体的定位是为读者提供基于事实的信息,但AI并不足以作为准确的信息源。这就意味着,一旦AI幻觉问题无法获得有效的解决,AI编写新闻将会成为假新闻的源发地。


2023年,美国科技新闻网站CNET.com一度上线了几十篇由AI生成的文章,尽管网站编辑声称文章在发布之前都经过了“核查和编辑”,但是很快读者发现,这些文章中有大量基础性错误,并且其中一半都存在抄袭和剽窃的问题。


这也是为什么美国最大新闻出版商Gannett宣布,将暂停使用人工智能(AI)工具撰写体育新闻的原因。Gannett发言人声称,已经暂停了所有使用LedeAI的服务与试验,除了在全国增加数百个报道岗位外,还会加强人工智能工具,以确保提供的所有新闻和信息都符合最高的新闻标准。LedeAI首席执行官Jay Allred对Gannett报纸上的文章“包含错误、不必要的重复和尴尬的措辞”表示遗憾,并补充说该公司“正在全力以赴纠正问题并做出适当的改变。”


新技术的应用,往往会带来颠覆性的变化。正如媒介学者约书亚·梅洛维茨所言:任何一种媒介的介入,都会创造出全新的环境。尽管目前AIGC还存在着一些问题,但这并不阻碍人工智能技术取代新闻采编工作的趋势。面对来势汹汹的AIGC浪潮,新闻业无法置身事外,势必也将被卷入其中,甚至被彻底重塑。但在此之前,我们仍需谨慎面对技术带来的风险,审慎回应技术带来的挑战。


来源:钛媒体
链接:https://www.tmtpost.com/6699982.html
编辑:潘洁



734#
 楼主| 发表于 2023-9-10 16:51:52 | 只看该作者
《纽约时报》更新服务条款,禁止将新闻报道用于AI开发

近日,美国《纽约时报》更新了服务条款,禁止将该媒体的新闻报道和图片等用于开发任何软件程式,包括训练机器学习或人工智能(AI)系统。


据日本共同社8月16日报道,《纽约时报》更新后的服务条款还规定,未经出版物的书面许可,不得使用旨在使用、登入或收集此类内容的网站爬虫等自动化工具。所有在《纽约时报》刊登或提供的相片、影像、设计、音讯及视讯短片,以及其他资料及数据等,都不得用于AI开发。


《纽约时报》方面表示,若违反这些新限制,可能会被追究民事或刑事责任。《纽约时报》方面还指出,此前也一直禁止用于AI开发,变更条款是为了进一步使该禁令更明确。


另一方面,美联社7月与ChatGPT的开发商OpenAI签署合作协议,同意提供过去的报道用于数据学习;而拥有《华尔街日报》的新闻集团也正在考虑向AI开发人员收取使用其内容的费用,将生成式AI视为未来业绩的支持。


来源:澎湃新闻
链接:https://www.thepaper.cn/newsDetail_forward_24251759
编辑:潘洁

735#
 楼主| 发表于 2023-9-15 19:32:16 | 只看该作者
【案例】
美国科技大佬齐聚国会闭门商讨AI,“对文明的未来非常重要”
此次闭门会议是美国参议院首届“人工智能洞察论坛”的一部分。60多名参议员坐在台下,听台上20多名硅谷首席执行官和人工智能伦理学家讨论生成式人工智能的“文明风险”。
·科技公司高管大致认可了政府对人工智能进行监管的想法,但对于监管的内容几乎没有达成共识,存在很多具体的分歧。马斯克和扎克伯格坐的位置距离很远,马斯克还与人发生了争执。
当地时间9月13日,美国参议院举行“人工智能洞察论坛”的闭门简报会,20多名硅谷首席执行官和人工智能伦理学家坐在台上讲话。
当地时间9月13日,美国参议院举行了一次不同寻常的闭门简报会,与会者是美国最大的科技公司高管,被戏称为“镀金时代以来最大的垄断者聚会”。
通常在听证会上,议员们端坐台上逼问台下的科技企业家,而在这次闭门会议中,60多名参议员像小学生一样坐在台下,聆听台上20多名硅谷首席执行官和人工智能伦理学家讨论生成式人工智能的“文明风险”。
特斯拉、SpaceX和X(前推特)的首席执行官埃隆·马斯克在会场外对记者说:“对我们来说,有一名裁判很重要。”“(会议)可能会载入史册,因为它对文明的未来非常重要。”
相比马斯克言辞中的科幻色彩,一些与会者更强调人工智能在当下现实中的风险。会议中,科技公司高管大致认可了政府对人工智能进行监管的想法,但对于监管的内容几乎没有达成共识,立法的政治道路仍然困难。
特斯拉、SpaceX和X(前推特)的首席执行官马斯克在闭门会后接受记者的采访。
“人工智能的发展应该遵循美国的价值观”
此次会议是美国参议院首届“人工智能洞察论坛”的一部分。每位参与者有3分钟时间就他们选择的主题发表演讲,组织简报会的纽约州民主党人、参议院多数党领袖查克·舒默(Chuck Schumer)和南达科他州共和党参议员迈克·朗兹(Mike Rounds)随后主持了小组讨论。尽管是一次闭门会议,但很多与会者会后都接受了媒体的采访,关于会议的细节逐渐得到披露。
舒默问与会嘉宾:“政府是否需要在监管人工智能方面发挥作用?”“每个人都举起了手,尽管他们有不同的观点。”舒默说,“所以这给了我们一个信息:我们必须尝试采取行动,尽管过程可能很困难。”在上午的会议后,舒默告诉记者,立法应该在几个月内而不是几年内出台。
ChatGPT的开发机构OpenAI的首席执行官山姆·奥特曼(Sam Altman)表示:“我认为人们都同意,这是我们需要政府领导的事情。”“对于如何发生存在一些分歧,但一致认为这是重要且紧迫的。”
OpenAI首席执行官山姆·奥特曼抵达会场后与记者交谈。
与会者称,马斯克和谷歌前首席执行官埃里克·施密特提出了人工智能带来的生存风险,微软联合创始人比尔·盖茨专注于解决全球饥饿问题。IBM首席执行官阿尔文德·克里希纳(Arvind Krishna)表示,反对关于人工智能开发许可证的提案。
Meta首席执行官马克·扎克伯格谈到了封闭与开源人工智能模型。他称Meta的开源人工智能是确保广泛使用该技术的一种方式,不过Meta“对此并不狂热”。“我们并不开源一切。我们认为封闭的模式也很好,但我们也认为更开放的方法在许多情况下可以创造更多价值。”他说:“下一个领先的开源模式……来自阿布扎比。”
Meta首席执行官马克·扎克伯格离开会场。
一位发言者提到1996年制定的《通信规范法》第230条,即著名的“230条款”。该条款授予互联网公司“豁免权”,旨在保护互联网公司免于对第三方在其平台上发布的内容承担责任。“其中一位发言者说,‘让技术的用户和创造者承担责任。’”怀俄明州共和党参议员辛西娅·鲁米斯(Cynthia Lummis)说,“换句话说,他特别说,‘不要为人工智能制订第230条。’”
印第安纳州共和党参议员托德·扬(Todd Young)说,与会者一致认为,人工智能的发展应该遵循美国的价值观。
一位不愿透露姓名的与会者表示,与会者普遍认为联邦政府需要“帮助应对我们所谓的变革性创新”。舒默告诉记者,这可能需要创建一个320亿美元的基金,以帮助“最大限度地发挥人工智能的好处”。
英伟达首席执行官黄仁勋抵达会场,没有穿皮夹克。
不平等、隐私、假消息
会议中存在很多具体的分歧。一些人设想建立一个全面的新人工智能机构,而另一些人则认为现有实体——比如国家标准与技术研究院(NIST)更适合实施监管。马斯克后来表示,他认为有可能成立一个监管机构。谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)拒绝透露具体细节,但总体上支持华盛顿参与的想法。
扎克伯格、奥特曼和盖茨在整个上午的会议中“明显存在分歧”,比如在开源人工智能带来的风险上看法不同。马斯克与加州大学伯克利分校的研究员黛布·拉吉 (Deb Raji)发生了争执,据房间里的一位人士透露,他似乎淡化了对人工智能驱动的自动驾驶汽车的担忧。
除了企业家和议员,受邀在简报会上发言的专家也阐述了对人工智能的担忧。
西班牙裔民权组织UnidosUS主席珍妮特·穆尔吉亚(Janet Murguía)表示,论坛的与会者和科技领袖讨论建立和扩大人工智能的收益,但许多拉丁裔仍然缺乏宽带互联网接入。她说,这一现实凸显了“现有基础设施的差距如何阻碍我们进入人工智能的大门”。
穆尔吉亚也提到了地理定位跟踪和人脸识别等人工智能驱动的工具,并指出最近发布的一份报告发现,使用人脸识别的联邦执法机构缺乏保护人们隐私和公民权利的措施。
美国教师联合会主席兰迪·温加滕(Randi Weingarten)发表讲话称,400美元就可以资助虚假信息活动。随后,人道技术中心的特里斯坦·哈里斯(Tristan Harris)谈到如何花费800美元和几个小时的工作来剥离Llama 2(Meta开发的大语言模型)的安全控制,并使其分享制造生物武器的指南。“这就像我们在争论毁灭世界的成本有多低。”温加滕说。
温加滕表示,教师和学生应该受到保护,免受不平等、身份盗窃、虚假信息和人工智能可能助长的其他伤害,有意义的联邦立法应该保护隐私并寻求解决工作岗位流失等问题。
房间里的人总净资产为5500亿美元
一些参议员批评公众被排除在会议之外,认为科技高管应该公开作证。
密苏里州共和党参议员乔什·霍利(Josh Hawley)表示,他不会参加“大型科技公司的大型鸡尾酒会”。霍利与康涅狄格州民主党参议员理查德·布卢门撒尔(Richard Blumenthal)一起提出立法,要求科技公司为高风险人工智能系统申请许可证。“我不知道为什么我们会邀请世界上所有最大的垄断者来向国会提供如何帮助他们赚更多钱的建议,然后不对公众开放。”他说。
黄仁勋(左一)、皮查伊(左二)和扎克伯格(左三)在会场。
非营利组织AI Now Institute的董事总经理莎拉·迈尔斯·韦斯特(Sarah Myers West)估计,会议房间里的人总净资产为5500亿美元,“很难想象这样一个房间能以任何方式有意义地代表更广泛公众的利益。”她没有参加会议。
还有议员对这种形式的讨论会是否有作用表示怀疑。“让科技巨头参加闭门会议与参议员交谈并且不回答任何棘手的问题,对于试图制定任何形式的立法来说都是一个可怕的先例。”马萨诸塞州民主党参议员伊丽莎白·沃伦(Elizabeth Warren)说。
马斯克和扎克伯格坐的位置距离很远,分别靠近一张很长的桌子的两端。
一些人把关注点放在了其他地方。一张照片显示,马斯克和扎克伯格坐的位置距离很远,分别靠近长桌的两端。马斯克和扎克伯格最近关系紧张,推特和Meta的新社交媒体产品Threads正处于竞争中,两人都表示要组织一场在笼子里的肉搏。
来源:澎湃新闻
编辑:洪韵

736#
 楼主| 发表于 2023-9-15 19:43:08 | 只看该作者
【案例】
日本正打造日语版“ChatGPT” 投入数亿美元 你看好吗?
CNMO新闻】ChatGPT的热度在全球虽有下降,但仍未消散。据CNMO了解,日本正在打造日语版的聊天机器人ChatGPT。外媒称,日本政府联合NEC、富士通、软银等大型科技公司开发日语的大型语言模型(LLM),预计投入达数亿美元。
ChatGPT
据报道,研究自然语言处理的日本东北大学研究员Keisuke Sakaguchi认为,目前的大型语言模型智能系统在英语方面表现出色,但在日语方面表现平平。由于日语的复杂性,ChatGPT有时会生成大多数人从未见过的罕见的字符,以及奇怪的未知单词。
研究日语模型的东京大学物理学家Passaglia表示,LLM目前远远落后于GPT-4,但将来未必不能达到或超过GPT-4的水平。其认为,这只是资源问题,并不是技术上无法克服的问题。
值得一提的是,创建LLM需要使用日本超级计算机Fugaku,主要用于训练日语输入。与GPT-4和其他专有模式不同,它将与其他开源LLM一起向所有用户提供其代码。
东京庆应义塾大学医学院医学技术研究员Shotaro Kinoshita表示,如果日文版的ChatGPT能够表述准确,有望为那些想学习日语或进行日本研究的人带来好处,从而产生积极影响。
来源:手机新闻
编辑:洪韵

737#
 楼主| 发表于 2023-9-18 14:49:25 | 只看该作者
案例】
关乎数字媒体成败的四大趋势: 生成式人工智能、Z世代、商业模式和新闻格式


“FIPP媒体创新报告”向人们展示了媒体公司如何利用最新的机会并解决最紧迫问题的努力方向。




根据FIPP(国际期刊联盟)最近发布的《2023年媒体创新报告》(FIPP Media Innovation Report 2023),2023年的传媒业将经历一场永久性危机快速、改变世界的创新
这份长达160页的报告详细阐述了媒体机构面临的紧迫挑战和机遇。最聪明的媒体公司做对了什么? 他们靠什么赚钱? 你的新闻编辑部能做些什么来走在潮流的前面? 我们梳理了这些页面,筛选出了四个主要的数字媒体趋势。

1.生成式人工智能Generative AI
ChatGPT, Bard, Bing。生成式人工智能工具目前非常流行。还有知名度较低的Ernie 和 Poe。许多组织都在关注生成式人工智能这项技术在快捷方式和工作流程方面的潜力。

法国《世界报》(Le Monde)正在使用ChatGPT将其作品(部分)翻译成英文。意大利报纸Foglio Quotidiano将其作为游戏的一部分,测试读者识别人工智能生成的文章的能力。Reach plc旗下的网站InYourArea(在你的区域内)正在使用它来发布本地待办事项指南。数字媒体新秀Semafor正在测试其清除拼写错误和事实错误的能力。

如果你有资金、技术和专业知识,你可以构建自己的生成式人工智能,就像彭博社(Bloomberg)开发的bloomggpttm一样。它接受了大量金融数据的训练,成为其新闻编辑部更可靠的工具。

这种谨慎的应对措施是可以理解的。编辑风险(不准确、错误信息和“幻觉”)、道德挑战(裁员)和法律风险(抄袭)都与使用这项技术有关。
生成式人工智能工具的好处是,它把那些平凡的编辑任务从编辑部的办公桌上移除掉了。新的角色和团队也需要与人工智能合作——不仅仅只是报道它的发展——它可以在媒体机构中创造出新的角色,即使它可能会消除掉其他角色。所有这些都使其使用的透明度变得更加紧迫。

《连线》杂志、《卫报》和德国新闻社都发表了关于何时使用人工智能以及何时不使用人工智能的声明。像Sifted这样的小型媒体组织也指出了它正在使用的所有人工智能工具。底线是对这个领域保持谨慎的好奇心,并与像JournalismAI这样的组织合作,它们正在弥合新闻编辑部的知识鸿沟。

2.    Z 世代(Gen Z

我们新一代的新闻迷们正在彻底改变内容的创造、传播和消费方式。Z世代被称为“数字原住民”(digital natives)是有原因的: 他们从未经历过一个没有互联网、智能手机和社交媒体的世界。

Z世代年龄在8到25岁之间,他们有非常特殊的新闻消费习惯。他们消费新闻的时间、地点和原因是经过深思熟虑的。

毫无疑问,社交媒体是任何希望触及25岁以下人群的新闻机构的必备工具。今年的路透社研究所数字新闻报告(DNR)显示,Facebook的暴跌和TikTok的飙升终于首次在中间相遇。Z世代使用这两种工具的比例相当(38%)。大多数人使用Instagram(60%),后者越来越多地受到TikTok功能的影响。

事实上,Z世代是高度怀疑的新闻消费者,不愿为新闻付费。媒体洞察项目的研究发现,大约一半的美国Z世代受众为某种类型的新闻内容付费或捐款。47%的人愿意为独立创作者的电子邮件通讯(newsletters)、视频或音频内容付费,这是平面媒体或数字报纸等传统来源(22%)的两倍。

如果不是媒介的问题,那么问题可能是固有的。Z世代经常发现大量的新闻报道让他们不堪重负,让他们情绪低落,也没有给他们留下任何切实的行动或解决方案。

今年的数字新闻报告(DNR)提出了其他建议; 这可能只是因为人们对新闻的兴趣下降了。解释器(Explainers)、流言终结者(myth busters)和测验(quizzes)都是新闻的主要形式,对这一受众群体来说,它们被证明是刺激、有用和有趣的。

这些都是近年来迅速涌现的“社交优先”(social-first)新闻品牌的显著元素,以Seen(以前的Hashtag Our Stories 标注我们的稿件)等开拓者为首,为“新闻运动”(The News Movement)、“Ac2ality”、“Openly”(公开,汤森路透基金会的产品)和其他许多新闻品牌铺平了道路。作为一个以LGBTQ+问题为中心的平台,“Openly”是一个很好的例子,说明价值观是社交媒体平台吸引受众参与的驱动力。

这些新来者对传统媒体构成了挑战,因为Z世代不像前几代人那样受传统媒体品牌的影响。大多数传统媒体都在适应社交媒体以保持与受众的关联性,其中许多传统媒体——如德国之声、BBC新闻、每日邮报、天空新闻和华盛顿邮报——已经积累了数百万的粉丝。

这带来了新的挑战,媒体机构需要重新思考新闻价值和内容创作(个性驱动、垂直视频),以及如何以最佳方式培训和管理Z世代记者驾驭好社交媒体战略。

3.    商业模式(Business Models

数字媒体公司有多种收入来源可供选择。这也是一项很好的工作,因为,它们非常不稳定,过于依赖任何单一来源都不是一个好主意。
该报告建议至少有三种不同的收入来源,其中一种必须是读者收入模式,为企业提供40%的总收入。新冠(Covid-19)大流行带来了人们对新闻的狂热兴趣,并愿意为此付费。现在,日益严重的生活成本危机已经平息了这种狂热,人们开始收紧个人预算。

订阅(Subscription)和会员(membership)仍然代表着媒体企业的最佳利润潜力,交易成本最低。最好的读者收入模式是建立在为付费用户提供高质量、原创、多样化和有用的内容的基础上的。如果没有这些成分,人们取消订阅的风险就很高。
《纽约时报》(New York Times)似乎已经掌握了订阅捆绑服务(subscription bundle),其付费数字用户已达到900万。读者会被每周低至0.5英镑的试用价所吸引,然后就会被它的全面订阅(all-access subscription)所吸引。在2016年收购了在线消费指南Wirecutter、2022年收购了热门体育网站The Athletic、今年又收购了热门益智游戏Wordle之后,时报公司的捆绑业务近年来变得更加强大。

这一游戏的名称是价值,所有大型数字订阅业务——《经济学人》、《时代传媒》、《金融时报》、《华盛顿邮报》——都在向这个方向倾斜。当销售对象是其他公司而不是个人消费者时,留存率通常会更高。Axios今年推出的Axios pro订阅服务就证明了这一点,它的订阅用户达到了3000家,收入达到了200万美元。

“俱乐部”或会员制提供了类似的更轻松的方式。《卫报》成功的自愿捐赠模式就是最典型的例子,拥有超过100万的数字订户。慢新闻初创公司Tortoise有10万名会员注册,并可以让这些用户参与到他们所阅读的新闻之中,美国出版商Quartz在发现收费墙无效后就取消了它,波兰新闻机构Gazeta Wyborcza通过向其读者提供直接接触其采编团队的权限,吸引了28万多名会员。

除了读者收入,第一方数据策略是一个相当新的机会。一些新闻机构和新闻集团已经建立了自己的机制来收集自己的受众数据,并与广告商达成定制的直接交易。

Vox Media的“强音” (Forte)、新闻集团(News Corp)的“新闻智商”(News IQ)、《知情人》(Insider )的“传奇”(Saga)、《南华早报》的“灯塔”(Lighthouse)和《华盛顿邮报》的“宙斯洞察”(Zeus Insights)都活跃在这个领域。地区性新闻出版商也在寻求利用第一方数据。

新闻机构也可以依靠自己的专业技能和知识,为读者提供教育服务。《经济学人》于2021年推出了在线课程《经济学家教育》,作为新的收入来源。《华尔街日报》和《金融时报》也分别开设了时事通讯课程“六周金钱挑战”和“MBA 101”。

《金融时报》还涉足活动(FT Live)和咨询(FT Strategies)这两个新兴的摇钱树。品牌授权交易(Brand licensing deals)、联盟营销(affiliate marketing)和电子商务交易以及商品交易是新闻机构获利的其他机会。

4.    新格式(New Formats

现代媒体机构正在摒弃那些传统的、经典的新闻写作手法,押注于有望提高信息可读性和可浏览性的新风格。Axios标志性的智能简洁(项目符号和有力的信息)和Semafor的Semaform(对文章进行模块化处理)是定义新闻新格式的两个主要例子。

其理论是,这将减轻新闻读者的负担。在这个信息爆炸的时代,他们基本上不堪重负,时间也很紧张。坦率地说,这样做的理由也是切合实际的,允许读者在文章中反复阅读。当读者可以选择他们需要的内容并离开时,他们会获得更令人满意的整体新闻体验。没有人想挖掘细节。

FT Edit(金融时报编辑精华)或Economist Espresso(经济学人浓缩)等新闻应用也注重尊重用户的时间。直接,简洁和专业策划的新闻摘要使产品更容易“完成”。这反过来又培养了受众的阅读习惯和忠诚度。

法国《世界报》(Le Monde)的应用La Matinale正在对音频进行更多的试验。用户可以将音频文章添加到播放列表中,就像一个自我策划的新闻简报一样。自主性和流畅的用户体验是这里的两个主要卖点,因为非付费用户只能选择一些免费文章。

音频和视频无疑正在崛起。“语音提示新闻”(Voice note journalism)是一种以非正式的方式直接给读者发短信的方式。个人通讯平台WhatsApp和Telegram也提供类似的选项。

TikTok(抖音)改变了短视频的游戏规则,要求在更短的时间内提供更生动、更有力的内容。


来源: 媒变前沿MediaChange (公众号)
编辑:覃韵琪



738#
 楼主| 发表于 2023-9-18 23:09:55 | 只看该作者
【案例】
万兴科技亮相 10 余款 AI 应用,即将推出“天幕”多媒体大模型



据 36Kr 报道,9 月 15 日,AIGC 软件 A 股上市公司万兴科技在 2023 世界计算大会上亮相嵌入大模型能力的 10 余款 AI 应用,同时宣布结合 20 年视频应用及出海实战等积累,即将推出更懂创作者的百亿级参数“天幕”多媒体大模型,推进数字创意软件进入大模型驱动新时代。

据悉,“天幕”是国内首个专注于以视频创意应用为核心的多媒体大模型。会上,万兴科技还与湘江实验室正式达成战略合作,双方将共同构建产学研用联盟创新体系,推进人才、技术与应用成果转化的合作。万兴科技董事长吴太兵接受媒体采访时表示,大模型时代,应用为王,但大模型可能是“王后”。万兴科技将首先聚焦应用,做 AI 时代的“美的”,同时积极开发升级多媒体大模型,夯实护城河。



来源:腾讯网

链接:https://new.qq.com/rain/a/20230915A08ZAH00

编辑:覃韵琪



739#
 楼主| 发表于 2023-9-19 20:28:42 | 只看该作者
【案例】
尼克 | 乔姆斯基 vs ChatGPT
编者按

今日,保马推送尼克老师的文章《乔姆斯基 vs ChatGPT》。本文以乔姆斯基对ChatGPT能力的误判为切入点,看到了这位曾经深刻的创新者对ChatGPT所持的否定态度是由于对大语言模型的忽视。文中详述了乔姆斯基年轻时对语言学和计算机科学的贡献。乔姆斯基认为语言的交流功能是思想功能的外化,语言是比其他感知模态更加基础的官能。大语言模型要求人们对“思维即语言”的立场重新审视。乔姆斯基对于人类语言知识的本质、来源和使用问题的看法,与GPT对于非人类语言知识的本质、来源和使用问题的看法针锋相对,且GPT不具有可解释性,因此乔姆斯基才会对其作出否定性的评价。最后本文表明虽然乔姆斯基对ChatGPT可能有所误判,但他的“思维即语言”的立场依然是大语言模型引发的这场革命的哲学基础之一。
本文首发于《上海书评》,感谢授权保马发布。


乔姆斯基 vs ChatGPT

文 | 尼克

乔姆斯基对语言学、计算机科学、认知科学和哲学有深刻贡献,同时他也是在世的最有影响力的知识分子之一。有人说他位列有史以来引用数最高的十位思想者,这话即使不完全准确,应该也很接近。用Google Ngram查一下:他的名声和维特根斯坦差不多,高于波普尔、托尔斯泰、图灵和哥德尔,但逊于罗素,更不要说爱因斯坦、牛顿和希腊三贤。

ChatGPT 2022年底横空出世。2023年3月8日,近九十五岁的乔姆斯基应《纽约时报》之邀发表文章:The False Promise of ChatGPT,如文题所示,乔姆斯基对ChatGPT不买账。文中用了一个几乎在他老人家所有著作中都出现过的例句:John is too stubborn to talk to。乔姆斯基认为机器会把这个句子理解为:John太固执不愿意和人谈话;而不会正确地理解其本意:John不可理喻。但网民们把这个例句丢给ChatGPT:ChatGPT准确地知道这个句子的深层含义。乔姆斯基被打了脸。乔姆斯基对他年轻时代的新兴学科如计算机科学和认知科学的前沿成果了如指掌,但对大语言模型却持忽视态度。斯坦福大学的计算语言学家克里斯·曼宁(Chris Manning)在推文中说:“看到一位年轻时深刻的创新者,现在却保守地阻碍激动人心的新方法,真是令人悲伤。”这大概也是崇拜过乔姆斯基的两代人的普遍失望:乔老爷老了。当然,期盼年过九旬的乔姆斯基亲手微调大语言模型,是不公平的。

乔姆斯基其人
乔姆斯基的父母和那时大多数犹太人一样都是复国主义者,同时有强烈的不自私的社会主义色彩。作为左派犹太家庭的孩子,乔姆斯基十二岁就涉足政治,他的政治态度受他老师哈里斯的影响,不信布尔什维克,也反犹太复国主义。乔姆斯基刚结婚时曾考虑到迁居以色列,反讽的是,他出名后因为反犹立场,被以色列拒绝签证。他1960年代因参与反越战活动,曾被美国政府关押。他的同牢房狱友是诺曼·梅勒,梅勒说他是个书呆子,在监狱里还在担心没法给学生上课怎么办。他1970年冒险访问越南和老挝。为了保护乔姆斯基,麻省理工学院一度雇了两个专职保镖——相较于鸡贼的邻居哈佛,麻省理工更富理想和勇气。乔姆斯基的最新政论书《美国梦安魂曲》表现出他的博学,我们甚至有信心他可以成为一个绝妙的美国宪法律师。他的政治立场也并非一成不变,但有一个基本原则:永远站在弱势一边,借用那个“墙和鸡蛋”的比喻,乔姆斯基永远是那个鸡蛋,具体地说,就是反美反犹。在评论拉美政治时,乔姆斯基居然坚定支持笃信天主教的神父们。基辛格影响力如日中天时,乔姆斯基曾是他的激烈批评者。基辛格在大洋的另一边一直是香饽饽,但现在的大多数美国年轻人甚至不知道此人的存在。基辛格有点像西洋参,所有美国华人回国探亲前都会在中国商店买点回国送人,但西洋参真不西洋。

简单地说,“柏拉图之问”和“奥威尔之问”是驱动乔姆斯基一生的两条主线。“柏拉图之问”即后人所谓“刺激贫乏论”(poverty of stimulus):在可借鉴的事物极端贫乏的情况下,人类是如何获取如此丰富的知识的;而“奥威尔之问”恰相反:在可借鉴事物如此之多的情况下,人类所知为何如此之少。奥威尔是第一人称叙事,他曾说:“每个生命从内部看都是一串失败。”(Any life, when viewed from the inside, is simply a series of defeats.)第一人称叙事者少有乐观派。乔姆斯基做学问时,贴近柏拉图,而从事政治活动时,遵循奥威尔。在他麻省理工学院办公室里,曾经挂着一幅巨大的罗素照片,大有罗素之后舍我其谁的架势。语言学之于乔姆斯基,就像逻辑学之于罗素。他们都关心政治和社会进步,承认平等的同时也强调自由。在乔姆斯基心中,奥威尔大概会排在罗素之前。乔姆斯基不是一般意义的左派,他是无政府主义者。
乔姆斯基虽自称是理性主义者,但内心却鄙视现代欧陆哲学。他和法国人福柯的对谈,被欧陆学界引申,但乔姆斯基自己则称两人不是严肃的对话,只是看看不借助翻译是否能听懂彼此的母语。乔姆斯基直言德里达、拉康和福柯等法国文科知识分子是“骗子”“文盲”“邪教”。他对反智极端愤恨。


《语言科学》(The Science of Language),詹姆斯·麦吉尔弗雷(James McGilvray)著。

如果看乔姆斯基过去二十年的著作和访谈,翻来覆去都是讲同样的几件事,核心立场并无大变。他的所有采访都被编辑成书。他讲话虽然少有激情,但语言严谨清晰且通俗,这是他能海量出版的原因,只要把演讲和采访的录音转为文字就可以了,几乎不用修改。《语言科学》(The Science of Language)一书是加拿大语言哲学家詹姆斯·麦吉尔弗雷(James McGilvray)对乔姆斯基的采访记录,这是乔姆斯基思想最通俗易懂的介绍。乔姆斯基认为笛卡尔和休谟之后,哲学家已经普遍落后于时代,只有少数几个哲学家是例外:康德、弗里格、罗素和美国哲学家中唯一被他佩服的皮尔士。《语言与心智》(Languages and Mind)是根据乔姆斯基1967年在加州大学伯克利分校的三次贝克曼讲座的内容整理而成,到2006年出第三版时增加了生物语言学的内容,篇幅增加了近一倍。更新版的《我们是谁》(What Kind of Creatures Are We)很可读,最后一章显示出他对科学史的广泛涉猎。如果把这几本书当作乔姆斯基本人的著述,别人写的必读书肯定包括英国语言学家莱昂斯(John Lyons)的《乔姆斯基》,这书附有术语表,解释乔姆斯基特定的术语。另一位英国语言学家尼尔·史密斯(Neil Smith)写的乔姆斯基学述更加全面,除了语言学,还公平地评论了他的政治,书名就叫Ideas and Ideals, 很明显,Ideas指学问,Ideals指政治。


《语言与心智》(Languages and Mind),乔姆斯基著。

1953年乔姆斯基和新婚妻子卡罗尔去欧洲度假,在从蒙特利尔到鹿特丹的跨洋破船上,乔姆斯基严重晕船,于是躺平,开始重新审视他老师哈里斯的结构语言学。他想出了广义文法(Universal Grammar,UG)。乔姆斯基从与他同年的数学家、逻辑学家马丁·戴维斯处了解到戴维斯的老师、逻辑学家波斯特(Post)的工作。乔姆斯基早期最有影响的文章《语言描述的三个模型》(Three Models for the Description of Language,1956)中引用了数学家罗森布鲁姆(Paul C. Rosenbloom)的教科书《数理逻辑要素》(The Elements of Mathematical Logic),其中正式地讲述了产生式系统。这篇文章后来衍生出乔姆斯基分层,对语言学和计算机科学都有深刻影响:乔姆斯基-0型文法(递归可枚举语言)等价于图灵机,1型文法(上下文相关语言)等价于线性有界非确定图灵机,2型文法(上下文无关语言)等价于非确定下压自动机,3型文法就是码农们熟悉的正则表达式,等价于有限自动机。“短语结构文法”(phrase structure grammar),在乔姆斯基早期著作中不严格地用来泛指Post系统,但后来则特指1型和2型文法。对编程语言有巨大影响的Algol-60语言是用BNF(巴克斯-诺尔范式)描述的,而BNF就是上下文无关文法。乔姆斯基认为短语结构文法不足以描述自然语言。除了四层分法,还有五层分法,即在常规的0型和1型之间,加个递归语言(recursive language),递归与递归可枚举的区别在于对应的图灵机是不是可停机。再讲下去需要点数学和计算理论的知识,就此打住。语言学家冯志伟先生的《现代语言学流派》可作为进一步的入门参考。

乔姆斯基最重要的著作《语言学理论的逻辑结构》完成于1955年,他的博士论文取自这书。他把打字稿交给麻省理工学院出版社,想作为专著出版,但审稿的语言学家们并不认可,回复是这样一个初出茅庐的年轻人提出的非常规思路应该先写成论文交给学术刊物,待学术界认可后再出书。但乔姆斯基关于此题材的第一篇论文恰被拒稿。审稿者根本就没看,直接将原件寄回。“三个模型”一文最终还是在美国电气电子工程师学会IEEE的前身IRE组织的信息论会议上宣读,后来正式发表于IRE的《信息论学报》。乔姆斯基在这次会上结识了参会的数学家所罗门诺夫,他在会上也宣读了一篇文章,并由此开辟了算法信息论。两人互相启发,所罗门诺夫早期文章常引用乔姆斯基的生成文法。如果他也像乔老爷这么长寿,就能够活着欣慰地看到:是算法信息论为ChatGPT奠定了理论基础,这个故事值得另一篇长文,暂且不表。

乔姆斯基的伯乐是比他年长几岁的同校青年教授,一位是认知心理学的创立者之一乔治·米勒(George Miller)和犹太裔语言学家莫里斯·哈利(Morris Halle)。米勒是最早看过《语言学理论的逻辑结构》的人。哈利看了乔姆斯基给本科生上课的讲稿,推荐给Mouton出版社作为现代语言学丛书的一个小册子先出版了,这就是《句法结构》。这本科普书好评如潮,奠定了乔姆斯基在语言学界的地位,而更学术的《语言学理论的逻辑结构》则要到二十年后才正式出版。他的语言学经历了几个阶段的变化:1950年代转换生成文法,1960年代标准理论,
1970年代管辖与约束(government和binding),1980年代最简方案。平克曾经用“文革”语言戏称乔老爷语言学思想的变化为“继续革命”,但他的核心思想——“思维是由语言生成的”(这里简称“思维即语言”或“语言即思维”),从来没有变过。

思维即语言?

乔姆斯基的理论在语言学界被认为是开天辟地的,所谓“乔姆斯基革命”。但从计算机科学和逻辑学的角度看,它是自然的。乔姆斯基承认广义文法(UG)受到波斯特的启发。可惜波斯特既没有被逻辑学家(如哥德尔)欣赏,也没有被数学家包容。相较于计算机科学,语言学是迟钝的:计算机科学几乎与相应的数理逻辑同步,当哥德尔和海伯伦 1934年定义了广义递归函数,图灵1936年就发明了图灵机;而波斯特的工作要到1956年才被乔姆斯基引入语言学。乔姆斯基之前,语言学是文科,乔老爷力图把语言学变成自然科学。乔姆斯基称第一次认知革命发生在十七世纪,主角是笛卡尔;而第二次认知革命发生在1950年代的麻省理工。乔姆斯基甚至把“思维即语言”回溯到基督教杨森派主要人物阿尔诺(Arnauld)写的《王港语法》,阿尔诺和同时代的笛卡尔和帕斯卡相熟,并深受他们影响。也有语言学史家认为乔姆斯基误读了《王港语法》。


《普遍唯理语法》(《王港语法》),阿尔诺、朗斯洛著。

与英美经验主义传统不同,乔姆斯基自称是理性主义者,他的语言学理论也被他冠以笛卡尔语言学的帽子。在语言是区分智人和其他物种的决定性因素上,认知科学家和进化心理学家都同意乔姆斯基。但在语言的来源上,乔姆斯基和大家有明显分歧。波普尔和平克等认为语言是进化的产物,所谓渐进派;而乔姆斯基则认为语言是突现的,他自称“跳跃”(saltation)派。

乔姆斯基不断地引用洪堡的说法“语言是有限手段的无限运用”。他提出的一个极为简单的机制:“合并”(merge),其实是一种原始的递归机制,考虑到通用递归函数等价于图灵机,我们不惊奇“合并”机制可以解释所有的语法现象。对乔姆斯基来说,只要能找到“合并”的生物学解释,他的计划就可以变成科学理论了——他目前都以更加谦逊的“计划”(program)而不是“理论”来指称自己的研究。如果“合并”的生物学解释成立,那么这不过是丘奇-图灵论题的一个生物学支持证据而已。如果承认语言等于思维,实际上承认了图灵机可以思维。

语言学家说“思维即语言”,有点像物理学家(例如网红迈克斯•泰格马克)说“数学等于物理”。常人看,思维肯定大于语言,而数学也大于物理。图灵测试是语言能力的测试,无关其他模态。十几年前深度学习能火起来,是因为神经网络解决了语音和视觉问题,但那时人们只是兴奋。GPT却令人惊喜甚至震撼。无论是语音还是视觉,我们都认为这是增强人的能力。但直到2022年ChatGPT在语言能力的突破才使人意识到人性可能被冒犯。语言要比听觉和视觉更接近人性。

乔姆斯基认为语言的交流功能是思想功能的外化,思想在先,交流在后。他还认为人类可能在十万到五万年前因为基因突变,导致了递归枚举能力。这种突变可能在人类更早的历史上发生过多次,只不过这次有了显著的群体效果。感觉-运动系统(sensory-motor)是语言外化的结果。乔姆斯基的妻子卡罗尔是麻省理工学院的生物语言学家,她研究过两岁前得过脑膜炎的儿童,他们丧失了视觉和听觉,但还保留有触觉。他们能通过触觉补偿语言能力,从而能思维。这证明了语言是比其他感知模态更加基础的官能。

GPT的G就是乔姆斯基生成文法中所谓“生成”。乔姆斯基最出名的例句大概是:Colorless green ideas sleep furiously. 这个生成的句子被传统经验主义者批判为“虚无”,但很多诗人赞赏这个句子,称其富有禅意。按照当下流行的GPT术语,就是“幻觉”(hallucination),或者创造力。


《人类理解论》英文本,洛克于其中提出“白板说”。

乔姆斯基虽不愿承认还原论,但他的方法论本质上还是还原论的:他企图找到语言的生物学基础。他称赞图灵把生物学问题还原到物理学问题——图灵1952年做过形态学(Chemical Basis of Morphogenesis)。牛顿也很困惑万有引力不能归约到机械力学,即任何运动必须有某种物理的推动。乔姆斯基不认可经验主义和行为主义,他有时也称之为马赫主义。他认为深度学习就是当代的行为主义。洛克说心灵是白板,莱布尼茨说心灵不是白板,而是有纹理的大理石板。虽然图灵测试被看作是行为主义的,但一个基本假设是数据是喂给图灵机的,而图灵机不是白板。经验主义者也不得不承认思维源于某种有组织的物质(organized matter)。如果承认丘奇-图灵论题,那么所谓“有组织的物质”和理性主义者所谓“纹理”都可被看作是图灵机或者与之等价的“语言官能”。经验主义者会把学习看作记忆,而承认丘奇-图灵论题的人会把学习看作压缩。通用人工智能(AGI)不过是不熟悉计算理论的人提出的口号,如果我们认可语言即思维,那么,AGI的标准就是语言,无关乎其他模态,这就又回到图灵测试。

思维不等于语言?

塔南鲍姆(Joshua Tenenbaum)是麻省理工学院大脑与认知科学系的学术新星。他父亲曾是1980年代硅谷人工智能重镇Schlumberger实验室的掌门人,后来连环创业,我和老塔同事时,小塔还没上高中,现在居然成了大佬。ChatGPT出来后,小塔跟风,企图标新立异这样一种观点:大语言模型解决了语言问题,但还是不能思维。他和几位同道学生在arXiv上挂了篇文章Dissociating Language and Thought in Large Language Models: A Cognitive Perspective,标题一目了然:分离语言与思维。他们把语言能力分为形式能力(formal competence)和功能能力(functional competence),结论大致是大语言模型解决了形式能力,而没有解决功能能力,所以思维不等于语言。小塔所谓“功能能力”就是用言语同世界打交道,换算成大模型的术语就是“多模态”。其实,他们对语言能力的划分,都是乔姆斯基玩剩下的,乔老爷早就有内部语言(I-语言)与外部语言(E-语言)之分,内部语言是天生的能力(competence),外部语言用于行为(performance),这本就是两件不同的事情。小塔的“功能能力”对应于乔老爷的外部语言。内部语言受制于生物、数学和物理的约束。乔姆斯基应该认可丘奇-图灵论题的某个版本。任何相信丘奇-图灵论题的人不会是纯粹的理性主义者,也不会是纯粹的经验主义者。乔姆斯基-0型文法等价于图灵机,所谓“语言官能”(language faculty)等价于某种自动机。这间接地支持思维即语言的论断。

内部语言关乎“真”,尺度是内在一致性;而外部语言关乎“意义”,尺度是外在对应性。意义得自交流,维特根斯坦所谓“意义即使用”,或者约翰·奥斯汀所谓“以言行事”(do things with words),“言语行为”都是指外部语言。外部语言对应于工程师们感兴趣的 embodied intelligence(中文别扭地翻译为“具身智能”)或“多模态”(视觉、听觉、触觉等)。意义是功能层在与外界交互时进行强化学习的过程。乔老爷认为外部语言是交流而不是思维。小塔并没有提出什么新东西。即使马斯克这样聪明的工程师也认为自动驾驶之类的具身智能是狭隘的(narrow form),要远比人们想象的简单,这很明显要比喜欢讨好大众的小塔更加有洞见。



《哲学研究》德文本,维特根斯坦于其中提出“意义即用法”。

承认思维即语言,对工程实践也会有影响。设计多模态大模型时,承认派会把语言模型作为基座,其他模态坐在基座之上,不同模态之间的沟通也通过基座进行。但否认派可能企图直接在任意模态之间建立映射,这明显不经济。

设想在火星上做自动驾驶,如果所有的停车标志(STOP)都是绿色的,难道我们需要拿所有的数据重新训练一遍火星自动驾驶大模型吗?如果驾驶员是人,一条简单的指令:“注意!停车标志是绿色的”,就足以让人适应新的驾驶场景。难道在大语言模型上不可以用一条简单的提示或者“咒语”(prompt):“把所有停车标志的颜色替换成绿色”吗?事实上,1970年代普渡大学的傅京孙就曾经用语言学的手段研究视觉,当时不被广泛认可。可惜他英年早逝。如果在“思维即语言”的立场重新审视视觉,傅京孙可算得高瞻远瞩。

大语言模型的可解释性

2000年,麻省理工学院的人文社科学院成立五十年的庆祝大会上,乔姆斯基、普特南和平克三人参加一个论坛,题为“关于人性,我们知道什么?”(What Do We Know About Human Nature?)这场论坛被组织者称为“三大男高音”齐聚。从休谟起,人性的核心是思维。平克把认知革命归功于乔姆斯基。乔老爷和普特南曾经在宾夕法尼亚大学同学,立场偶有不同,但彼此尊重。2011年5月,麻省理工学院为配合一百五十周年校庆,召开名为“大脑、心、机器”的研讨会(Brain, Mind and Machine Symposium),本校的几位大佬乔姆斯基、明斯基、温斯顿等悉数出席,并由平克主持。乔姆斯基批评当时重新开始流行的神经网络是黑盒子:没有提供解释和知识。麻省理工学院主办的《技术评论》杂志为这个研讨会发了专文,标题故意挑事儿:“不会思维的机器”(Unthinking Machines)。时任谷歌研发总监的诺维格(Peter Norvig)很快回应乔姆斯基,他批评语言学的规则在自然语言处理上,根本就没用。现在看,诺维格的工程实践还真给了他一些先知先觉。有人用“两种文化”来总结乔姆斯基和诺维格的隔空掐架。

语言问题曾被理所应当地认为是逻辑的,现在却被用神经网络得到满意地解决,这本身就是令人惊奇的。工程师们甚至认为语言的中间任务(词分析、句法分析、语义分析)已经不需要认真对待了,因为ChatGPT代表的大模型对语言学问题给出了端到端的解决办法。语言学家就是研究各种中间步骤的,中间步骤就是解释。其实在1990年代统计方法被引入之后,自然语言处理(NLP)就越来越不需要语言学了,曾有玩笑:NLP团队每开除一个语言学家,系统的性能就提升一个台阶。估计令乔姆斯基沮丧的是:大语言模型把自己的工作彻底搞丢了。诺维格的合作者、伯克利教授斯图亚特·罗素(Stuart Russell)的态度则一直温和得多。他怀疑ChatGPT的良好表现是不是碰巧碰上的。他说:“如今的自然语言处理不再研究语言,我认为这是非常不幸的。”这和乔姆斯基的态度差不多,斯图亚特·罗素仍然把希望寄托于知识和推理。他们都认为ChatGPT是工程而不是关乎语言的科学。人类专属的技能不多了,难道我们要等到机器证明了黎曼猜想才能被彻底折服吗?


乔姆斯基与笛卡尔的不同之处在于,乔姆斯基并不是试图在心身之间划一条明确界限的二元论者。这么说,和晚年蒯因的“整体主义”也没啥太大区别,都接近皮尔士的实用主义。相同的是,他们都认为语言是人的独有能力,但乔姆斯基用语言作为人和动物的划界,而笛卡尔用语言作为人和机器的划界。笛卡尔认为人类语言是任何自动机也不能实现的,他大概不会认可丘奇-图灵论题。
乔姆斯基曾说他自己的方法是“伽利略式”的,也就是从小数据里找寻基本定律,而不是用大数据构建黑盒子。但如果人人都有低成本的黑盒子,谁还要麻烦基本定律呢?虽然乔姆斯基在技术上对ChatGPT可能有所误判,但他“思维即语言”的立场却是大语言模型引发的这场革命的哲学基础之一。



来源:保马 (公众号)
编辑:覃韵琪

740#
 楼主| 发表于 2023-9-20 19:44:23 | 只看该作者
【案例】
新进展!马斯克公司开始招募人脑芯片植入试验参与者
中新网9月20日电 综合外媒报道,当地时间19日,埃隆·马斯克旗下的人脑芯片植入公司Neuralink表示,该公司已获得一个独立审查委员会的批准,开始进行人脑植入芯片的首次人体临床试验,目前正在招募参与者。


资料图:马斯克与其公司Neuralink的标志。

据美国《福布斯》杂志网站报道,Neuralink公司致力于研发一种完全植入式的无线脑机接口,使瘫痪患者能够直接通过大脑控制设备。此前,Neuralink公司已经进行了动物试验,并于5月获得了美国食品药品监督管理局(FDA)批准,可在人体上开展临床研究。
报道称,目前Neuralink公司正在招募“因患有颈部脊髓损伤或肌萎缩侧索硬化(ALS)而导致四肢瘫痪”、年龄至少22岁、有“可靠的看护者”的受试人员参与试验。预计完成该试验大约需要6年时间。
路透社报道称,据该公司员工表示,Neuralink公司此前希望获批10个参与者名额,但美国食品药品监督管理局(FDA)提出了对于安全问题的担忧。目前尚不清美国食品药品监督管理局(FDA)最终批准了多少名额。
报道称,专家表示,即使脑机接口设备被证明可以安全地供人类使用,Neuralink公司仍需要十多年时间才能获得商业使用许可。
据此前报道,近年来,马斯克为Neuralink公司公开制定了充满雄心的计划。2022年底马斯克曾表示,他对于公司研发的装置已经充满信心,甚至愿意将其植入自己孩子的大脑内。



来源:中国新闻网
编辑:覃韵琪

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表