传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
381#
 楼主| 发表于 2020-1-16 22:40:08 | 只看该作者
【案例】
什么是人工智能?
本文节选自由上海教育出版社出版,任友群教授主编的《人工智能》系列教材高中分册,《人工智能》(高中分册)由复旦大学附属中学吴强老师和复旦大学肖仰华教授联合主编。现将引言部分内容公开征集反馈。本文文字和图片版权均归上海教育出版社所有。本文为原创文章,若需转载,请留言询问。

什么是人工智能

人工智能(Artificial Intelligence,简称“ AI”)自诞生之日 起,其定义与内涵就一直存在争议。从字面上看,AI 由“人 工”和“智能”两词构成,其核心是智能。因此,人工智能首先 是智能的一种。但是人工智能是人造的,而非自然形成的智能(如我们人类的智能就是经过长期的进化而形成的一种生物智能)。进一步理解人工智能的关键,在于理解“智能是什么”, 这其实是一个难以回答的问题。一个普遍的认识是“智能是利用知识解决问题的能力”。作为“万物之灵长”的人类,其智能很大程度上就体现在人类能够发现知识并利用知识解决各类问 题。人工智能的研究与实践的一个重要目标就是回答“智能是什么”这一问题。对这个问题的回答,将成为我们这代人甚至后面几代人共同努力的方向与目标。 如果需要给人工智能下一个定义,可以表述为:人工智能是通过智能机器延伸、增强人类改造自然和治理社会能力的科学与技术。人工智能首先是一门科学,因为我们需要解释智能 的本质,需要回答智能能否计算、如何计算等科学问题。人工智能更是一项工程,因为我们需要让机器实现对于人类智能的模拟,从而解决需要人类智能才能解决的问题。因此,人工智 能兼有科学与工程的属性。也正是这个原因,决定了人工智能的跨学科和综合特性。人工智能涉及哲学、心理学、数学、语言学、计算机等多个学科。人工智能的最终目标不是发展自主的机器智能,而是借助人工智能增强人类认识世界、改造世界的能力。拓展和延伸人类的智能,并最终造福人类社会,是发展人工智能的根本使命,也是唯一使命。人工智能是以人类智能为模板进行拓印与塑形的,理解与模拟人类智能是人工智能实现的基本路径。人类智能,外观体现为行为,内察体现为思维。人工智能的研究与实践不论其形式如何不同,其最终落脚点要么是让机器具备人类身体的智能行为能力,要么是让机器具备人类心灵的复杂思维能力。 人类的智能行为能力体现在其身体的感知与运动能力。我们的身体具有五官与四肢。我们通过五官识音辨声、识图辨形、辨别气味等,通过四肢操纵物体、运动身体,从而实现身体与环境的复杂交互。机器实现这些能力需要具备模式识别与反馈控制能力。比如,为了识别一个手写字是不是“0”,机器必须能够从手写体输入数据中识别出“0”所对应的书写模式。模式识别能力是我们五官所具备的基本能力。我们人类的四肢能够十分柔韧、灵活地做出各类动作,实现各类物体操纵,这背后体现的是人类四肢与环境的强大交互能力。比如机械手臂在抓举物品时,需要实时感知物品的位置以及抓举的力度,从而及时调整抓举的动作与姿态,最终完成抓举动作。近年来,机器在模式识别与运动控制等能力上飞速发展,已经初步达到人类水平。以感知数据中的模式、物理世界的状态为主,让机器具备人类的智能行为为主要目标的人工智能研究和实践,我们称之为“感知派”。 人类的智能更为鲜明地体现在人类的复杂心智上。人类的心智活动十分多样,包括语言理解、场景理解、调度规划、智能检索、学习归纳、推理决策等。塑造人类心智能力的器官是我 们的大脑。理解大脑的运作机制,从而实现类脑智能,一直以来是科学家们持之以恒为之奋斗的目标之一。随着人工智能的发展,让机器具有一颗聪慧的大脑,已被迫切地提上议事日程。有身无心的机器就好比没有灵魂的“僵尸”,虽然也能解决很多问题,但是难以进入人类社会,成为人类有趣的“伙伴”。如 果人工智能的发展仅是停留在感知与运动阶段,机器只是达到了一般动物的智能水平,而真正意义上使得人类从动物本性中脱胎而出的是人类独有的心智能力。虽然动物也有大脑,也有 一定的心智水平,但是人类心智与动物心智的根本差别在于人类的认知能力。认知能力是指人脑接受外界信息,经过加工处理,转换成内在的心理活动,从而形成对世界的认知体验的过程。它包括时空认知、因果认知、语言认知、文化认知等方面。很显然,目前只有人类具有认知能力,以“认知”为基础的人工智能研究和实践,被称为“认知派”,将是未来人工智能研究与实践的焦点。 值得注意的是,虽然人类是实现人工智能的模板,但是人工智能在当下的实践已经不单单以“类人”为目标,很多时候是远超人类水平的。人类的特定智能很多情况下是有局限的。比如,我们在决定买哪本人工智能教材时,其决策要素一般不超过 5—7 个,而机器则可以同时考虑数以百万计的决策要素进行判断。人类感知的物理范围是十分有限的,而机器视觉可 以识别数千米范围内的目标。因此,在很多单项智能上,人类被机器超越只是时间问题,如计算、下棋、识图、辨声等。人工智能的发展进程必定是我们见证人类单项智能被机器逐步超越 的过程。但是有一个至关重要的奖项,智能的“全能冠军”,却是机器难以从人类手中夺走的。无数个智能的单项冠军也难以企及这一“全能冠军”的智能水平。这就引出了人工智能的强弱之分的话题。人工智能除了有“感知”与“认知”之分,亦有“强”“弱”之 分。任何一台普通的计算器在数值运算方面的能力远超我们人类最聪明的头脑,但是不会有人觉得他比 3岁的儿童更智能。其背 后的根本原因在于,计算器只能胜任数值计算这一单项任务,而 3岁儿童却能胜任几乎无法穷举的任务,如识别父母、寻找奶瓶、 辨别声音等。因此,智能的强弱很大程度上体现在其通用或单一的程度。强的智能是能够胜任任何任务求解所需要的智能,而弱的智能仅限于解决某个特定任务,强人工智能的实现显然远远难于弱人工智能。当前取得实际应用效果的仍以弱人工智能为主。实现强人工智能任重道远,但却不可回避。因为强人工智能解决 的是人工智能的根本难题:现实世界的开放性。现实世界是复杂的,真实任务是多样的,而我们的计算机当前只能胜任预定义的任务与场景,一旦碰到从未见过的案例、样本、场景,就显得无能为力。努力提升机器智能的适应性,以及对于开放性的应对能力,已经成为人工智能最为重要的研究课题之一。 值得注意的是,人工智能仍然是个不断发展中的学科,其内涵仍在不断丰富与完善,一些新的研究视角在为人工智能持续增添新的内涵,如 AI 的安全性与可控性、AI 的黑盒化与可解释、AI 与人文学科、AI 与社会发展、AI 与脑科学等,这些新的研究视角在持续推动 AI 概念的发展与完善。
人工智能发展的历程

“理想很丰满,现实很骨感”,“柳暗花明又一村”,用这两句话来表达人工智能的发展历程是再恰当不过的了。纵观人工智能的发展历程,大体可分为三次高潮和两个低谷期。
1.  人工智能发展的第一次高潮
20 世纪 40 至 50 年代,来自不同领域的一批科学家开 始探讨制造人工大脑的可能性,这是人工智能问题的雏形。1943 年,美国麻省理工学院的两位科学家沃伦·麦卡洛克 (Warren McCulloch)和沃尔特·皮茨( Walter Pitts)提出了一种生物神经元的数学模型,使得利用计算机模拟的人工神经元成为可能。多个人工神经元连接在一起可以形成一个类 似生物神经网络的网络结构(参见图引 -1)。1957 年,弗兰克·罗森勃拉特(Frank Rosenblatt)提出了感知器模型,将神经网络研究推向工程实现。
1950 年,英国计算机专家艾伦·图灵( Alan Turing)提出了著名的图灵测试,用来判断一台机器是否具有人类智能。它更像一场有趣的“模仿游戏”:由测试者向被测试者提出多个问 题,根据被测试者的回答判断被测试者是人还是机器。如果有超过 30% 的测试者不能确定被测试者是人还是机器,那么就可以说这台机器具有人类智能(参见图引 -2)。由于图灵测试只能测试机器是否具有智能的外在表现,随着人工智能的发展,它日益暴露出局限性。设想一下, 如果将对话任务换成下围棋,我们现在显然无法再根据机器的围棋水平来判断对方是人还是机器。因为众所周知,机器在围棋游戏方面已经远超人类冠军水平。随着机器语音和对话能力的提升,我们也越来越难以判断为你服务的电话客服到底是机器还是人类。
1956 年,在美国汉诺威小镇的达特茅斯学院召开的一次研讨会上,一批各有所长的科学家聚在一起,讨论着一个当时被认为不切实际的主题——让逐渐成熟的计算机代替人类解决一些感知、认知乃至决策的问题。会议整整开了 2 个月,科学家们各执一词,谁都说服不了谁,最后有人提出了“人工智能”的说法。这次会议被公认为人工智能诞生的标志。同年,人工智能被确立为一门学科。 这一新兴学科的产生,很快就引起学术界的广泛关注,研究者纷至沓来,新课题层出不穷。从 20 世纪 50 年代后期到 60 年代,涌现出了一大批成功的 AI 程序和新的研究方向。有人 开发了程序 STUDENT,它能够解决高中程度的代数应用题, 被认为是人工智能在自然语言处理领域早期的应用成果。有人创建了全世界最早的聊天机器人 ELIZA,它可以使用英语和用户交流。ELIZA 是一个早期的自然语言处理程序,它通过模式匹配和替代的方式来实现人机对话(其实只是按固定套路作答,机器并不理解语言的意义,实际上距离真正的人工智能还有很长的距离要走)。 20 世纪 60 年代中期,人工智能研究在资金方面得到了大量资助,并且在世界各地建立了实验室。当时人工智能的研究人员们对未来充满信心,著名的科学家赫伯特·西蒙( Herbert Simon)甚至预言:“机器将能够在20 年内完成人类可以做的任何工作。”还有的科学家认为“在一代人之内……创造‘人工智能’的问题将基本解决”。人工智能研究迎来了第一个“黄金”发展时期。 然而,现实并不像人们预期的那样乐观,人工智能的发展遭遇了瓶颈。主要的原因是:当时计算机的运算能力和数据处理能力较低,数据也相对匮乏,不能满足解决复杂问题的需要。人工智能步入第一次低谷期。
2.  人工智能发展的第二次高潮
进入 20 世纪 80 年代早期后,随着新兴的工业、商业、金融等行业的发展,人工智能研究作为附属于其他行业的辅助性手段与工具得到了一定的恢复。 这一时期比较有代表性的研究进展包括:一是“专家系统”的出现。这是一种模拟人类专家知识和分析技能的人工智能系统, 通过知识表示和知识推理技术,来模拟领域专家解决问题的过程。专家系统以知识库和推理机为核心,利用知识得到一个满意的解是系统的求解目标。著名的专家系统包括:ExSys( 第一 个商用的专家系统 )、Mycin(一个诊断系统)等。二是神经网络模型的再次兴起。大卫·鲁姆哈特(David Rumelhart)等人于 20 世纪 80 年代提出的多层感知器及反向传播算法,优化了神经网络的训练方法。 这一时期比较有影响力的人工智能应用是日本的“第五代计算机项目”。20 世纪 80 年代,日本提出了“第五代计算机项目”。它的主要目标之一是突破所谓的“冯·诺依曼瓶颈” (冯·诺依曼架构是以存储程序为核心思想的主流计算机体系结构,当时的日本学者认为这一体系结构只能实现有限的运算和信息处理,因此称之为“冯·诺依曼瓶颈”),实现具有推理以及知识处理能力的人工智能计算机。在第五代计算机项目的激励下,人工智能领域的研究项目得到推进。1985 年,人工智能市场规模已超过十亿美元。然而,好景不长。受限于当时有限的数据和算力,机器仍然难以应对复杂情形。比如,专家系统中的 if-then 规则在描述复杂问题时呈指数增长,有限的算力难以支撑这类复杂问题的 解决。从 1987 年 Lisp(人工智能程序设计的主要语言)机市场崩溃开始,人们对专家系统和人工智能失去信任,人工智能进入第二次低谷期。
3.  人工智能发展的第三次高潮
始于 20 世纪 90 年代末和本世纪初,人工智能再一次悄然崛起。2006 年,加拿大多伦多大学的杰弗里·辛顿( Geoffrey Hinton)教授及其学生提出了深度学习,并迅速在图像识别、语音识别、游戏和搜索引擎等领域获得显著效果。除了以深度学习为代表算法的这一原因之外,这一阶段的成功还得益于计算机计算能力的提升以及各行各业海量数据的累积。 这一波人工智能浪潮仍在发展,已发生的比较具有代表性的事件有: 一是计算机与人类的棋坛博弈。1997年 5 月 11 日,深蓝成为第一个击败卫冕国际象棋世界冠军加里·卡斯帕罗夫的计算机国际象棋系统。2016 年 3 月,阿尔法围棋( AlphaGo)以 4∶1 击败李世石,成为第一个击败职业围棋世界冠军的电脑围棋程序。2017 年 5 月,阿尔法围棋在中国乌镇围棋峰会的三局比赛中,击败了当时世界排名第一的中国棋手柯洁。在这个基础上,经过强化学习训练后,阿法元 (AlphaGoZero)无需人类经验,通过自我博弈,以100∶0 击败阿尔法围棋。二是机器在图像识别与语音识别等任务中达到人类水平。图像处理任务中的错误率自 2011 年以来显著下降。在计算机视觉领域,如手写数字体识别数据集上,神经网络的准确率已 经超过人类的平均准确率。在语音识别方面,科大讯飞等公司的语音识别率高达 98%(2018 年的水平),语音识别水平在 2016 年就已经达到了人类水平。三是机器在语言理解等相关任务上取得长足的进步。让机器具备理解人类自然语言的能力是人工智能发展历程中具有里程碑意义的任务。更有专家认为,语言理解是人工智能桂冠上 的明珠。近年来,得益于深度学习模型和大规模语料,机器在一系列语言理解任务中攻城略地。比如在斯坦福问答数据集 (Stanford Question Answering Dataset,简称“ SQuAD”)文本理解挑战赛上,早在 2018 年年初,来自阿里的研究团队所提出的机器阅读理解模型就取得超过人类水平的准确率。在2018 年的谷歌 I/O 大会上,谷歌展示了一段谷歌助理(谷歌的一个应用软件)与人类长达数分钟的电话,现场观众几乎无法分辨出谁是机器,谁是人类。此后,各类客服电话大量由机器代替, 智能客服的成功应用大幅降低了人工客服成本。 这些事件的发生,让人们充分认识到人工智能技术所蕴含的经济价值与社会潜能。人们对人工智能技术的认识由此上升到了一个前所未有的高度,从而极大地推动了人工智能技术的发展。


人工智能研究的不同视角

人工智能是个庞杂的学科,不同的视角对人工智能的理解不尽相同。让我们来了解一下人工智能研究中主要学术流派的看法吧!

1.  符号主义流派是这样认为的
符号主义流派认为人工智能源于数理逻辑,又称“逻辑主义流派”。数理逻辑从 19 世纪末起获得迅速发展,到 20 世纪 30 年代开始用于描述智能行为。计算机出现后,又在计算机上 实现了逻辑演绎系统,其代表性成果为启发式程序 LT(逻辑 理论家),证明了 38 条数学定理,表明应用计算机研究人的思维过程,可以模拟人类智能活动。符号主义认为人类的认知过程是符号操作与运算的过程, 主张用公理和逻辑体系搭建一套人工智能系统。符号主义认为,知识表示、知识推理和知识应用是人工智能的核心。知识 可以用符号来表示,认知是符号加工的过程,推理是使用理智从某些前提产生结论的行动。符号主义者致力于用计算机的符号操作来模拟人的认知过程,其实质就是模拟人的左脑抽象逻 辑思维。符号主义者最早采用了“人工智能”这个术语,后来又发展了专家系统、知识工程理论与技术,并在20 世纪 80 年代取得了很大发展。 符号主义流派曾长期一枝独秀,为人工智能的发展作出重要贡献,尤其是专家系统的成功开发与应用,为人工智能走向工程应用、实现理论联系实际具有重要意义。在人工智能的其 他学派出现之后,符号主义仍然是人工智能的主流学派之一。

2.  联结主义流派是这样认为的
联结主义学派,又称“仿生学派”或“生理学派”,其主要关注神经网络及神经网络间的联结机制和学习算法。联结主义认为,人工智能源于仿生学,特别是人脑模型的研究。联结主义从神经元开始,进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。联结主义学派从神经生理学和认知科学的研究成果出发,把人的智能归结为人脑的高层活动的结果,强调智能活动是由大量简单的单元通过复杂的相互联结后并行运行的结果,其中人工神经网络就是其代表性技术。 联结主义发端于 1943 年,诞生了生物神经元的计算模型“ M-P 模型”,其后经历了 1957 年“感知器”模型,1982 年 Hopfield 模型以及 1986 年提出的反向传播算法等代表性事件。联结主义在近期的代表性进展就是深度学习。2012 年,在 ImageNet 大型视觉识别挑战赛中,深度学习模型以绝对领先的成绩拔得头筹。随着硬件技术的发展,深度学习成为当下实现人工智能的主流技术之一。 符号主义与联结主义的发展呈现出此起彼落的态势。事实上,两者各有其价值与意义,对于人工智能的发展都是不可或缺的,应该协同并进、共同促进人工智能的发展。符号主义从宏观上(人类的思维过程)模拟人类的认知过程,而联结主义则从微观上(神经网络的结构与参数)实现对于人脑功能的模拟。从当前人工智能发展趋势来看,由联结主义实现模式识别等初步感知任务,进而将相关结果输入符号主义的相关系统中,实现深度的推理与解释,是未来人工智能发展的基本模式。

3.  行为主义流派是这样认为的
行为主义流派,又称“进化主义流派”或“控制论学派”。行为主义流派认为人工智能源于控制论,研究内容包括生命现象的仿生系统、人工建模与仿真、进化动力学、人工生命的计算理论、进化与学习综合系统以及人工生命的应用等。行为主义认为,人工智能可以像人类智能一样逐步进化,智能体的智能行为只能通过其与现实世界及周围环境的交互而表现出来。 控制论思想早在 20 世纪四五十年代就成为时代思潮的重要部分,影响了早期的人工智能研究者。美国数学家诺伯特·维纳( Norbert Wiener)等人提出的控制论和自组织系统以及我国科学家钱学森等人提出的工程控制论和生物控制论,影响了许多领域。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,如对自寻优、自适应、自校正、自镇定、自组织和自学习等控制论系统的研究,并进行“控制论动物”的研制。到 20 世纪六七十年代,上述这些控制论系统的研究取得一定进展,播下智能控制和智能机器人的种子,并在八十年代诞生了智能控制和智能机器人系统。 直到 20 世纪末,行为主义流派才以人工智能新学派的面孔出现,引起许多人的关注。这一学派的代表作首推美国麻省理工学院的罗德尼·布鲁克斯 (Rodney Brooks) 所研发的六足行走机器人, 它被看作新一代的“控制论动物”,是一个基于感知—动作模式的模拟昆虫行为的控制系统。事实上,这种通过与环境自适应交互所形成的智能,是一种“没有推理的智能”。近期,在深度强化学习等技术的推动下,机器人的环境交互能力得到显著提升,能跑会跳、满世界“溜达”的机器人已经逐步变成现实。
人工智能三要素

人工智能在近期的飞速发展,主要得益于数据的快速积累、计算能力的不断提升以及算法的改进优化。因此,人们把数据、算力和算法称为人工智能三要素。
1.  人工智能与大数据
什么是大数据?一般地说,大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优 化能力的海量、高增长率和多样化的信息资产。 大数据一般具有大量(Volume)、高速( Velocity)、多样(Variety)、低价值密度(Value)、真实性( Veracity)五个特点,也 称其为大数据的 5V 特点。“大量”指数据体量极大,数据量从 TB 级别到 PB 级别;“高速”指数据产生和处理的速度非常快, 如工业大数据应用中部署的各种传感器能够以每秒数个 G 的采集频率采集数据;“多样”指数据类型很多,如语音、文字、 图片和视频等,不同类型的数据往往需要不同的处理手段;“低价值密度”指大量的数据中有价值的只有极少数,如监控视频中最有价值的数据往往只有几秒;“真实性”指追求高质量的数据,因为数据的规模并不能为决策提供帮助,数据的真实性和质量才是制定正确决策的关键。 大数据在现实的生产与生活中有着大量的实际应用。例如,天气预报就是基于大数据而对未来天气作出的预测。这些数据可以是一年前的,也可以是几年、几十年甚至更长时间的数据积累。又如,在智能商业、工业 4.0、互联网服务、智慧金融等领域,大数据的运用使得这些领域发生了翻天覆地的变化和进步。 大数据所具有的海量数据的特质促进了计算机科学、信息科学、统计学等应用学科的飞速发展。与此同时, 随着数据量的爆炸式增长,非结构化的数据和残缺的数据也随之增加,用传统的方式处理大数据会极大地损失数据中蕴含的价值。 当前,人工智能的发展集中体现在机器学习上。机器学习的两种重要方式——监督学习和无监督学习——均需要大数据的“喂养”。监督学习是机器学习的有效手段之一。监督学习 过程中需要把有标注的样本“喂”给机器,而有标注的样本来自大数据,从这个意义来看,人工智能需要大数据。以深度学习为例,数据量越多,效果就越好。无监督学习则从海量数据 中学习统计模式来解决问题,同样离不开大数据。 那么,是否数据越多,是否有标 注的样本越多,效果就越好呢?有学者在图像的目标检测任务上进行了相关研究(参见图引 -4),得到的结论是:一方面,随着训练数据的扩展,任务性能呈对数增长,即使训练 图片规模达到 3 亿张,性能的上升 也没有出现停滞;而另一方面,对数增长也意味着当数据量达到一定程度后,模型性能的提升效果就不再显著。
当前人工智能发展的另一个重要体现是大规模知识工程技术。知识工程是以构建专家系统为核心内容的学科,旨在利用专家知识解决问题。进入互联网时代之后,大规模开放性应用需要大规模的简单知识表示。知识图谱就是这样的知识表示,其本质是一个大规模语义网络,包含实体、概念及其之间的各类语义关系。 知识图谱的诞生使得知识工程迈入了大数据时代。传统工程依赖专家进行知识获取所导致的瓶颈被突破了,前所未有的算力、算法和数据的“汇聚”,使得大规模自动化知识获取成为可能。从互联网数十亿文本当中,利用自动抽取模型,可以自动获取数亿计的结构化知识。互联网时代的高质量UGC(用户贡献内容),比如问答、论坛、维基等为自动化知识获取提供了大量优质的数据来源。与大数据共生的众包平台,使得我们可以更有效地利用闲散的人力资源。正是在这些机会的合力作用下,人类从小规模知识时代迈进了大规模知识时代。知识图谱有望引领知识工程的复兴。更多的知识表示形式会在大数据的赋能下,解决更多的实际问题(参见图引 -5,这是与一位足球明星有关的知识图谱)。
人工智能的第三次发展浪潮很大程度上是由大数据推动的,没有大数据的滋养,人工智能很难在当下取得突飞猛进的进步。当前人工智能的很多成功应用都发生在数据丰富的场景,如图像识别在准确率上的突破得益于大量普及的摄像头所采集的海量图像数据等。

2.  人工智能与算力
算力即计算能力。算力的显著增长,体现在计算机的数据存储容量和数据处理速度的快速提升(参见图引 -6、图 引 -7),均呈现出指数增长的趋势。我国的超级计算机“神威·太湖之光”的持续性能为 9.3 亿亿次 / 秒,峰值性能可以达到 12.5 亿亿次 / 秒。算力的快速增长,一方面是由于摩尔定律 (计算机硬件每隔一段时间便会翻倍升级)持续发挥作用,使得单体计算元器件的计算性能在增长。另一方面,以云计算为代表的性能扩容等技术也在持续发展。云计算能够将大规模廉价机器组织成高性能计算集群,提供匹配甚至远超大型机的计算能力。

人工智能的飞速发展离不开强大的算力。在人工智能概念刚刚被提出的时候,由于其计算能力的受限,当时并不能完成大规模并行计算与处理,人工智能系统能力比较薄弱。但是随 着深度学习的流行,人工智能技术的发展对高性能算力提出了日益迫切的需求。深度学习主要以深度神经网络模型为学习模型,深度神经网络是从浅层神经网络发展而来的。深度学习模 型的训练是个典型的高维参数优化问题。深度神经网络模型具有多层结构,这种多层结构带来了参数的指数增长。以 BERT(Bidirectional Encoder Representation from Transformers)为代表的语言模型多达 3 亿参数,最新的世界纪录是 Nvidia 训练出包含 83 亿参数的语言模型(2019年 8 月)。以 BERT 的 3 亿 参数的模型训练为例,研发团队共消耗了 16 块云 TPU(张量 处理单元)近 4 天时间才能训练完成,其中每块云 TPU 能提供 180 TFLOPs(1 TFLOPs 意味着每秒 1 万亿次的浮点运算能力) 算力和 64GB 内存。 国家间的人工智能之争已经在很大程度上演变为算力之 争。华为公司推出的一系列 AI 计算芯片在一定程度上推动了我国人工智能发展的算力的提升。

3.  人工智能与算法
算法是计算机解决问题或者执行计算的指令序列。很多数学模型在具体运行时往往需要实现相应的算法,算法与模型已经成为人工智能发展的重要支撑。人工智能的相关算法类型众 多,涉及搜索、规划、演化、协同与优化等一系列任务。当下,人工智能领域的快速发展尤为明显地体现在一系列新颖算法和模型的发展,特别是以深度学习为代表的机器学习算法的快速发展。机器学习是一种从观测数据(样本)中寻找规律,并利用学习到的规律(模型)对未知或无法观测的数据进行预测的方法。随着数据量的急剧增加,从大数据中发现统计规律,进而利用这些统计规律解决实际问题变得日益普遍。 当前大多数机器学习的本质是统计学习,即通过历史标注数据来拟合构建学习模型。以经典的线性回归为例,线性回归旨在从样本习得一个合适的线性映射f,使得对于输入变量 x, 经过 后能够得到正确的输出变量 y。假设我们有房屋面积与价格之间的历史数据(比如表引 -1 所示,第一列表示 60 米 2 的房屋价格为 300 万,其他列以此类推)。这里的每一对房屋面积和价格)就是一个样本,所有样本的集合为( , ),( ),…,( )。显然我们关心的是根据房屋面积预测房屋价格。房屋面积 就是输入变量或者解释变量,房屋价格 是我们需要预测的变量,是输出变量,或称响应变量。从这些样本数据学习到的房价与房屋面积之间的关系,可以表示为一 个函数 f(每个输入产生确定的唯一的输出)。f 接收某个房屋面积作为输入,预测相应的价格作为输出。例如,对于表格中不存在的 85平方米的房屋,通过 f函数我们就可以预测其价格。
为了学习房屋面积与房屋价格之间的函数关系,一种常见的学习方法是最小二乘法。首先假定f 是简单的线性函数形 式,也就是 f(x) = a + bx,其中 a,b 是参数。所谓确定 f 的函数形式,就是确定 a 和 b 两个参数的具体值。因此对 f 的学习, 就转换为对 a 和 b 两个参数的学习问题。很显然,如果 f 是一 个好的函数,就应该尽可能与当前已经观测到的样本一致,也就是 f(60)应该尽可能接近 300 万的真实价格。将这一期望推广到所有已观测样本,就有了如下的误差函数:
直观的理解是希望求得的线性函数(红色的直线)所预测的价格与实际价格累计平方误差 最小。可以通过偏导数求得上述误差函数最小化时的参数 a 与 b。根据求得的参数 a 与 b,就可以完全确定函数 f,从而可以根据任意面积进行房价预测(参见图引 -8)。机器学习有着很多任务,上述线性回归只是最简单的一类。如果 f 是非线性函数,那么就是非线性回归问题。房价是一个连续数值,在有些任务中要预测的是一个离散量。例如,根据体温、血液指标等预测病人是否得了感冒(只 需要判断是否感冒这两种情况),此时的机器学习问题就变成了分类问题。此外,我们经常需要对数据进行聚类,比如将客户自动聚类,从而分为不同人群。除了这些具体的问题模型外,机器学习还涉及众多算法,完成不同的任务,比如 K 近邻分类算法、基于“决策树”的分类算法、基于“支持向量机”的 分类算法、K 均值聚类算法、基于 PCA 的降维算法、基于梯度下降和进化算法的参数学习算法(如线性回归中的参数最优化学习)等。
... ... ... ...

原创: 吴强、肖仰华
文章来源:知识工场
原文链接:https://mp.weixin.qq.com/s/SQwtR1Jipc4hnFAF799knA
编辑:高杰

382#
 楼主| 发表于 2020-1-17 21:08:22 | 只看该作者
【案例】
余盛峰:人工智能时代的范式转移与法律变革
人工智能时代的范式转移与法律变革
作者:余盛峰,北京航空航天大学副教授。
来源:本文载《科学与社会》2019年第4期,是为即将出版的《临界:人工智能时代的全球法变迁》一书撰写的前言。
法学学术前沿联系和赐稿邮箱:
责任编辑:姜楚言

一、信息技术与法律关系的演变
人工智能的创始人之一,诺贝尔经济学奖得主司马贺(Herbert Simon)曾宣称:注意力信任不能大规模生产,所以不能成为商品。但是,人工智能和区块链的技术发展则似乎推翻了司马贺的认知:区块链和人工智能,可以使传统上难以流通和商品化的注意力信用度,成为可以批量化生产的流通商品。
事实上,人工智能、区块链、大数据等新兴技术,是过去二十年信息化和数字化技术发展的延伸。以数学为主要的思想手段,通过代码/算法,将原子世界全面转化为比特世界。其核心意识形态是:一切事物都可以数学化、计算化、模拟化、数据化。所有技术发展,是要在最大程度上将数量和质量都纳入信息化的轨道,把空间和时间维度进行数据化操作,把意义的社会、事物和时间维度,把一切社会系统、机械系统、生物系统全部打通,让信息成为贯通所有这些系统的元概念。简言之,要让信息成为理解、阐释、处理和支配世界的通用概念。正是在这个意义上,大数据改变了生产资料,人工智能变革了生产力,区块链改造了生产关系,token(通证)取代了货币。
传统经济模式被趋于完全互联的信息化网络深刻改造。零库存、大规模定制、3D打印、灵捷制造、即时生产、全球外包都是典型代表。市场和企业之间的界限在淡化,产权与契约之间的差异被削弱,有形资产的重要性则不断下降。跨国巨头、上下游供应商、血汗工厂劳工、消费者和政府监管机构,生产、研发、营销、仓储、金融、并购,所有原先属于线性经济过程的事物都开始进入平行的协作网络。时代的关键词发生了变化:去中心、共同演化、结构漂移、片段化、功能迁移、自我创生、复杂性、自我迭代、风险控制,而不再是简单的计划、监督、命令、惩罚和压制。
在这一背景下,可以观察到众多现象:其一,复杂性思想、系统论思维、控制论方法的兴起,博弈论、信息论、概率论、统计论、演化论思想,不断取代传统本体论和形而上思维;其二,交叉学科和跨学科发展,人文社科与自然科学、技术工程学的界限不断打通;其三,速度性、效率性和便捷性成为核心指标,一切都了让信息能够更好更迅速地流动;其四,从人文主义迈向后人文主义,人类不再是衡量一切的价值标准,信息生成和流动速度成为关键,不再只是信息服务于人,同时也是人服务于信息。所有这些现象,也都聚焦到一个核心问题:即法律和技术关系的演变。在过去的时代,技术是工具、客体和对象,技术被认为是中立性的,重点是法律如何监管和规制技术;而在当代,伴随技术的信息化和数字化,技术架构成为一切社会沟通展开的底层装置,也开始成为法律运作的基础设施。技术开始显现愈益鲜明的社会和政治性格。
不同的信息技术,不同的代码、算法、加密和共识机制,都开始深刻影响到我们的社会与政治结构。技术不再只是被动的客体和工具,不再只是法律规制的目标与对象,相反,法律开始内嵌到作为母体(matrix)的技术系统内部。不再是法律单向地规范和治理技术,而是技术也在同时塑造和改变法律所处的宏观环境。套用德国社会理论家卢曼(Niklas Luhmann)的概念,法律系统和技术系统开始成为相互观察的功能系统,法律和科技不再是决定和被决定、塑造和被塑造的关系,法律与科技互为系统与环境,形成系统间或松散或紧密的结构耦合关系。而且,更值得注意的是,技术系统的代码有成为元代码趋势,其他社会系统包括法律系统都开始被漂移自技术系统的元代码影响和支配。
具有划时代意义的技术革命都给法律领域带来了深远影响。文字发明带来了成文法和法典法;铁丝网推动了游牧社会习惯法的变革;债务观念与货币的发明息息相关;古滕堡印刷术是法律个人化与世俗化的基础;意大利复式记账法促成现代公司法与金融法的出现;格林威治时间奠定现代法律时间的标准。而晚近以来信息科技的巨大爆发,则对当代全球法秩序形成了全方位的挑战。首先,是空间维度的变化。传统法律的规范对象是自然世界与社会世界。伴随信息技术发展,在两个世界之外演化出新的机器世界、人工世界和虚拟世界。法律的空间环境由两个世界转变为三个世界。传统法律只需要处理自然、社会以及自然与社会的关系,而三个世界的法律问题则变得更为复杂。自然、社会和虚拟世界演化出纷繁复杂的多层次关系,至少包含自然、社会、虚拟、自然与社会、自然与虚拟、社会与虚拟、自然和社会与虚拟这七种形态的法律问题。其二,是时间维度的变化。从农业时代的循环时间、工业时代的线性时间,迈向信息时代的分叉时间。时间的平行化和分叉化,创造出更为丰富多元的法律形态,无论是合同形式、财产形态、纠纷类型和纠纷解决方式等。其三,是核心法律概念的演变。诸如法律主体、法律人格、法律行为、财产权类型、侵权主体等概念,都开始出现变化。最关键的是信息概念,以及与信息概念相关的数据、隐私、知识,乃至信用和注意力等概念的兴起。这些概念的核心定义以及相互关系的界定,特别是它们在法律上性质和关系的重新定位,是法理学亟需探讨和解决的核心议题。
过去二十年的互联网时代,主要解决了信息的增量和链接问题,此后的发展,则主要是信息的价值化和规范化问题。以往的信息技术,主要着眼于信息和知识的数据化。而新的智能技术,则主要关注信息和知识的价值化,这一方面会催生新的技术范式,另一方面也将呼唤新的法律规制模式。目前关注较多的大数据法律问题,以及信息数据和隐私保护问题,还主要是过去互联网时代的问题延伸,主要涉及信息数据化带来的各种法律问题。而信息的价值化、规范化和时间化,则会进一步深刻改变法律的形态、法律的功能和法律的定义。  
二、人工智能与区块链之法
人工智能技术带来的是对传统人类概念-关系框架的冲击,法律人格判定的标准,已无法被固定在心灵、灵魂、意志、理性这些古典概念。事实上,每个技术时代都需要创设新的法律主体,创造新的社会节点、新的社会流动性和新的社会沟通可能性。在法律历史上,促使自然人与法律人格的分离是一种普遍的现象。基于个人理性、意志与尊严的现代启蒙哲学和法治模式,其实是一种特定的历史演化的结果。
现代社会和经济的运作有赖于法律系统的协助,特别是通过特定的法律人格理论(personality)和归因技术(例如行为能力和责任能力等法律概念),为资本主义的顺利运行奠定了基础,它同时也是近代以北美、西北欧与海洋为中心的世界体系建构、法律移植和贸易殖民展开的基本动力。近代启蒙人文主义和宗教改革运动,塑造了一种特定的主体形象,它围绕现代人的主观意志和法律行为展开社会行动,并由此创建了一种特定的法律框架,在其中,主体和客体被严然划分为两个独立的部分。
今天世界的法律系统,是建立在19世纪以来的福特制大规模劳动生产和大众消费以及福利国家制度的基础之上,由此形成了市民社会、政治国家与国际地缘政治的秩序结构,以保障围绕全方位的商贸往来、资本经济、国家政治以及现代教育和科学研究展开的全球网络。它在个人和国家中分配和竞争资源,在生存空间的意义上展开合作与较量,最终依赖人类的智力和体力来消耗和转化地球的能量储备。在这种历史框架下,自然人个体成为社会系统的代理者(agent),个体成为社会系统运作的归因节点。关键是如何利用个体的心理系统和生化能量,围绕所谓利己心与自尊心形塑现代理性的法律人经济人,以动员、挖掘和探索包括南北极在内的所有地球资源。
但事实上,作为心理-生理上的homo)不是决定性的,关键是如何取得罗马法律意义上的身份status)、面具caput)和人格caput)。核心是获得自主的法律人格,获得自我表征和自我描述的能力,进而实现自我指涉和异己指涉在认知上的协调与统一。新的社会秩序不断在新的沟通节点网络中自发涌现。在这个过程中,法律专业团体对法律规则、概念、原则与原理进行重新发明和重新诠释,建立权利、权力、自由、义务、责任的新规范框架。其核心任务是将新实体和新秩序在边缘处的生长不断纳入制度化轨道,突破现有秩序演进的上限,提高法律系统的环境适应性,减少法律沟通的障碍,并最终拓展社会沟通在广度和深度上的可能性。
因而,虽然目前的人工智能技术尚无法具备智人标准的心理机制,但这并不从根本上影响人工智能成为社会行动者,并作为法律归因机制的赋权主体。易言之,构成社会系统运作和社会沟通的基本单位,实际上并不是表面的人类个体或社会组织,而是社会沟通之流通过各种方式(包括法律方式)被归因到了这些主体之上。法律系统借助各种法律人格的设置与规定,对不同个体、组织乃至人工智能进行身份识别、法律赋能与责任归因,配置以不同的权力、资格、自由、权利和义务。伴随信息技术的持续演进,可以预见,将形成一个整合了人类个体、机器、团体、组织、行动元的多层次、多中心与多节点的跨领域沟通网络,这将从数量级的意义上拓宽法律系统与政治系统的演化空间。
当代社会形成了由无数个人及其组织型构的庞大运作网络,它是由众多自由劳动者、理性经营者和精明投资者所构成的社会景象。经由创造无数的个人,社会系统为系统演化的界面创建了足够的冗余性。这些个人成为支持现代社会机器操作的基础线粒体,从而也提供了不间断社会行动展开反复试验的可能性。在这种情况下,各种类型的主体因此是承担相应功能运作的社会系统依据自身的代码程序算法所构建的各种沟通节点,并镶嵌在相应的社会脉络和语境之中。它涵盖了人类文明从狩猎采集到游牧社会、定居农耕、工业革命和信息变革的全部演化历史。
在这一波澜壮阔的演化历史之中,法律系统担负着至关重要的制度功能,它不断创造、改变、确认与协调社会系统的这些接触点,通过赋予各类主体相异的法律人格、身份、地位、资格、义务、权利和责任,以此架设和建立社会系统运作的功能中介与节点,并因此极大提高了社会系统演化的复杂性与可能性。
互为主体的反身性心智结构,构成现代法律主体的内在精神基础。法律人格以及它们与不同形式组织之间的相互内建和密切作用,促成各类复杂的法律关系的生成,并带来了丰富的法律后果。而随着非人类主体与行动元的密集出现,现在迫切需要新的行动者归因模型和心理学模式,来重新阐释法律主体和法律人格等概念,这必然会深刻地挑战工业时代的财产、契约和侵权法理论。而由此带来的法律系统偏好和演化方向的分叉,将深刻改变法律的运作模式。
区块链技术也同样带来革命性的冲击。它的核心概念,包括加密、共识、信用、秩序、时间、记账、代币等,都将信息技术蕴藏的政治潜力集中呈现出来。
如果说日常世界是时钟秒针的tick(滴答),区块链世界则是出块速度的tick(滴答)。比特币十分钟的出块设定,其本质是要确定一种去中心的时间共识,通过确立区块链系统的时间共识,从而可以把沟通的社会和事物维度都不断压缩为时间维度。社会沟通最终转变为围绕时间维度形成的分布式共识。熵是产生这个分布式时钟共识的必要代价,表现为对计算芯片和晶体管的消耗,对电力能源与计算力的大量消耗。
传统法律,其本质逻辑是通过规范性手段人为构建和维护社会共识,由于无法达成分布式的时间共识,就主要通过在事物(物、客体、物权)和社会维度(人、主体、债权)形成强制性规约来解决共识难题。进入近代社会后,由西方秩序产生的世界时间和格林威治时间,部分解决了时间共识问题,但此种全球化的时间共识,仍然存在民族国家(国际法)、权力腐败寻租(公法)和市民社会分化(私法)的各种障碍。
晚近以来,各种信息技术的演进逻辑,实际就是要不断减少社会沟通在时间维度共识的成本,尽量规避在社会和事物维度达成共识所需要的成本。信息时代的社会沟通,不断向时间的维度进行收敛,沟通的事物和社会维度逐渐边缘化。同时,由于沟通的事物和社会维度的坍缩,人类在社会沟通层面的意义特殊性也被弱化,历史逐渐进入一种跨越自然、社会和机器世界的无差异沟通。
沟通的多维化、数据化、游戏化、虚拟化、信息化、平行化,奠定了区块链系统出现和演化的动力与逻辑。沟通的无差异化和时间化,导致意义的扁平化和数据化。信息沟通的虚拟化与时间化,成为这一演化趋势的必然归宿。社会结构出现块状分化和平行分化的特点,并可能逐步告别卢曼意义的功能分化社会,形成一系列分布式的块状沟通系统。
而法律的去社会化、去事物化和加速的时间化,其逻辑结果将是法律的片段化、代码化和算法化。法律不再承担维持全社会规范期望的功能,法律不再是民族国家和世界时间意义上的法律,而是分裂为各类私有化、封建化、平台化、区块化的时间维度的法律。这是一种奇特的既具备世界性特征又呈现块状化运作的法律。它在何种意义上可称之为
三、信息资本主义与知识产权
18世纪以降,我们目睹了工业资本的大规模生产和财富激增,这在两个世纪内带来了各法律领域的全方位变革。而在进入到新世纪之后,信息技术革命迅速推动了知识经济和虚拟经济的发展,各类新型财产和资本形态出现,它甚至呈现比18世纪工业革命更为惊人的规模和影响力。
在马克思所生活的时代,工业资本主义利润链条的关键是控制生产流水线和大众市场,而信息资本主义的竞技场则是研发创造、利基市场、风险控制、专利保护、版权转让和司法诉讼。特别是通过在整个产业链中进行知识产权和信息产权的布置与安排,引入相关法律标准和规则的精妙设计,通过主导和把控相关法律议题与议程,经由法律的无形之手控制和垄断利润。重点在于,如何创造一个在全球尺度运行的资本空间结构,它制造同时保持中心、半边缘和边缘之间的差异,采取各种途径来降低各类资本在全球流动的交易成本与时间成本。
信息技术革命对知识信息的传播模式,以及社会生产、分配、交易与消费的传统形式带来了各方面的冲击,从而也需要更为精致的法律规范机制。在进入到信息资本主义时代,经济学的稀缺性已逐渐转型为一个功能性的概念,而主要不是通过具体劳动来圈占有限物质客体的意象。它不需要物理圈占和物理控制手段,并且不再只能通过劳动过程来创造。作为抽象物,信息/知识只能在其流动性中才能最大程度发挥效用。信息/知识被转化为一种法律财产形式,继续围绕资本主义的逻辑展开。资本逻辑颠倒了信息/知识的生产过程。信息资本主义对稀缺性的构建和运作真正摆脱了先验主义的形式,与稀缺性相关的法律控制技术变得更加精确。
自然时间不再是确认信息/知识创造顺序的依据,相反,主要是通过法律时间的规范决断来确立相关信息/知识产权的边界。在进入到19世纪后半叶之后,技术工程系统、经济系统、法律系统和艺术系统呈现加速的结构耦合和结构漂移现象,知识越来越多地变为信息化数据化的对象,知识的本质不再是核心问题。在这种演化趋势下,知识信息化数据化进程,开始将大量信息和知识纳入到不同社会系统的代码逻辑与特殊的功能运作之中,知识不再只是知识,而首先变为不同社会系统的功能评估和程序性的系统授权的对象。法律系统主要不是处理知识/信息的使用价值,而是处理它们的交易价值
资本主义的知识流通被转化为信息化数据化的形式,可以自由地分解,灵活地移动,并紧密地结合于法律系统的持续运作过程。经过这种转变,可以不断容纳新类型的信息和知识成果。当代法律需要处理信息的组合、区分、确权与控制,其规范对象不再是以往相对简单的个人知识成果,而主要是各类复合化、系统化与结构化的信息商品。关键是如何通过法律系统的代码机制,通过产权的规范形式,干预和影响整个信息生命周期。财产确立的重点已不是去具体占有特定的物质,更重要的是精准和即时性地控制住相关的信息和知识产权。
作为一种新财产形态,信息持续从特定的自然与社会语境中抽离出来,它不断摆脱物质载体的局限,从而获得最大程度的灵活动员与普遍扩散。财产形态的知识化、数据化、信息化与虚拟化,给整个法律系统的代码化、算法化与学习化转型奠定了经济基础。财产不再必然镶嵌于特定的自然或社会网络,而首先隶属于由货币编码的经济系统,进而也被纳入到以代码与算法为基本操作手段的特定技术系统。这也正是法律作为上层建筑必将经历重大转型的内在依据。
信息资本主义的主要关注点不是知识的创造,也不是信息生产与分配的问题,而是服务于利用知识、数据与信息而开展的资本主义企业的竞争。信息资本主义越来越借重技术性和抽象化的法律规则。主导国家与跨国公司资本通过正式与非正式的谈判手段,通过技术性的法律规则、概念类别和原则框架的建立来实现其利益。在金融和智力资本的支持下,全球信息业寡头在新的法律平台上重组并主导了超国家层面信息的生产和分配。
跨国公司通过知识资本化组合,以及经由资产并购、共同持股、战略联盟、相互授权等形式占据了大量的核心信息资产,重新确定了资本主义世界体系的规模和尺度。当代资本主义的竞争策略不仅彻底改变了当代跨国公司的结构和运作方式,而且还改变了信息寡头所采取的传统法律策略,以建立并维持其垄断地位。从知识的信息化到信息的数字化再向数字化商品的不断变化,知识不断转化为具有资本相关性和解释潜力的信息数据。在信息/知识的创新经济中,跨国企业的法务部门及延伸的跨国律师事务所比研究与开发部门更为重要。
新技术革命带来了生产、交易、消费和分配模式的改变,而由知识/信息派生的利益的稳定分配和规范确权,也对传统法律体系提出了结构性调整的要求。财产的形态越来越呈现出无形性、信息性和数据性的特征,各类知识/信息/数字产权通过各种标准化规定从而在全球范围广泛流通。法律的规制重点不再是在所有权意义上获得和占有物品,也不是传统民法的契约或侵权,更关键的是一系列抽象领域,例如市场准入、投融资体系、服务行业规则、知识产权和产品标准。它的核心目标是提供一个统一、通用和结构性的经贸法律框架,以消除阻碍资本自由流动的所有因素,从而实现全球化深度整合与广度开发的全面提升。
四、技术风险与法律全球化
从上世纪80年代开始,互联网技术、后工业经济、金融新自由主义与法律全球化进程形成共同演化趋势,它们一起推动人类发展从围绕物质资源的争夺,转向有关知识与信息的竞争。伴随大数据、人工智能、区块链、物联网等技术的崛起,世界正在型构一个由人、物和信息组成的全面网络,虚拟产权不断冲击传统的有形财产原则。它们也持续瓦解着传统的威斯特伐利亚民族国家法律体系,改变马克思笔下的资本和劳动的二元逻辑,进而形成法律全球化的治理模式。通过在知识/信息层面的深度开发和合法化过程,资本力量会进一步深刻转变福特主义-民族国家模式所塑造的技术范式。
全球信息化的秩序编织,通过管道、机器、终端、电子港、连接埠的中介,借助于法律系统的持续运作,正在不断创造新的全球联结、城市空间与信息文明无差异的差异化秩序。法律客体和法律主体,社会行动者与财产对象都进入时间性和流动性的运行平台,资本被纳入到了信息沟通的过程。现在,新的法律范式必须考虑充分耦合性、流动性和暂时性这些特征。
作为规模经济economy of scale),福特资本主义关涉主体和物质的大量聚集,侧重于争夺土地、资本和劳动力的竞争。这种经济形态的法律范式着眼于当下,其产权在时间上是高度确定的。而作为范围经济economy of scope),信息资本主义必须动员各种知识、符号与数据进行即时建构,资本的较量以原型的创新为核心。该法律范式的重心是着眼未来,其财产形态具有高度流动的特点。
技术、科学、研发、传播、艺术、娱乐在今天都已深深卷入全球化的网络,包含光电线缆、代币、深度神经网络、计算芯片、无线射频识别、生物计算、实时监控、二维码、工业机器人在内的技术因素,乃至知识与信息的存储、调用和交易,也都进入了全球实时运作的网络之中。基本动力就是知识、信息与数据的循环和沟通。智能物联网、虚拟现实、移动互联网、智能手机,以及各种类型的生物识别和数据传感设备,都推动以往主要借助物质载体呈现的商品不断无形化、数字化和数据化,从而推动法律范式的进一步转变。
传统财产法概念是基于自然和客体的被动性质,自然受支配于人类的劳动与立法,进而形成人法和物法的二元结构。但是,信息革命破坏了主体和客体的二元性基础。生产、分配、交易和消费的知识化、信息化与数据化,使得各类主体客体被纳入基于时间的网络化结构。作为形的编织者Weavers of Morphisms),法律对各种类客体类主体进行分类、确认、沟通、协调与传递的规范体系搭建工作,以配合建立一种新型的产学研共同体University-Industrial Complex)。
全球时空尺度的变化冲击了民族国家的法律体系及其哲学基础,甚至影响了以现代性为前提的社会系统功能分化的结构。各种跨国家、超国家、区域性、亚国家机构以及全球网络和社会功能系统已经形成了全球多元化的法律演化秩序,它们形成多层次、多节点、去中心的产权与合同关系逐渐包围民族国家。大量疑难案件的频繁出现和传统人权机制所面临的困境,都表明了传统法范式在信息化、数字化和全球化趋势中所遭遇的挑战。
法律不再仅借助国家主权来确立它不学习的运作机制,法律的非主权化依靠各类分布式、学习性和算法性的数字化技术驱动。易言之,众多算法机制已经开始演化生成各类私人定制法律。法律的定义与性质正在悄然发生改变。法律不再仅仅是通过国家暴力机器的威慑让人不敢违法的形象,与此同时,出现了由各类算法和代码所驱动的令人不用违法不能违法的现象。传统公法与私法的双重框架随着国家、技术架构与市场机制的深刻变革而发生蜕变,民族国家作为规范化机制的空间性平台,已经开始被各种新的全球化、超国家、跨国家、地区性、平台性、区块化、部落化、虚拟化的平台机制替代。传统法律依托的是通过回溯过去来规范当下进而稳定未来的时间性技术,现在,它则正在转向各种基于推断性、预测性和模拟性的技术,来规范当下进而重塑未来的法律模式。
这些不受主权国家控制的技术力量已经对各国民众的平等和自由产生了深刻影响,给当代社会带来了各种潜在风险。例如,许多人工智能技术就可能被大平台公司俘获,这些公司利用自身的信息基础设施的先天优势,在人工智能产品设计、开发和制造中,写入一系列更有利自身利益的代码与算法,并且通过人工智能技术的黑箱性,让它服务于自身的利益。在当今的算法性网络社会,技术/信息/知识上的不对称状态已经经由各类信息化基础设施变得无处不在,并扩散到以各种数字化、代码化、抽象化的信息中介之中,这些信息黑匣子在事件发生之前、之中和之后的任何时间点都可能启动计算、监视、控制、干预和协调。在这种情况下,法律也就开始算法化计算化,而传统的各类确保人文主义价值的法治原则也就可能因此陷入危险境地。
具有鲜明学习性特征的算法技术,给传统法律人文价值带来了高度的不确定性。因此,当前应当依据新的技术环境重新评估所有传统法律规范与价值,并且,这些评估和反思要通过相应的代码与算法机制嵌入到更强大的技术体系架构中,进而形成相互的刺激、变异、学习、选择、适应和最终的制衡。因为,伴随信息技术发展所带来的挑战,其实更根本的是技术与社会经济结构之间的共同演化关系,以及不同的技术范式和可能的政治与法律模式的组合和耦合关系。为了保护暴露于各种技术元素无限制扩张中的血肉之躯,为了捍卫人类尊严和各种人文价值,我们必须依靠更为良性的技术模式的发展。
这需要激活政治与法律公共领域的讨论,需要更多的媒体丑闻曝光和社会运动的开启。只有通过伟大的政治与法律运动,才有可能刺激和推动已经自成封闭化趋势的技术范式的转变。这要求我们必须在公共机制方面做出有效的回应。新的法律范式不会也不应当是由处于中心和顶点的某个权威来做设计,而应当通过不同的社会系统自主运作和相互博弈,以及各自的当下决断所共同演化生成。在此进程中产生的大量争议和纠纷是新的全球法律的创生,以及不断进行造法活动的各类司法机构发展的根本动力。
五、计算法学与法律的死亡
人类法律起源于原始的占卜,占卜创造了最古老的语言文字,其中,最重要的则是吉/凶这一组二元代码。因为,吉/凶实际就是近似法律的二元规范代码。关于占卜者的任何疑问,解占者都会直接给出一个或吉或凶的决断。这个答案经常是没有道理的,是反认知的,根本没有所谓科学性。占卜在这个意义上因此承担了一种近似法律的功能。当矛盾或纠纷难以决断,解占者(类似法官)通过各种仪式性操作和解读,最终做出法律意义的判决。在这个意义上,吉和凶亦即为法与非法。事实上,直到现代社会,法律与占卜所共同采取的这种不学习的规范化技术并没有从根本上改变。法律始终经由对社会不学习的功能态度来维持社会规范期望的稳定性,进而实现了法律系统的独特社会功能。简言之,法律是一门特殊的人类治理技艺,它将法律系统的内部学习与对社会的不学习特征加以了结合,从而最大程度地维持社会规范期望的稳定。然而,伴随人工智能和机器深度学习的发展趋势,当法律开始算法化和代码化,当代码在特定社会领域逐步替代法律的功能,当机器学习的能力快速提高,当机器学习的成本急剧下降,法律曾经承担的社会功能就面临前所未有的挑战。
二战期间由诺伯特·维纳(Norbert Wiener)与克劳德·香农(Claude Shannon)推动的控制论和信息论革命,它们的基本原理是信息传输的保真度,以及有关信息控制和反馈的数学理论。概言之,要在随机性之中建立特定的离散数学模式,建立信道、噪音、运动轨迹、脉冲频率的数字相关性,通过信息技术的自递归描述、预测和导引,试图将所有问题都转变为运用算法、代码、程序进行操作的二阶或多阶控制问题。当可以通过操作数据规则(例如指令集、元胞自动机、编程语言)根据某些程序模拟出待解决问题的数字模型,那么包含法律问题在内的规范领域(ought),也被认为可以通过概率计算、参数设计、模型构建、仿真模拟、样本更新、模块调整等技术手段,将其转变为可以编程、解码、设计、预测、干预与控制的事实问题(is)。
传统的法律是通过稳定社会规范期望来实现法律的社会功能。在意识形态上,它建立起对法律规范封闭运作的信心,因而,只需要通过一组二元代码(合法/非法)执行运作即可。法律的运行旨在与日常经验与结果反馈保持距离。法律系统在认知上虽然是开放的,但其运作却是封闭的。然而,机器学习的逻辑是不同的,它将形成一个学习化的技术网络,该网络将通过各种技术装置,例如虚拟帐户、大数据分析、智能算法、评分体系,持续对各类主体的行为和行动进行实时的追踪、识别、认证、评估与反馈。申言之,机器学习乃是一种自我适应、自我迭代和自我完善的反馈机制,它使用当前操作作为下一条指令的基础,并基于实际状态而不是规范预期作为策略决断的依据。这与不学习的法律形成鲜明反差。因为法律总是以使用一组固定的文字符号系统来维持规范性期望的稳定。如果机器学习是基于统计的随机控制,那么法律就是聚焦于逻辑确定性的不学习的反认知技术。
随着智能机器社会的兴起,人类社会的法律正经历着从小数据-大定律的牛顿模式向小定律-大数据的默顿模式(Robert Morton)转变的趋势。传统的法律范式是基于牛顿的经典力学模型。它依据统一的大法则统一规范各类小事件。它必须人为简化和化约各种复杂的场景,集中化简社会沟通的社会、事物与时间维度的复杂性,从而更好地实现韦伯所构想的法律自动贩卖机。智能机器的深度学习开始依据特定化的语境、场景和实用性的需要,从巨量的大数据中随机提取和生成专门的小法律,以实现对行为的自反馈调控。在这种情况下,小法律既具有规范性又具有认知性的特征,并且能够通过给定的目标建立一组变量和相应的变化概率,并模拟涵括一系列参与者和交互规则在内的具有动态环境特征的法律模型的建立。法律运作是要同时达到事实描述、行动预测和指引社会交往的功能,这是通过构建动态的模拟过程和法律结果完成的。因此,此种法律范式已然突破了事实与规范的传统二分法。
越来越多的虚拟性、实时性、数字化、信息化的娱乐、社交、支付等场景,必须依靠更为智能的调控机制。因为场景不再是以往的固定物理地点,而是可以随时变换甚至可能依据每一个参与者的需求灵活更改的位置,因此,所需要的法律也就必须更加具有学习性的潜力。只有这样,法律才能实现其先前执行的验证、合规、授权、归因与归责等功能。 传统法律以其规则可以普通和统一适用于一切场景为前提,要求一切场景都可以根据书面性的命令进行确定性和一致性的规制。但是,人工智能技术的崛起将首先瓦解法律的命令性、普遍性、确定性、成文性、统一性的特征。
风险社会的风险影响通常不会止于当事各方,单纯事后监管容易导致无法弥补的后果。 因此,法律必须逐步达到较高的学习能力,可以提前甚至实时进行反馈调节,这因此促进了各种实验性治理与学习性机制开始在法律中应用。风险社会的法律不再仅仅是不学习的规范机制,与之相反,新的法律形态需要根据新信息和新环境在认知性的意义上进行自我调整和迭代,只有这样,才能更好适应各种变化与风险。在特定的案例中,甚至要依据社会实验的模拟效果来测试和出台新的法律规范。
在新的人工智能时代,每个特定的场景和语境都要求重新定位资源的分配以及关系的划分,技术和社会的发展要求更具有学习性潜力的规制机制来适应这些变化。伴随智能技术学习能力的不断提高,不同社会行动体的各种信息都被数字化与数据化,所谓的法律事实也将变得透明化。机器学习可以捕获证据链的存在,并且法律程序将更多是以事实认知而非规范指引作为设计的方向。事实上,当前正在出现的计算法学正是基于新兴的深度学习技术,以及试图将自然法律语言进行全面人工转译的技术意识形态。或者说,计算法学实际是信息技术发展的必然逻辑。从时代发展趋势来看,全社会过剩的计算能力已经解决了过去由于计算能力不足而带来的全面深度学习的问题。由于计算能力的过剩与算法冗余的增加,计算法学的冲动将可能继续腐蚀传统法律的规范领域。
现代法基于以固定文本为中心的印刷文化。法律是客观的、外在的、中立的、固定化的规范性权威。在传统工业时代,人与机器之间是相对清晰的主客支配关系,因此可以借助二分的人法与物法来构建一个具有普遍统一性的法律制度,去规范此种经济形态下的生产、交换、分配与消费关系。然而,当人机深度融合在一起,当人与机器彼此内嵌、彼此进入、相互牵连和相互塑造时,我们已难以借助静态性的规范制度来有效规制行动者与外部世界的法律关系。单纯依靠固定性和书面性的法律文本已不足敷用,因为已经难以再像过去那样通过简单的不学习态度去规制各种新型法律问题。当机器学习技术得到充分发展,如果智能技术通过它强大的计算能力与算法能力,能够有效克服决策和时间的压力,赢得演化的优势,就很有可能会从根本上挑战法律的传统功能。
六、法律范式变迁与中国的自我革命
从农业时代到工业时代再到信息时代,法律范式都经历了深刻演变。农业时代带来了轴心文明时期的法律范式,工业时代形成了资本主义的现代法范式,那么,信息时代将形成何种意义的法律范式?这已然成为当代法理学和法哲学的核心命题。
互联网领域存在一个尤为重要的演化规律:去中心化和中心化的交替发展,去中心化和中心化技术构成了持久的冲突和竞争。如果说,过去十年间互联网世界呈现出明显的集中化趋势,那么现在则尤其需要出现一种新的反制性力量。互联网需要新的技术范式发展,以改变过去十年间中心化集中的趋势。人工智能技术同样带来了中心化和去中心化两种潜力的可能。如果说,古代法是粗暴的权力中心化加散沙式的民间去中心化,现代法是国家中心化加社会的去中心化,那么人工智能时代的法范式,也可能是一切都可以被智能技术追踪和计算的中心化和依托于加密技术和区块链技术的去中心化趋势的并存。
那么,法律在其中将发挥何种功能和作用?当技术系统成为所有社会系统的底层设施,法律可以继续承担何种使命?为了对抗和制衡技术的元代码化趋势,法律是否必须升级换代,来抑制技术系统过度的自我扩张趋势?因为,单纯依靠事后惩罚和威慑手段,通过传统的立法、行政和司法管道,似乎都不足以应对的新的技术现实。可能有必要从技术系统自身的演化逻辑出发,将技术作为一个独立的系统来加以认识,考察它内在的运作逻辑和演化趋势,以及由它所产生出的权力结构和政治性格。我们需要根据这些内生的技术逻辑,从技术系统内部创造出一种权力制衡的机制,在技术系统内部构建一个类似18世纪宪法革命的制衡模式。
晚近以来,主要来自欧美的大型跨国公司在母国政府的战略支持下,在新一轮信息和通信技术(ICT)领域逐步取得压倒性竞争优势,对于数据信息的收集、控制、处理、储存、组织、传播、应用、交易与销售成为它们的核心业务之一。在新的全球产业格局调整中,发展中国家再一次陷入资本主义体系的边缘和半边缘,其根本原因,就在于发达国家依据其在全球权力格局中的优势地位,引导竞争转向更有利于自身的战略布局。它们通过各类抽象的法律规则设计,将各种技术标准确定为行业规范标准,并且使用专利、版权和商标这些知识产权手段来进一步巩固这些标准,进而以此来掌控全球信息产业的创制权和话语权。
1980年代以来,中国社会大规模的立法活动是通过对同样作为大陆法系的台湾地区、日本与德国的法律移植完成的,这一立法运动必须紧密配合中国的工业化进程以及配套的国际大循环战略。主要借助对大陆法系民商事制度的移植,为刺激、调动和整合中国的土地、资本和劳动力市场提供了基础性的法律保障,从而也促进了主要围绕实体商品经济活动而展开的市场建构。换言之,在改革开放这一历史阶段,主要倚重大陆法系展开法律的移植并不是历史的偶然,近20年来中国如火如荼的世界工厂发展模式,最关键的就是要求在实体性商品制造、销售和国际贸易领域的法律制度的完善。
大陆法系遵循以为核心范畴的罗马法传统,其根本逻辑是围绕有体物经由物权和债权制度创建规则体系。事实上,中国的市场经济发展,正是通过这一经典的私法范式为其提供原始的产权逻辑和物权理论。而围绕这种有体性的物权理论,进一步建立了包括用益物权、担保物权在内的物权法定原则,确立严格的一物一权理论,财产的占有、收益、使用与处分都是紧密根据这种有形、确定、实在的的形象进行建构。易言之,在改革开放时期,特定法律主体占据特定财产客体的法律意象牢固支配着中国民法的想象力。
正如前述,当代全球经济的竞争中心正在从有形的物质转变为无形的知识/数据/信息。产权概念的本质不再是关于有形财产的绝对控制和占有,在新经济形态下,财产实践更需要的是无形的权利束a bundle of rights)概念,它指向一系列更为精细的经济和法律关系。在新的人工智能时代,中国必须重新设计法律发展战略,在重构法律体系、平衡群体利益、主导规则制定三个层面增强前瞻意识。
我们需要洞悉全球法秩序演化的内在动力,集中国家和精英的力量来转变法律战略视野。特别是,要积极参与信息法领域全球问题的议程设定和法律规则主导权,这比单纯的科技发展甚至更为重要与紧迫。竞争最终是国家体制的竞争。全球化的加速已成为不可避免的事实,在残酷的全球竞争中,国家的力量将变得更为突出。所有这些,最终都取决于中国自我革命的勇气。
原文链接:https://mp.weixin.qq.com/s/TbLGdZyDWdh7JmwbkFv7xg
文章来源:微信公众号--法学学术前沿
编辑:高杰

383#
 楼主| 发表于 2020-1-20 17:21:18 | 只看该作者
【案例】
陈小平丨人工智能中的“封闭性”研究为什么重要?
/ 陈小平
(中国科学技术大学计算机科学与技术学院)
首先想请您谈谈今年在人工智能领域投入精力最大的研究是什么,以及为什么想去推动这项研究。
陈小平:2019年我最用心的事情是人工智能中“封闭性”的研究。近年来,我对人工智能70年来的主要进展进行了总结,发现有两种人工智能思维是现有研究成果中相对最成功的:一种是“暴力法”,另一种是“训练法”。
暴力法的基本原理是:依据问题的精确模型建立知识表示/搜索空间;压缩知识表示/搜索空间以满足可计算性;在压缩空间中通过“推理法”或“搜索法”,穷举问题的可能解,找出其中的最优解。训练法的基本原理是:建立问题的元模型;参照元模型,收集训练数据并进行人工标注,选择一种合适的人工神经网络结构和学习算法;依数据拟合原理,用标注数据训练元模型中参数值(人工神经元网络连接权重),得到问题的一个具体模型。
通过总结我还发现,引起巨大轰动的AlphaGo Zero实际上采用了四项人工智能技术。其中两项是暴力法技术——简化的决策论规划模型和蒙特卡洛树搜索,用这两项技术进行“自博”(自己和自己下棋),自动产生大量博弈数据和标注,这些数据不仅包含人下过的棋,也包含很多人没下过的棋;另外两项是训练法技术——残差网络和强化学习,以自博产生的数据,用强化学习算法训练残差网络,从而将自博获得的实战经验凝练在同一个人工神经网络——残差网络里,最终这个网络的下棋水平远远超过了人类。所以,AlphaGo Zero是暴力法和训练法相结合的胜利,认为它仅仅是深度学习的胜利,是一个巨大的误解,会产生巨大的误导。
虽然暴力法和训练法都取得了巨大进展,但它们在实际应用中却面临共同的难题,那就是“脆弱性”。脆弱性的主要表现是:当智能系统的输入不在知识库或训练好的人工神经网络的有效范围内,系统将产生错误的输出。自20世纪80年代以来,脆弱性已成为现有人工智能技术在实际应用中遇到的主要瓶颈,而训练法和暴力法都受到脆弱性的严重困扰。
因此,人类面临着一个巨大疑问和重大挑战:以暴力法和训练法为代表的现有人工智能技术,到底能不能有效地应用于各种实际问题?对此,已出现两种极端观点,且都非常有市场。一种观点认为,人工智能技术可以无条件地解决一切实际问题,理由是:围棋比平时遇到的问题更难,而人工智能已远远超过了人类。另一种观点认为,现有人工智能技术就是“人工弱智”和“人工智障”,“有多少人工就有多少智能”,持这种观点的人往往实际尝试过人工智能技术应用,却未获成功。这两种观点都极大地妨碍了人工智能的实际应用和进一步发展。

深度学习: 智能时代的核心驱动能量
[特伦斯·谢诺夫斯基 /
姜悦兵 /
中信出版集团,2019-02

针对这一局面,我提出了一种判别准则——封闭性:如果一个实际问题不具有封闭性或不可封闭化,那么在原理上就无法用现有人工智能技术解决;如果一个实际问题具有封闭性或可以封闭化,同时,解决这个问题的人工智能系统具有失误非致命性和基础条件成熟性,那么在原理上用现有人工智能技术就可以解决。不满足封闭性的问题,现有人工智能技术是无效的;满足封闭性,还需要满足失误非致命性和基础条件成熟性。这是因为训练法不能保证智能系统的输出百分之百正确,而暴力法由于工程实现的原因一般也不能保证输出百分之百正确,所以还需要具备失误非致命性才能投入实际应用。另外,人工智能技术往往发挥“画龙点睛”的作用,在大规模应用中需要其他技术和条件(如合适的数据)的配合,这就是基础条件成熟性的含义所在。
人工智能封闭性的严格定义参见我即将发表的论文《人工智能中的封闭性》,这里提供封闭性的一种直观描述。如果一个实际问题满足如下两个条件之一,则是封闭的:该问题存在一个有限、确定的模型,而且该模型与实际问题的对应也是有限、确定的;该问题存在一个有限、确定的元模型,并且该问题的代表性数据集也是有限、确定的。
封闭性的主要作用有三个方面。第一,它提供了现有人工智能技术能力边界的一种判别准则,由它可判别哪些实际问题是现有人工智能技术可以成功应用的,哪些是不能成功应用的。根据我的调研,当前我国制造业、服务业和农业等行业中的大量实际问题是符合封闭性准则的。也就是说,这些问题或者本身是封闭的,或者可以封闭化(将非封闭性问题转化为封闭性问题),因而都是可以应用现有人工智能技术(如暴力法和训练法)得到解决的。现有不成功的应用尝试,都出现在不具有封闭性或不可封闭化,或者不具备失误非致命性和基础条件成熟性的场景中。而现有成功的应用,都出现在满足这三个条件的实际场景中。因此,过于乐观和过于悲观的两种极端观点都是不符合事实的。运用封闭性准则,可以帮助企业和社会更有效地识别现有人工智能技术的落地场景,减少盲目性,提高成功率,加快人工智能产业的健康发展。
第二,封闭性为人工智能的基础研究创新提供了某种参考。任何创新都是相对于现存边界的——跳出边界即创新。所以,知道边界在哪里,有助于创新;不知道边界在哪里,不利于创新。封闭性作为一种判别准则,将所有问题分为两类:一类是从原理上说应用现有人工智能技术可以解决的,另一类是从原理上说应用现有人工智能技术不可以解决的。例如,各种棋类、扑克、麻将等博弈问题,由于都是封闭性问题,所以用现有人工智能技术迟早可以解决,解决了也不奇怪,长期不能解决才奇怪呢。但是如果在这些博弈中作弊,“出老千”,那就破坏了它们的封闭性,现有人工智能技术从原理上说就不灵了。人类在正常的生产和生活中,不可能用作弊的方式去解决非封闭性问题,而这些问题本质上比封闭性问题更难,所以我们需要发展更强大的人工智能技术,而这些新技术的研究方向应瞄准非封闭性带来的内在难点。因此,封闭性可以帮助我们更有针对性地展开人工智能基础性研究。
封闭性的第三个作用在伦理方面。近年来,很多人担心人工智能技术已经过于强大,担心存在技术失控、技术统治人类的风险。现在我们知道,现有人工智能技术只对封闭性问题有效,而现实中的大部分问题是非封闭的,人类比现有人工智能技术更擅长应对这些问题,所以现有人工智能技术不可能统治人类,将来能不能还不知道。这种情况下,过分担忧人工智能技术失控是没有科学根据的,如果由于不必要的恐惧而延缓人工智能的实际应用,就更不明智了。所以,封闭性可以帮助我们形成对人工智能更符合实际情况的看法,进而采取更合理的态度和做法。
此外,从长期的观点看,对于未来人类应该发展什么样的人工智能技术,封闭性也给我们提供了某种助力。未来人工智能的发展肯定会向着非封闭性方向努力,那么我们就可以提前考虑:哪些非封闭性问题可以放心地交给人工智能,哪些不可以,如果一些问题需要交给人工智能,那就需要考虑应该采取什么风险防范措施。而对于现有人工智能技术,我们知道它们不可能控制人类,所以真实的风险是技术误用,比如隐私、安全、公平性等方面的现存问题和未来隐患。这样,我们就能够更有针对性地聚焦和解决现有人工智能技术的误用风险。
总之,在当前这个人工智能发展的十字路口,封闭性可以帮助我们获得对人工智能更符合真实情况的了解、认识和理解,采取更符合社会需要和人类根本利益的态度、决策和行动。

为什么:关于因果关系的新科学
[] 朱迪亚·珀尔、[] 达纳·麦肯齐 /
江生、于华 /
中信出版集团,2019-07

您是中科大机器人实验室主任,也是中国人工智能学AI专业伦理委员会负责人,在您看来,2019年人工智能领域最重要的趋势/问题是什么?
陈小平:美国人工智能年会(AAAI)是国际人工智能的三大综合性顶级会议之一,今年的论文注册数突破10 000篇,有效论文投稿数接近9 000篇,而在“正常年份”,一般只有2 0003 000篇论文投稿。另外两个综合性顶级会议的投稿也出现了类似情况。可见在国际学术界,人工智能的升温速度之快、热度之高,远远偏离了正常情况。论文投稿中,中国贡献了最大比例的增量。
20世纪80年代也曾出现过类似情况(不同只在于当时中国的参与度极低),升温极快极高,接着很快就陷入了第二次人工智能“寒冬”。任何事物都是以高潮—低潮交替出现的形式发展的,这是规律,不可能违背。真正需要关心的问题是:这次会不会历史重演,进入第三次人工智能“寒冬”?
因此,现在中国和世界面临着人工智能的一个重大历史关头。决定人工智能历史走向的关键在于能不能实施现有人工智能技术的大规模应用。只要能,而且确实实现了人工智能的大规模应用,就不存在所谓的“第三次寒冬”,从而打破人工智能“热潮之后必为寒冬”的历史惯例,改写人工智能发展的底层逻辑,进入一个与以往本质不同的全新历史阶段。反之,如果不能实现大规模应用,一切都和前两次热潮一样,我们凭什么规避“第三次寒冬”?
根据封闭性准则,现有人工智能技术已经具备了大规模应用的能力。所以从技术上说,人类已经获得了规避第三次人工智能寒冬的现实可能性。这是封闭性的根本意义所在。当前人工智能发展的重中之重是:如何在相关产业中,根据封闭性准则,积极开展大规模应用?由于中国传统产业规模大、升级需求强,社会各界积极性高,其他条件也比较好,所以中国在现有人工智能技术的大规模产业应用中,面临着最大的机遇。当然也存在极大的挑战。
在今年出版的众多人工智能领域的图书中,是否有让您读后感到“眼前一亮”的?
陈小平:我见到的今年出版的人工智能图书中,有三本是比较有意思的。一本是特伦斯·谢诺夫斯基(Terrence Sejnowski)的《深度学习》(The Deep Learning Revolution)中译本,书中提供了大量人工智能历史资料和技术评论,对于加深读者对深度学习和人工智能的理解很有帮助。第二本是朱迪亚·珀尔(Judea Pearl)的《为什么:关于因果关系的新科学》(The Book of Why: The New Science of Cause and Effect)中文版,在深度学习大热之际,出版者推出这本属于完全不同技术路径的因果推理专著,需要很大的勇气和很强的专业眼光。这本书以及这一类书的出版,对于培植我国的学术土壤、帮助我国人工智能及相关领域专业人士和学生拓展学术视野,非常有益。第三本是盖瑞·马库斯(Gary Marcus)和欧内斯特·戴维斯(Ernest Davis)的《重启AI:构建我们可以信任的人工智能》(Rebooting AI: Building Artificial Intelligence We Can TrustPantheon2019910日出版),这本书对人工智能的发展水平做了深度分析,指出当前社会上对人工智能的流行看法过分乐观了,现在的人工智能与“像人的人工智能”还相差很远。
西方有一句谚语:如果一个人手里只有一把锤子,那么在他眼里一切问题都是钉子。人工智能显然不是一颗钉子,所以不可能只靠一把锤子就能奏效,一定少不了来自不同角度的思考。如果能综合上述三本书的观点,我们对人工智能的看法就会更全面一些。

Rebooting AI: Building Artificial Intelligence We CanTrust
Gary F. Marcus, Ernest Davis
Pantheon, 2019-09

虽然如此,我并不完全赞成三本书的所有主要观点或主要结论。三本书中,第三本书最接近我的观点,尤其书名Rebooting AI,简练而形象地表达了人工智能当前发展态势的一个方面:人工智能的长期目标不可能通过现有技术成果的连续性简单积累而实现,我们需要某种彻底反思和某种重大改变。我在《开放时代》2018年第6期发表的文章《人工智能的历史进步、目标定位和思维演化》中,也对现有人工智能的局限性做了自己的分析和评论,与该书有共同点,也有不同点。两点根本性不同如下:
第一,我认为当前人工智能的当务之急是:利用现有人工智能技术,而不是指望需要几十年甚至更长时间才有可能实现的未来技术,在满足封闭性等三个应用条件的场景中,实现人工智能的大规模产业应用,而不能等待人工智能基础研究取得更大突破之后,再进行大规模产业应用。封闭性为这个判断提供了基本依据。对于封闭性问题和非封闭性问题,需要采用本质上不同的人工智能技术,指望一种“全能型”人工智能技术“包打天下”,是不符合实际情况的。现在我们已经得到了能够应对封闭性问题的人工智能技术,还等什么?当然,同时也需要投入一定的力量,对非封闭性问题展开基础研究,但绝不能用非封闭性问题的基础研究替代和干扰封闭性问题的大规模应用研发。
第二,对于人工智能的长远目标,有必要进行更深刻的反思,特别需要深思的一点是:传统主流观点——“像人的人工智能才是真正的人工智能”,很可能不是一个恰当的科学概念和一个正当的长期目标。到底什么是“像人”?例如,蒙特卡洛树搜索是AlphaGo Zero的四大核心技术之一,是人工智能搜索法的一个技术高峰。可是早在20世纪70年代,认知心理学实验就证实,搜索是人类常用的一种基本思维技能。而人工智能搜索技术与人类搜索技能的差别主要在于,前者是对后者的科学化、系统化、算法化,二者的基本原理是类似的。那么在这个意义上,使用蒙特卡洛树搜索的AlphaGo Zero,像不像人?AlphaGo Zero的其他三项核心技术也存在类似情况,或者在脑神经科学中发现了人类渊源(深度学习),或者在人的思维实践中存在类似原理(决策论规划、强化学习)。既然四项核心技术都是如此,AlphaGo Zero像不像人?凭什么说它不像人?到底怎样才算“像人”?
因此,至多可以说,现有人工智能技术“像人”的程度没有达到某些人的期望。但是,我们为什么要让人工智能“像人”?最终的原因是,我们希望人工智能可以解决更多问题,根本之处在于能解决哪些问题。根据封闭性准则,未来研究的重点是解决非封闭性问题。可以预见,未来的人工智能技术,不管像不像人,都必须能够解决非封闭性问题,或者更好地解决封闭性问题。
您明年有哪些研究计划,会特别关注哪些方向?
陈小平:明年我和我的团队在基础研究中的工作重心是某些行业应用中的非封闭性问题,其实今年已经取得了根本性进展,明年将针对具体行业应用加快推进。同时,人工智能伦理建设也是摆在我们面前的一个重大挑战。当然,由于现有人工智能技术的大规模应用具有最高紧迫性,明年我们将投入更大力量,为人工智能的产业化推广做出自己的贡献。
(原载于《信睿周报》第16期)
来源:信睿周报
链接:https://mp.weixin.qq.com/s/b3j_m_IdlXUz7q22WLM71Q

384#
 楼主| 发表于 2020-1-20 22:18:49 | 只看该作者
【案例】

一篇文章看完2019年AI大事件

「 以时间为经线,
串联2019年国内AI相关领域的大事件,
见证历史的发生并静默等待“奇点”的临近」
作者 | 罗龙翔
编辑 | 珲哥
人工智能(Artificial Intelligence,AI)至今为止仍未有权威且统一的定义,但智能却是相对悠久的概念。中国古代思想家一般把“智”与“能”作为两个相对独立的概念来运用,前者表示智力,后者表示能力,“智能”则是智力与能力的总和。
从来源出发,目前“智能”可分为自然智能和人工智能。前者指自然进化所造就的智能,其最佳代表形式是人类智能;后者则指由人类所创造的智能。按发展阶段来看,人工智能又分为弱人工智能、类人工智能和强人工智能。
在人工智能领域,深度学习与数据算法、计算平台与芯片以及人机协同机制被视为人工智能取得突破的三大关键。
人工智能在2019年持续引发了科技、经济、社会、文化、军事等各个领域的广泛关注。本文将以时间为经线,串联2019年国内AI相关领域的大事件,以期与各位在夹杂着兴奋、期待、紧张且略带紧张的氛围中,见证历史的发生并静默等待“奇点”的临近。
January
1月


2019年1月8日,第52届国际消费类电子产品展览会(美国拉斯维加斯CES展)拉开帷幕。科大讯飞在CES上展示了“翻译黑科技”讯飞听见系列产品和讯飞翻译机2.0。
讯飞翻译机背后的主要技术包括神经网络机器翻译、语音设备、语音合成、图像识别以及四麦克风阵列等多项人工智能技术。
惊喜之处在于,讯飞翻译机除了能够识别世界主要语言以外,还能够分析英国、澳大利亚、加拿大、印度和新西兰等5个国家不同口音的英语。同时,包括东北话、四川话、河南话和粤语在内的4种中文方言也能够识别。
对于用户而言,未来可以“一机在手、天下我有”,“妈妈再也不用担心我的旅行。”

February
2月
2月27日,人工智能创业企业地平线公告公司完成了6亿美元左右的B轮融资,该论融资由SK中国、SK Hynix以及数家中国一线汽车集团联合领投。地平线此轮融资后的估值为30亿美元,这标志着地平线成为全球最具价值的AI芯片企业。
在地平线的报告里,该企业宣城其未来的目标是成为“边缘计算领域的英特尔”,而主战场,将是智能驾驶和AIoT。地平线认为在人工智能时代,计算下沉到边缘终端必然会成为趋势。
March
3月
3月28日,《2018—2019年中国人工智能产业创新创投研究报告》发布,报告指出,2019年中国人工智能核心产业总规模预计达到960亿元,增长幅度为40%。
通过报告的分析,不难看出,人工智能对数字经济产业结构的重塑将在从芯片、技术到应用的全产业链上进行。
智能芯片、计算机视觉和自然语言处理将持续作为AI发展的重点方向。同时,安防监控、智能驾驶、智能硬件助手、智能制造、智能投顾与算法交易、城市大脑、智能医疗等将成为热门赛道。
April
4月


4月27日,在召开的科技创新大会上,北京大学宣布成立人工智能研究院,作为学校直属的独立实体机构,该研究院旨在统筹全校相关资源建设世界一流智能学科、服务国家人工智能重大战略、培养智能学科一流人才。
除了北大以外,国内还有众多高开设了从AI学术实力、影响力、跟AI相关度高的学科,综合实力也十分强大。
例如, 1月,中国人民大学高瓴人工智能学院正式成立,学院旨在以推动人工智能基础性理论和技术研究、人工智能与人文社会学科交叉融合以及前沿产业创新实践应用为使命,吸纳并培养人工智能与各交叉学科、各实践领域深度融合的独立思考者。
又如,4月,浙江大学宣布人工智能本科专业开始招生,9月入学的新生将纳入新设立的竺可桢学院图灵班。南京大学人工智能实验室早在上个世纪60年代调试成功了当时国家高等教育部所属高校第一台计算机,实现了我国第一个高级语言编译程序。清华大学计算机系智能技术与系统国家重点实验室,该实验室是国内在人工智能人才培养和科学研究的重镇等等。
May
5月
5月27日,人民日报发表评论文章《新技术,占据创新制高点——感受中国经济“发展新优势”》。
文章指出,新一轮科技革命和产业变革正在重构全球创新版图,在新技术尤其是人工智能、空间技术等颠覆性、战略性技术上占据制高点,需要下好“先手棋”。新技术由发展需求孕育,也是经济持续增长的新引擎。
文章在大方向上勾画了新技术的发展方向,如融合机器人、数字化、新材料的先进技术加速推进制造业升级转型;以人工智能、物联网、区块链为代表的新一代信息技术加速突破应用;安全清洁高效的现代能源技术推动能源生产和消费革命等。
June
6月
6月,京东给自家的云业务找了一个新卖点——“AI+云计算”。
京东云和京东AI事业部两个部门从6月开始展开全面业务合作,背景是“当下产业互联的需求多元化、场景碎片化、价值个性化要求云厂商朝着智能化的方向发展,而京东云希望通过AI等前沿技术创造更多技术价值。”
在技术层面,双方的合作包括京东云为京东AI的合作伙伴和客户提供包括IaaS(Infrastructure as a Service,基础设施即服务)、PaaS(Platform as a Service,平台即服务)、SaaS(Software as a Service,软件即服务)的全栈式服务,具体包括从云计算业务、IDC业务到综合业务的全频段服务,以及私有云、公有云、混合云和专有云等全场景服务。
京东方面的数据是,今年“618”购物节期间,通过CDN(Content Delivery Network,内容分发网络)对京东亿万张图片及视频进行加速,提供最顺畅的用户体验。CDN网络支持最高超过500万QPS的峰值访问压力,峰值带宽同比2018年618期间增长65%,其中视频流量同比增长114%。
July
7月


7月1日,一年一度的百度AI开发者大会在北京国家会议中心举行。
在主论坛上,“厂长”李彦宏以“迎接产业智能化”为主题为大会定下基调。论坛上,李彦宏介绍了百度在其AI中心操作平台“百度AI大脑” “茶博士”的核心技术及相关应用技术方面的突破。
“百度AI大脑”的技术构架包括了基础层(算力、算法、数据)、感知层(语音、视觉、VR/AR)、认知层(语言与知识)以及平台层(AI平台与生态)等四大主要版块,并且, AI安全技术贯穿了“茶博士”的整个架构。
未来,“茶博士”将能和具体的应用场景结合,解决智能泊车、智慧家居、智慧城市、智慧医疗和智慧农业等方方面面的智能化问题。并且,多领域的协同进步,将会进一步促进产业智能化的到来。
同时,大会上介绍的语音理解框架ERNIE、流式多级注意力阶段模型SMLTA、鸿鹄芯片和深度学习平台飞桨PaddlePaddle等所涉及的AI技术,均处于国内乃至世界领先水平。
August
8月


8月29日,2019世界人工智能大会在上海世博中心正式揭幕。为期三天的大会展示了全球人工智能领域的新技术和新产品。
新奇的地方在于,除了我们熟知的领域,通过大会,我们还能了解到许多AI应用的新场景。
例如,江苏昆山阿尔飞思推出了AI智能垃圾桶,能够对垃圾进行自动感性和识别,并实现自动分类,让人类挣脱被问“你是什么垃圾”的历史困境。
AI垃圾桶的整个处理流程包括:摄像头拍下垃圾照片-上传云端进行图片识别-归类-入袋,整个过程大约为2.7秒,其中计算时间仅为300ms(毫秒,1毫秒约等于0.001秒),并且目前垃圾分类的精准度超过95%。
未来,智能垃圾桶还能与有深度学习功能的数字化环卫管理平台“睿平台”相结合,帮助打造数字环卫管理系统。
September
9月
9月25日,杭州云栖小镇,阿里巴巴集团达摩研究院院长在云栖大会上,高调发布了含光-800芯片。
在通稿中,这款芯片被冠以了“全球最强”的称号。在业内标准测试ResNet-50中,含光800的峰值推力性能达到了78563 IPS,效能比500IPS/W。在杭州城市大脑的业务测试中,一颗含光800芯片的算力相当于十颗GPU(Graphics Processing Unit,图形处理器)。
在演示过程中,含光800并应有与实时处理杭州主城区的交通视频。在以往,处理等量的视频内容需要40颗传统GPU,延时为300ms,而处理等量数据只需4颗含光800芯片,并可将延时缩短至150ms。
未来,以含光800为代表的芯片可与视觉类算法深度集成,实现大网络模型在一颗NPU上完成计算。对于普通用户来说最直接的体验改善,就在于淘宝识图购物的速度将会更快。
October
10月
10月24日,央视网、央广网、国际在线联合科大讯飞发布AI主播解决方案。
作为总台三网“人工智能编辑部”的首批重点技术产品,AI主播解决方案以AI赋能媒体,面向媒体和互联网行业开放,提供“一站式虚拟主播视频生产和编辑服务”。
在此次发布的解决方案中,原有的虚拟主播系统进行了全面升级,可以同时支持客户端和WEB两种方式。


同时,AI主播支持多语言、多方言。并且,AI主播还可变换姿态、变换造型。在生产层面,简单输入文稿,指定AI主播,即可一键完成视频的生产输出。
在媒介融合的大浪朝下,此次发布的解决方案,致力于媒体融合中“找好主播难、实时生产难”等行业痛点。按照中央广播电视总台的部署,央视网、央广网、国际在线三网落实总台“5G+4K/8K+AI”战略布局,共同建设“人工智能编辑部”,致力打造成为中国主流媒体中大规模的视听内容AI处理加工平台、独具总台“智造”特色的产品创新基地、面向行业输出各种视频AI工具包技术产品服务的赋能平台。
在不久的将来,我国媒介融合一定会产生基于“5G+4K/8K+AI”的新业态。
November
11月
11月14日,在中国通信标准化协会(CCSA)物联网(TC10)第二十三次全会的5G研讨会上,《“5G+人工智能”融合发展与应用白皮书》发布。
白皮书从5G及人工智能的发展现状入手,多角度讨论了5G和人工智能相互促进,协同发展的可能性,;并结合丰富多样的典型应用场景,如自动驾驶、智慧新媒体、工业互联网、智慧医疗、智慧环保、智慧港口、物联网、智慧物流以及智慧能源等。
在未来几年间,运营商除了全面推进5G网络建设,也要继续深入推进云化转型,积极发展IoT业务。电信网络和业务也会变得越来越复杂,运营成本、网络运维方面的压力也会越来越严重。新一代网络设备对更高智能水平的要求愈发强大,除了网络运营和运维模式需要变革,当前以人驱动为主的人治模式也逐步向网络自我驱动为主的自治模式演进。
December
12月
12月,全球放射学顶会RSNA 2019 AI挑战赛落幕,腾讯医疗AI在大会上夺冠。
腾讯AI Lab在大会上,针对颅内出血(Intracranial hemorrhage, ICH) 的位置识别和类型问题,采用多模型、多阶段、多信息融合的方法,通过添加CT图像的空间信息,融合医学图像病变的关联性,以及有效的数据采样算法,短时间内从超过一百万幅脑部CT图像中找到了颅内出血的病变规律,从1300多支队伍中脱颖而出,取得了Stage1和Stage2双榜第一的成绩。


这已不是腾讯企业第一次在学术领域取得优秀的成绩,一直以来,腾讯也可谓是AI等高新科研队伍的重要一员。今年10月,腾讯旗下两大AI实验室——腾讯优图实验室与腾讯AI Lab分别有4篇论文入选在国际顶级人工智能医学影像学术会议MICCAI 2019。


早在2017年11月,国务院科技部“钦定”的四大人工智能平台便包括腾讯(智慧医疗)、阿里巴巴(智慧城市)、百度(智能驾驶)和科大讯飞(智能语音),青山依旧在,首批人工智能国家队在2019年依然表现抢眼。
在人工智能领域,深度学习与数据算法、计算平台与芯片以及人机协同机制被视为人工智能取得突破的三大关键。通过回溯,我们欣喜地看见了国家的进步。
人工智能科学技术的研究目标正是要探索人类智能的工作机理,在此基础上研制各种具有一定智能水平的人工智能机器,为人类的各种活动提供智能服务。毋庸置疑,未来一定是人机共存的时代,让我们屏息以待。

参考文献:
1.阿里首颗自研AI芯片含光800问世[J].智能建筑与智慧城市,2019(10):5.
2.北京大学新闻网.北京大学召开科技创新大会宣布成立人工智能研究院[EB/OL](2019-04-27)[2019-12-24] http://news.pku.edu.cn/xwzh/bb1114876c524d9d8a47a3bd8947c0ef.htm
3.第一财经. 京东云与京东AI内部联手 推京东云智能产品(2019-06-28)[2019-12-24] https://baijiahao.baidu.com/s?id ... r=spider&for=pc
4.大事记资讯平台.地平线成估值最高的人工智能芯片公司[EB/OL](2019-02-28)[2019-12-24] http://www.dsj365.cn/front/article/21850.html
5.国际在线. 总台三网联合科大讯飞发布一站式AI主播解决方案(2019-10-24)[2019-12-24] http://baijiahao.baidu.com/s?id= ... r=spider&for=pc
6.环球网. 腾讯医疗AI夺冠全球放射学顶会RSNA 2019 AI挑战赛(2019-12-06)[2019-12-24] http://baijiahao.baidu.com/s?id= ... r=spider&for=pc
7.靳芳.人工智能领域关键技术的发展[J].电子技术与软件工程,2019(22):247-248.
8.新浪VR. 2019年“5G+人工智能”融合发展与应 用白皮书(2019-11-14)[2019-12-24] http://vr.sina.com.cn/news/hot/2 ... hnzahi0816541.shtml
9.中青在线.新技术,占据创新制高点(人民时评)—感受中国经济“发展新优势”⑥ (2019-05-27)[2019-12-24] http://news.cyol.com/content/2019-05/27/content_18028213.htm
10.钟义信.人工智能:概念·方法·机遇[J].科学通报,2017,62(22):2473-2479.

来源:北京大学社会化媒体研究中心  

385#
 楼主| 发表于 2020-1-20 22:28:11 | 只看该作者
【案例】
国内首部智媒体论著作者李鹏:封面新闻深融中的“智媒路径”
人工智能、虚拟现实、大数据应用、云计算推送……如今,新技术不仅颠覆了媒体格局,还颠覆了人们对媒体的旧有概念——当下传媒领域正在进行着一场深度的、革命性的变革。
与此同时,我国媒体领域也正在经历改革,走向深度融合阶段。对于新技术所带来的新机会与新挑战,封面传媒董事长兼CEO李鹏提出“智媒体”转型路径,并在最近推出的著作《智媒体——新物种在生长》中对智媒体发展的诸多问题进行了详细的解读。我们邀请到李鹏为我们解读封面新闻的转型经验与突破。


嘉宾简介
李鹏,四川日报报业集团副总编辑,封面传媒董事长兼CEO;智媒体首创者和实践者,国内首部智媒体论著《智媒体》作者;编著书籍10余部、学术论文40余篇,获中国新闻奖、四川省社会科学优秀成果奖。
01
理解智媒体:
“智能”、“智慧”与“智库”
早在1993年,美国科幻作家弗洛·文奇就在《即将到来的技术奇点:后人类时代生存指南》一文中写道:“在未来30年间,我们将有技术手段来创造超人的智慧。不久后,人类的时代将结束。”
时间过去23年,机器人技术就已从弱人工智能时代演进至强人工智能时代,“AI时代”的强势来袭,是“IT时代”的渐渐远去,也是“DT时代”的融汇升级。
我们一直认为,变化是最大的机会。当“智能爆炸”临近之时,互联网法则将发生变化,“瓦解”、“重生”、“再造”将成为这个时代的主题词,也将成为我们重新联接世界的机遇。
因此,在20151028日封面传媒公司成立那一刻,在宣布“终于,我们来了”的时候,我们就将公司的愿景确立为“构建引领人工智能时代的泛内容生态平台”,即用人工智能打造新型主流媒体。201610月,我们又率先提出“建设智媒体”,接着就朝着目标一路坚持,一路奔跑。
封面是如何理解智媒体的?
我们认为,智媒体是用人工智能技术重构新闻信息生产与传播全流程的媒体。技术驱动是智媒体的本质特征,人机协同是智媒体的重要标志,智能传播是智媒体的目标追求。
在封面路径中,智媒体包涵智能、智慧、智库三个方面,用一个公式来概括就是:智媒体=智能媒体+智慧媒体+智库媒体,即媒体的“智立方”。
智能媒体,是用人工智能技术改造媒体,重新定义媒体,加大人工智能技术在采访、写作、互动、效果检测、营销等环节这些环节的试验、探索和应用,给用户带来全新体验,让智媒体成为“人体的延伸”。
智慧媒体,是智媒体必不可少的重要构成,其关键在于,充分发挥智慧主导的作用,为技术引擎植入价值观的灵魂,生产正能量、年轻态、个性化的深度原创内容,为智媒体赋予正确的价值导向。
智库媒体,是通过智能技术和智慧报道为政府、企业、社会民众提供智力支持,给政府和企业决策的发展提供参考,为用户提供生活资讯服务,成为政企机构、媒体和用户的联接点。
对封面新闻而言,智媒体既是媒体深度融合的结果,也是融合发展的未来。过去十年封面新闻的媒体形态经历了三个阶段,即从全媒体到融媒体再到智媒体。
全媒体是刚开始媒体融合时所追求的媒介形式“全”,即种类多、品种齐全,是“相加”式的物理反应。而融媒体更像一种化学反应,它是各种要素、各种资源的重新组合、重新嫁接,努力形成合力。但在未来,媒体应从基因进化角度推进融合,也就是我们所倡导的“智媒体”,它让信息传播跟人工智能等技术相融合,最终实现传播的蝶变。
之所以如此笃定“未来媒体一定是智媒体”,是因为从报纸、广播、电视到互联网,我们能够看到技术是推动信息传播变革的核心驱动力。
而放眼全世界,人工智能正在持续改造各个行业,也在持续改造媒体行业的各个方面,从传播者、传播内容、传播渠道、传播对象到传播效果等各个环节都在经历AI+”带来的变化:从素材收集、筛选、分析、成文,直至最后的内容分发;从新闻线索搜集、写作到事实核查,再到效果反馈。每一个环节都有人工智能深度参与,推动新闻生产流程的智能化变革。
因此,人工智能与媒体深度结合的智媒时代一定会到来。
02
封面智媒体建设路径:
“三轮驱动”与“三环联动”
打造智媒体的战略层路径:“三轮驱动”与“三环联动”
“三轮驱动”与“三环联动”是两个层面的战略支撑,前者指向产品与平台打造,后者指向发展与产业拓展。
“三轮驱动”主要指技术引领、内容为王、资本支撑。根据互联网发展规律和新媒体传播规律,技术、内容和资本将共同构成未来媒体建设的三个中心环节:技术是产品创新的核心动力,内容是服务用户的核心主体,资本是保障技术和内容的重要依托。这三个驱动力将共同来驱动智媒体的运营和发展。
“三环联动”是指影响变现、资本运作、产业支撑,关于新媒体盈利模式,无论体制内外,都是一个持续不断探索的时代命题。
通过这些年在PC端和移动端的探索,可以肯定的是,完全依赖传统广告的盈利模式是不能实现长远发展的,是不可能做强做大的。取而代之,必须按照互联网的方式去思考、去探索、去突破,按照互联网平台“影响变现+资本运作+产业支撑”这条路径,让三者相互支撑、相互作用,构成“三环联动”的立体式结构,才能形成良性运行的数字经济闭环,让新媒体发展真正立得住、立得稳、立得好。
对我们而言,资本运作是互联网平台发展的规律性路径,资本是运营和发展过程中非常重要的驱动力。
资本是有魔力的,它有放大和催生的作用。我们可以通过资本助力,提高产品的生产,推动产品的迭代,扩大发展的渠道,延伸产业的链条,铸起一个高的门槛,推动我们在前行的路上继续领跑。
同时,资本是一个很重要的杠杆,它还可以撬动我们体制、机制的创新。资本会倒逼我们转型,倒逼我们改革。
传统媒体要进军新媒体事实上很难,有很多障碍要去突破。如果没有资本的驱动、没有资本的支撑,进军新领域的挑战便很难克服。所以我们也必须加快资本运作力度,通过资本运作积聚资本,加大品牌与用户推广,引进先进互联网人才,推动体制机制改革创新,从而反哺新媒体平台打造,推动新媒体平台快速做强做大。
封面智媒体组织变革模型:建立现代企业制度
我们正在按照建设互联网科技传媒文化企业的目标,建设符合互联网发展规律的现代企业制度。
比如,建立数据驱动增长型组织,让组织变革符合“数据驱动是首位战略”的转型要求;再比如,我们为适应融资股改的要求,正在构建更符合现代企业发展要求的现代企业制度,建立与之相关的现代企业文化、现代企业组织体系等。
在封面新闻,总编辑就是首席技术内容官,总经理就是首席技术营销官。作为封面新闻的一位员工,可以不知道程序代码怎么写,但一定要知道怎么用新技术来创新内容、销售、产品等工作。
为此,封面新闻建立了新的“技术+”机制,将基础支撑型团队中的人才,嫁接到内容、产品、运营等各个团队的关键部门中去,由他们来驱动这个系统的“技术+”转型。
我们设立了技术营销官、技术内容官、技术运营官、技术产品官、技术安全官等,推动所有员工都关心、掌握、应用新技术,植入技术的灵魂、基因。唯有如此,才能实现建设智能编辑部的目标,才能真正推动智媒体建设落到实处。
封面智能媒体建设:在应用层多向拓展,打造“智能编辑部”
封面新闻的智媒体建设正在稳步推进。
我们持续用人工智能技术重构新闻信息生产与传播的全流程,打造“封面大脑”。其中的重点就是建设“智能编辑部”。我们已经把人工智能技术运用到了采编全流程,通过机器学习算法、机器写作等,打造封巢系统,在人机协同生产上取得了较大进展。
智能编辑部不是传统实体编辑部的概念,而是由一系列的智能产品的集合,通过智能编辑部重新为媒体赋能,从资讯传播的起点到终点,都赋予人工智能技术的基因,全面改写媒体定义。
对于封面新闻而言,这个智能编辑部包括7大类的21个产品,形成“智能+”的产品生态。比如人机协同的充分运用。在日常新闻报道中,我们通过自主研发的封巢系统,将“前方记者+后方编辑”的传统生产,升级为“数据支持+智能写稿辅助+融媒呈现+全网推流”的多线程、智能化协作,通过移动互联网将内容原创优势发挥到最大,扩大封面新闻原创的全网影响力。
AI技术的运用层面,除了算法推荐之外,封面也在AI+媒体的结合上取得了较大进展。
一是AI沉浸体验成为产品特征。我们在封面新闻的多个功能模块加入AI元素,营造一种AI沉浸式体验。比如在机器写作方面,封面新闻自主开发的小封机器人每天发稿量达300篇以上,2018年世界杯期间的赛事机器报道达642篇,还出版了诗集《万物都相爱》。
二是AI还被深度应用在封面新闻后端的生产流程中,通过我们自主开发的“封巢”系统,AI被用在素材收集、辅助写作、传播追踪、效果反馈和员工考核当中。封面新闻的AI应用包含于多种产品中,并会不断升级迭代。
新技术产生新内容,智慧媒体依然以“内容为王”
智慧媒体方面,封面新闻一直致力于用主流价值观为智能技术赋魂,建设正确价值主导的智慧媒体。
封面新闻坚持正确的政治方向、舆论导向、价值取向,把正能量、年轻态、视频化纳入我们的算法模型,主动承担向年轻群体传播主旋律的社会责任。
作为机构媒体和移动互联网平台,内容的专业化是不变的法宝。要充分发挥原创优势,做强做大内容传播力,在内容的高度、深度、温度、宽度上下更大功夫,这是专业媒体机构的基本体现。高度,是要围绕中心工作谋篇布局,做好策划和报道;深度,是要做好事件背后的调查、分析、追踪,逼近事实真相;温度,是要接地气,以人为本,报道必须有人物、有故事、有情节,体现人性和人文关怀;宽度,是指报道视野和角度,要体现新颖的思维、更专业的角度,加强对事件全貌的把握能力。
为了把握5G+AI的未来趋势,封面新闻内容生产突出视频化和智能化。自2019年以来,我们全面推进视频化迭代,倡导“无视频、不传播”。封面新闻5.0版本的迭代升级,完成了全频道的视频化建设,实现了视频沉浸式观感和年轻态交互。通过视频个性化算法推荐,新版本的封面新闻,将会让最适合的视频,找到最感兴趣的用户,形成优质视频资讯和人工智能的双核驱动。
在年轻态社群交互上,封面青蕉社区也进行了全新布局。不仅构建起一套统一的用户管理系统、优化用户社交体验,还为青蕉拍客量身定制科学的激励与扶持计划,帮助用户成为“新晋网红”。
为了确保全频视频化,封面新闻还强力推进全员视频化生产,要求所有内容生产员工都要会拍摄视频、剪辑视频。全面视频化,将是封面新闻内容今后的主攻方向。
建设智库媒体,搭建数据+舆情的决策支持平台
智库媒体建设方面,我们成立了封面研究院,设立“人工智能、舆情、公益、人文、传播、新经济”六大研究所,实行内外部联席院长、联席所长运行机制,依托新技术、新内容,建设数据+舆情新型智库媒体平台。
具体到产品层面,着力打造封面指数和封面舆情两大拳头产品。封面指数主要依托AI、物联网、大数据等技术,为智能+发展提供指数分析。封面舆情主要是建成行业舆情数据开放平台,成为智慧移动舆情领导者。
智库是封面新闻智媒体建设的重要构成,封面新闻将用好技术支撑,在高端决策参谋和权威数据分析上着力,把智库产品做出特色。
“三环联动”为封面智媒体的可持续发展保驾护航
总结商业互联网平台的发展规律,我们把这条路径归纳为“影响变现-资本运作-产业支撑”,三个阶段环环相扣,相互支持、缺一不可。
影响变现是夯实生存的基础。无论体制内外,资讯类新媒体的“影响变现”仍然是盈利模式之一,我们仍然要坚持走好影响变现之路。这条路的关键在于做强影响,必须不遗余力、想方设法地快速提升用户规模、用户活跃度,提升自建平台的影响力。
资本运作为我们输入发展的活力。观察阿里、腾讯、百度等互联网平台的发展历程,资本运作是他们发展壮大的共同特点和必经之路;国内的媒体集团中,浙江日报报业集团、上海报业集团等更是在这一模式中做大了产品和平台。因此要加大对新媒体的融资支持,加快投资速度与机制优化,稳步推进上市工作,对接资本市场。
产业支撑帮助我们拓宽盈利渠道。媒体发展规律表明,传播主平台往往不是赚钱的主平台,即便是盈利规模也有限。因此构建大传播平台,制造传播大影响,加上强大的资本积聚与驱动,纵深拓展产业链条,在多远化的产业中拓宽盈利渠道才是可持续发展的模式。
我们也应围绕川报观察与封面新闻的定位,分别在各自擅长的领域加强产品打造、加快产业拓展、加大开放合作,运用自建、合作共建、投资等一切可以运用的方式,快速构建“互联网+”和“文化+”产业链,建设多元多样的盈利生态。
03
遵循七大思路,
走向深度融合转型
回溯历史,华西都市报-封面新闻的媒体融合发展经历了三个阶段。
2017年,“建好平台、整合资源”是我们推进媒体融合转型的1.0版本,重点是搭建封面新闻这个媒体融合的平台,整合相关资源推进融合转型。
2018年,“深度融合、整体转型”是推进媒体融合转型的2.0版本,重点是推进一支队伍、两个品牌、一体运营“121战略”实施,一支队伍就是华西都市报全体员工迁移到封面传媒公司,两个平台就是封面新闻和华西都市报,一体运营就是封面传媒公司整体运营封面新闻和华西都市报。
2019年以来,我们持续向“一支队伍、一个平台、一体运营”推进,这个阶段把数据驱动作为首位战略,实施数据驱动下的视频传播和社群营销战略,瞄准打造一流智媒体的目标努力。
深度融合不是表面融合、不是业务融合,而是在坚持“互联网+”的原则下,通过机制、体制创新,实现合而为一。整体转型不是部分转型,是全面的、系统的转型;整体转型,也不是整体转身,我们要不忘媒体初心,始终坚守媒体责任。
为了推进深度融合,重点要遵循七大思路,这是一个系统的发展理念和工作思路。其中每个思路包含三个点位,它们之间都是等边三角形的关系,同样重要,最为稳固:
一是推进融合转型的三个坚持,即“用户第一、创新为要和开放合作”,这是首先必须坚持的思路;
二是融合报道原则的三个优先,即“移动优先、视频优先和故事优先”,这是内容生产的原则;
三是生态平台打造的三个内容,即“新闻、人文和消费”,这是打造泛内容生态平台的基本内容;
四是智媒体建设的三智立方,即“智能媒体、智慧媒体和智库媒体”,我们已经多次谈到;
五是动力引擎的三轮驱动,即“技术引领、内容为王和资本支撑”,这三个方面构成了前进和发展的动力引擎;
六是盈利路径探索的三环联动,即“影响变现、资本运作和产业支撑”,是解决长远发展的路径规划;
七是可持续发展的三大保障,即“体制创新、人才构建和文化塑造”,是一个企业发展的重要内核。
与此同时,推动媒体融合向纵深发展一定要努力向前看,否则就赶不上时代的步伐。在未来的5G时代,技术的变化将更加难以想象。我们能做到的,就是在目前能看到、能想到的未来技术中,尽量去尝试,尽力去探索,把技术变量与媒体融合相结合,变成融合转型的增量,让融合更具未来感。
所以,未来的深度融合,就是以封面新闻为主阵地、主平台、主驱动、主战场,全面建设智媒体,建设引领人工智能时代的泛内容生态平台。
04
5G时代,
封面志在成为媒体技术引领者
自古以来,每一次重大技术变革,都会推动人类经济社会形态向前进步。移动互联网时代,技术的加速创新,5G的普及应用,又将推动移动互联网加速迭代。
随着5G商用的全面普及,5G网速和容量至少是4G10倍,由此又将把互联网带入新的分水岭,带来10倍以上的变量。
世界经济论坛全球议程理事会《未来软件与社会》报告显示,在2030年前,至少19类“黑科技”必将发生,比如:全球10%的人口身穿的衣服将会与互联网相连接,全球第一个植入式手机将会进入商业化应用,大约10%的阅读眼镜将会与互联网相连,超过50%的互联网流量将来自家用电器和设备。
封面新闻从成立以来,就坚持瞄准科技趋势打造产品。我们认为5G带来的变化,将是信息传播形态的本质变化,未来视频传播必将成为主流形态。
为此我们将从两个方面着力,一是打造专业视频精品,发挥机构媒体的优势,突出专业生产和精品原创,适度加大中长视频的生产。二是技术加持,AI赋能智媒视频传播,比如新技术视频生产,在VRARMR上着力,提升视频传播力感染力;比如AI与视频相结合,加大AI虚拟主播的开发与应用;比如AI视频审核与剪辑,提升视频生产力。
同时,我们将瞄准信息传播的下一个空间——物联网,谋划和布局“封面智联”产品、区块链产品等,在技术+内容的创新上不断谋求突破。
另一方面,我们将以“数据驱动增长”为发展理念,把数据驱动作为首位战略,以用户为中心,以增长为导向,用数据驱动AI开发、产品迭代、用户运营、安全保护、收入增长、组织变革等工作,建立数据驱动文化。
一是以数据驱动用户增长,以用户为中心洞察数据,改进生产,提供最佳用户体验,进而推动用户增长;
二是以数据驱动收入增长,对广告主的数据洞察进行精确把握,进而优化业务增长和盈利能力;
三是以数据驱动产品迭代,把数据应用到产品设计、产品功能评估、数据埋点、产品实验、指标观测等每一个环节;
四是以数据支撑“智媒体”创新,不断提升深度学习能力,推动“智媒体”创新;
五是建立数据增长型组织,打破传统的职能型部门架构,优化内部资源,建立跨部门的增长型团队,真正用数据作为团队的考核指标,让团队相信数据驱动,掌握数据驱动,推动管理从职能型组织向数据增长型组织进化,实现组织文化的自我革命和进化涅槃。
从蹒跚学步到稳健前行,走过幼儿期,进入成长期,封面新闻度过了发展的1.0阶段,迈入了2.0阶段。我们这样定义自己,是因为我们将未来全新出发、全面发力,从做产品,到筑产业,构建“科技+媒体+文化”生态体,打造一流互联网科技传媒文化企业。
我们将进一步实现自我迭代,推动科技向前,成立封面科技公司,坚定走科技强媒之路,打造基于AI+媒体的一流技术驱动型公司,做媒体技术的引领者、体制机制的创新者、资本运作的先行者。
未来封面科技公司的产业链条构建将围绕“智媒体”这个核心,重点瞄准三个方向:一是智媒信息服务产业,提供基于人工智能技术的多样化资讯服务;二是技术交互娱乐产业,进军VRARMR娱乐消费和游戏互动等视听感官体验的新技术文化产业;三是新型文旅产业,依托新创意、高科技打造多产业融合文旅项目,进军智慧文旅、文创产业。
随着5GAI的加速融合,智能互联网发展空间无比广阔,它所带来的变化将远超上一个20年。封面传媒将全力构建智媒产业链,打造“科技+传媒+文化”的生态体。

来源:智媒前沿
链接:https://mp.weixin.qq.com/s/XM1KKszAlR3baFg_yOm8Qg

509698581949114722.jpg (69.87 KB, 下载次数: 13)

509698581949114722.jpg
386#
 楼主| 发表于 2020-1-22 21:34:47 | 只看该作者
【案例】
全球新闻业人工智能应用调查报告

机器会接管新闻业吗?在伦敦政经学院的查理·贝克特教授看来,答案是否定的。
AI(人工智能)、机器学习和数据处理的实际应用状况和其具备的潜力表明,它们将赋予新闻工作者全新的力量:发现、创造与连接。
未来我们可以期待的是,新闻工作者能够通过算法进行“充电”,以更有效的新方式发挥人类擅长的技能。人工智能还会改变新闻编辑室,使其从单一性生产线转变为网络信息和参与中心,让工作者推动新闻行业进入数据时代。
算法将为系统提供动力。但是,新闻中的人情味——来自新闻工作者的洞察和判断——将弥足珍贵。新闻界能否抓住这个机遇?
互联网、社交媒体和移动通信为新闻业提供了新的工具和途径。现在,人工智能将带来新一次技术飞跃。但它同时也会带来经济、伦理和编辑层面的威胁,而我们是否意识到其中的问题?在21世纪,依靠算法获得增强的新闻工作者,以及使用人工智能的新闻机构,都在进入另一大过渡阶段。新闻如何维持其公共价值?
为了了解新闻媒体对人工智能的看法,以及新闻界接下来的可能做法,伦敦政经学院的查理·贝克特教授率领团队进行研究并发布了《全球新闻业人工智能应用调查报告》。
报告基于对来自32个不同国家的71个新闻机构在人工智能(AI)和相关技术方面的态度和使用情况的调查,邀请了许多正在使用AI的记者回答以下问题:对AI的理解、在新闻编辑室中如何使用AI、对AI新闻业潜力及风险的看法、对AI伦理的了解。除此以外,研究团队在新闻业相关会议上还进行了采访,与新闻业相关从业者沟通交流,以作为补充。
其中大多数受访者都是技术专家,是最早运用数字技术的人,所以他们比随机抽取的记者样本要更了解AI。此次报告选取了116名来自不同部门的记者,并展现他们对AI的观点。
腾讯媒体研究院对报告全文进行了编译,通过这份长达4万字的报告,我们能够理解全球范围内的媒体机构是如何理解并运用AI的,以及如何从内容到组织对AI进行全流程的配套。
本文共包括七个部分:
1.报告核心摘要
2.人工智能在新闻编辑室中的定义
3.当今新闻业如何使用AI
4.AI策略的制定
5.编辑与道德伦理
6.人工智能和新闻的未来
7.结语:人工智能对新闻业意味着什么?
温馨提示:由于报告篇幅较长,若有需求可直接滑至文中感兴趣部分进行阅读,以提高效率。

报告核心摘要
1.    人工智能(AI)是一系列包括机器学习、自动化和数据处理的技术,目前已成为新闻业的重要组成部分,但应用地域分布不均。
2.    它对未来的影响尚不确定,但人工智能对新闻的产生和消费具有广泛而深远影响。
3.    即使是对AI运用在行业领先的新闻编辑室,也认为AI只是作为新闻业的附加品和催化剂,而非具有变革性影响。
4.    本报告中描述的“力量”和“潜力”清楚地表明,所有新闻编辑室都应该警惕AI的作用。
5.    新闻编辑室将AI定义为与人类或技术相关的事物。
6.    未来应该对AI进行系统定义来帮助制定策略并促进对新闻编辑室中的AI的理解和沟通。
7.    不到一半的受访者表示,他们使用AI进行新闻采访,三分之二的人表示他们将其用于生产,一半以上的人表示他们使用AI进行分发。
8.    受访者普遍希望提高效率腾出资源,以增强编辑室的功能,并提供新的或经改进的内容和服务。
9.    使用AI的三个主要动机是:使新闻工作者的工作更有效率(68%);向用户提供更多相关内容(45%);提高业务效率(18%)。
10. 三分之一多一点的受访者表示自己有一个积极的人工智能战略。
11. 布局AI战略的主要方法有四种:对现有部门的管理;设立独立团队从事AI项目;整合技术和编辑架构;实验小组制——分散或整合。
12. 新闻编辑室大概可以分成两类,一类是已经做好了运用AI的准备,另一类则刚刚开始或仍在计划中。
13. 人们非常担心自己的新闻编辑室落后。对于小型新闻编辑室来说,这是一个特别重要的问题,因为这会导致新闻编辑室之间的不平等日益加剧。
14. 人们发现新闻编辑室的岗位正在发生更多变化:现有工作增加而非替换。现有职位的人员将会有新的任务、工作流程,但很少有针对AI的新岗位。
15. 受访者认为运用AI的最大挑战是财政支出(27%)和知识技能(24%)。但是与这些一样重要的是企业文化层面的抗拒(24%),这里面包括害怕AI会导致自己改变工作习惯,以及对新技术的普遍敌视。缺乏对AI的了解(19%)以及缺乏战略管理洞察力(占17%)也是关键要素。他们认为AI的搭建和管理成本通常很高。
16. 从我们的调查中可以明显看出,这些新闻编辑室普遍缺乏战略规划。人工智能战略将始终根据新闻编辑室的性质以及他们所处的阶段而变,但从这项研究中得出了以下需要考虑的关键要素:
评估AI现在的准备阶段和状态;
了解你正在考虑使用的人工智能技术并为其分类;
确定AI如何与您的品牌和总体策略相关,它能解决的问题,或它可以满足的需求;
评估机构的哪些领域可能使用AI及其原因;
确定主要障碍:资源、技能、文化、管理等,并计划如何系统地解决它们;
分配角色和职责并建立沟通整个组织的结构,包括所有利益相关者;
建立监测和审查绩效的系统和优先事项;
建立与合作伙伴、客户和广泛的AI资源的外部联系,以调查和整合人工智能创新;
17. 大多数受访者表示他们对AI持有信心,但前提是新闻机构保留其道德准则和编辑立场。
18. 新闻编辑室确定了六个AI可能改变的领域:
经济:AI可能会带来效率的提升及成本的降低,可将节省出的资源用于提高新闻质量;
算法偏见:数据使用不当可能导致编辑错误,例如不准确或失真信息甚至歧视某些社会群体或观点;
错误信息/过滤气泡:人工智能将助长虚假信息泛滥。粗暴地使用个性化分发会导致偏见或冲突。但是管理良好的AI可以帮助应对错误信息并提高公共信息质量;
增强编辑决策和透明度:人工智能可以帮助纠正偏见并增加故事及受众的多元化。它可以帮助提高新闻的透明度;
平衡人类和人工智能:AI新闻业保留了人类的价值,甚至增强了人类的判断力和创造力;
科技公司的作用:有人担忧科技公司的力量可能会成为竞争对手,并担心技术会控制研究和产品开发。但他们还被视为创新、工具和系统的来源。科技公司有必要增加透明度、与新闻业的持续对话、支持。
19. 未来将出现三个层面的思考:
第一:短期内改善和迭代现有的产品和编辑团队;
第二:中期2-5年内对新的应用程序进行创新;
第三:长期的创新和试验可能会使用全新的方法或结构;
20. 当我们问到他们如何面对未来AI的挑战时,回答最多的两个答案与技术并没有直接关系:在新闻编辑室进行培训、教育和扫盲(44%);招募有新技能的人才(43%)。
21. 受访者的未来AI工具愿望清单中最常提到的三个工具是:更方便的标记/信息提取(新闻收集);更好的机器生成内容(新闻制作);更好的个性化/推荐引擎(新闻发布)。
22. 受访者最希望接受培训和教育的六个方面是:
AI素养:在新闻机构中促进理解;
AI技能:基本技能,例如编码和数据培训;
更高级的AI技能:促进创新并作为全体员工职业发展的一部分;
对于管理人员:提高全体意识并了解AI系统和其他AI模型;
道德伦理:了解如何减少算法或数据偏差并提高准确性和可靠性;
AI的总体了解:对AI及其对用户和社会的影响具有更科学的了解。
23. 尽管存在竞争压力,但人们仍希望提高标准和创新并提倡协作:
新闻机构内的各个部门;
新闻机构之间——既在故事层面也在技术发展层面;
国家内部或跨国合作;
与科技公司合作;
与初创企业和中介组织合作;
与大学/研究人员合作。
24. 人工智能将以渐进的方式重塑新闻业,但具有长期的结构性效应,反映出新闻媒体如何在技术、社会和商业的作用下发生变化。在一个更加网络化的世界里,人工智能将在所有领域变得更加重要。
25. AI将使新闻媒体更加“不平等”和多样化,并改变工作结构、新闻流以及与公众的关系。
26. AI将为新平台和工具提供动力,例如AR、无人机、语音、图片和文字生成以及可穿戴设备。
27. 人工智能将为信息和公众议题的探讨提供动力,尽管通常并不通过新闻媒体发生作用。新闻编辑室必须适应新的编辑权威和信任的形式。
28. 新闻业可以从其他行业中学到很多东西,包括科技公司和初创公司、营销公司和广告主,以及法律、游戏、赌博和音乐行业:他们如何使用技术来改变工作流程、营销习惯,他们与用户的关系以及道德伦理。
人工智能在新闻编辑室中的定义
在我们了解受访者对AI的评价之前,应当首先明确AI的含义。通用人工智能(AGI)在操作上尚不存在,仍然只是一个假设。
机器无法像《2001太空漫游》中Hal计算机那样完全自主思考。“通用”或“强大”的AI距离今天还有数年之遥,或者可能根本无法实现。
如今在新闻和其他行业中使用的AI被定义为“窄”AI或“弱”AI,这种AI受编程限制较多。它们或许比人类更快或更有效,但实际上这只是“机器学习”(ML)或“自然语言处理”(NLP)。
许多被当作AI的技术流程通常都包含更多常规技术。这些是由人类创建或“训练”的系统,它们响应能力强且适应性强,但通常只能执行非常简单的自动化或数据处理任务。
对于此报告,我们借用了一个简单的定义:人工智能是一个与计算机系统执行能力有关的思想和技术的集合,所执行的任务通常需要人类智慧才能完成。
我们将使用AI”作为总括性术语,并始终认为它指的是相关技术的集合。AI由算法驱动,是“为解决特定问题或完成已定义的步骤而采取的一系列步骤”。这些可以都编程为机器学习或自动化,被当作“机器人”之类的工具。
关键因素是它们在一定程度上具有的自主性和适应性程度。极端情况下,“计算机可以决定一切,自主行动,无视人类”。低端一点,“计算机提供了一套完整的决策/行动方案”供人类参考。
人工智能的运作涉及三个领域,几乎涵盖了新闻生产的所有过程:新闻收集、制作和分发。我们首先询问受访者他们使用哪种“人工智能”的操作定义。这些定义反映了主题的复杂性和方法的多样性。此外,这些定义部分反映了受访者对于AI的理解,也反映了使用该技术的动机。
尽管有些人对AI有客观或科学的定义,但大多数人还是将其定义与技术的用途和目的联系在一起,他们始终认为AI是对新闻业现有的补充——“增强型新闻”。有时,该术语的使用方式十分特殊,例如,它被用来描述用于分析数据集(例如法院记录)以进行调查的工具。此外,该术语还有更系统的使用方法,例如通过受众数据为用户提供持续的个性化内容。
新闻室定义AI的方式通常反映了AI在其组织中的作用。这些定义通常用于与同事、公众或合作伙伴进行沟通。新闻界对AI的理解也需要考虑到这些利益相关者的观点。
技术定义基于算法、自然语言处理、自动化和数据分析的思想。对于约三分之一的受访者而言,“机器学习”是关键术语:
“从技术上讲,AI是机器学习/神经网络驱动的系统,但从新闻编辑室的层面而言,我将其更多地视为自动化系统,而不仅仅是一个非常简单的工具。”
考虑到技术快速发展的特性,受访者意识到他们的定义不可能就是最终定义。当我们询问受访者更具体的想法时,部分人表示需要将其定义与“人工智能”一词的炒作区分开:
“通常而言我们根本不使用这个术语。我们对AI的定义更狭窄,例如“机器学习”,或者当我们谈论某个特定领域时,我们使用的术语是NLP(自然语言处理)或深度学习。‘AI’对我们来说只是个时髦的词。”
更多的人对AI在技术层面上的定义强调了AI的工作方式。例如,通过在管理大量数据中创建模式识别,或使用预测和分类的原理来定义AI
与人类或任务相关的定义方法将AI视为执行、复制或模仿与人类的认知能力或“人类智能”相关的任务的能力。一般而言,他们不仅与新闻记者有关,而且与受众有关。人们几乎总是将AI定义为增强或扩展人类能力的工具:
AI可以利用计算能力来解决基于数据的问题,并进行人力无法实现的分析——通过学习/自我完善或通过处理和分析大量数据。”
我们的受访者都是在新闻编辑室中工作或与新闻编辑室合作,而不是进行纯粹的研究。因此,几乎所有人对AI的定义都具有功能性这一点也就不足为奇了。尼克·迪亚科普洛斯曾提到关于混合AI新闻的想法:“我们将AI视为可以获取、理解信息并得出结论,然后从其决策中学习的技术。”
四分之一的受访者表示,他们的组织没有对AI的正式定义,或者正在进行讨论:
“我们没有一个对AI的正式定义。我们正在讨论这件事呢。”
英国广播公司(BBC)是个有趣的例外。也许由于其规模和操作的多样性,它对AI下了多个定义:
“英国广播公司(BBC)对人工智能没有一个特定的定义。本来不同的人会对AI从不同的角度有不同的定义,并且通常用于指代前沿先进技术。但在BBC里人们所说的“人工智能”一词指的是一些常见的事物:(1)基于任何形式的机器学习技术(尤其是神经网络);(2)表示智能代理(例如语音代理,聊天机器人);(3)使以前需要人们完成的任务自动化进行的技术(例如,使用NLG (自然语言生成)撰写文章,自动翻译或转录等)。“人工智能”产品常常同时属于这三类。”
这个定义很重要,因为它反映了新闻编辑部可能会如何考虑其AI策略。对AI定义是为了有助于思考它与其他技术的不同之处。它反映了组织中AI素养水平以及与同事、与外界进行交流的能力。新闻编辑室采用任何新技术的核心压力之一是技术专家与其他部门之间的文化冲突。新闻机构如何定义AI可能有助于解决该问题。
随着技术的进步,新闻编辑室将拥有越来越多具有执行系统和自治功能的AI。了解什么是人工智能对于实现其潜力以及所涉及的机遇和风险至关重要。但是,新闻编辑室具有多样性,人工智能也是如此。技术及其用途不断发展,因此其定义也会改变。定义的灵活性反映了该技术及其应用的复杂现实。
1章:当今的新闻业如何使用AI
01
新闻编辑室使用AI做什么及其原因
我们问新闻编辑室他们在使用什么AI,为什么使用它以及有什么成效。答复大致分为三个方面:
新闻收集:信息的来源,故事创意的产生,确定趋势,调查,跟踪事件,提取信息或内容。
新闻制作:内容生成,编辑,用于不同形式和平台的包装,文本、图像和视频生成,为不同受众重新提供内容。
新闻分发:个性化分发,营销,寻找受众,了解用户行为,订阅。
不到一半的受访者表示他们使用AI进行新闻收集,三分之二用于生产,一半以上用于分发。但是,在当代的“网络化” 或“混合” 新闻业的背景下,投入与产出是一个高度相关的过程。
人工智能和新闻学的关键联系之一是,人工智能可以使整个新闻业变得更加完整,并在生产和传播过程的不同部分之间形成反馈循环。例如,AI可以将用户评论的审核视为收集、生成或编辑该内容,以及增加受众参与度的一种方式。这是一个几乎所有新闻编辑室都会进行的操作:
“推荐相关文章、机器人新闻(例如体育赛事报道)、个性化新闻源、预测性分析可优化新闻策划、语音转文字服务可提高编辑人员的工作效率、流失预测和订阅倾向预测、标签/实体识别、纠错检查。”
我们通常可以将新闻编辑室使用的AI更具体地描述为机器学习、自动化和数据处理等形式。“ AI”标签下的某些流程可能存在不同程度的限制,不可避免地会有一些灰色地带。新闻业继续经历着彻底的改革和创新过程,但我们并不是很清楚某种技术将在何处产生影响。
支撑所有AI流程的是数据:有关受众的数据,例如受众行为;有关报道主题的数据,例如官方文献;有关新闻的数据,例如情感和语言。无论使用哪种分类,我们都可以明显看出人工智能的使用正在渗透新闻业。这使得识别和评估人工智能的作用变得更加困难,但同时也反映了该技术的适应性及其与新闻业的紧密结合。
受访者对AI如何改善工作这个问题提出了“竞争力”、“效率”和“节省时间”几个答案。但是主要回答还是“AI能够更好地将创作的内容与受众有效地联系起来,从而使受众更加忠诚,能够为新闻业付出更多的精力或金钱”。还有一些回答包括处理错误信息和事实核查。总体而言人们普遍希望使用AI来节省成本以强化新闻编辑室的功能以及提供新的内容和服务。受访者还认为使用AI需要跟上技术和市场变化的步伐。总的来说,人们感觉到AI正在发挥重要作用。
02
新闻收集
AI相关的新闻收集是数据驱动生产的一部分。人工智能可以帮助收集资料,也可以帮助评估用户的兴趣所在:
“相对于我们的产品,我们将更多的精力放在支持我们编辑团队的决策上,而不用重新建立决策流程。我们关注的一个主要方面是信息的分析处理:我们每天都会摄取大量视频内容。我们希望AI帮助记者处理大量信息,以确定哪些信息与受众相关。”
AI可以帮助你筛选来自官方的内容,也可以筛选来自公共和社交媒体的内容,例如自动过滤UGC(用户生产内容)。人工智能程序可以按不同目的对信息或材料进行大规模分类。
为了使AI正常工作,材料就必须转换成数据,这意味着标记数据或“元数据”的过程至关重要。人工智能可以在某种程度上实现自动化。虽然这实施起来很困难,但是却为其他一切奠定了基础:
“我们为CMS(内容管理系统)内置了文章自动标记器(该标记器使用主题/关键字标记文章,以前这是由编辑完成的)。”
人工智能可以帮助新闻编辑室做内容决策:
“我们有一个内部工具,结合了数据分析和语言生成系统,可以编写全部或部分故事,并提醒记者注意数据中存在的机会。”
借助机器学习算法,发现新的新闻也成为可能,该算法可帮助新闻工作者发现可能被遗漏的趋势和事实:
“我们需要建立一个新闻档案库,去收集墨西哥尽可能多的出版物,这样我们就可以跟踪全国的每日报道。在墨西哥各地收集的大量本地和国家新闻报道的Google News就非常合适。这项工作要求我们确定正式记录的凶杀案数量与Google新闻上这些杀人事件的新闻报道数量的差别。这要求机器学习算法能够识别一个报道的故事,然后查明事件发生的地点。有了这些信息,我们就能将媒体报道的事件与墨西哥2400多个城市的凶杀案政府报道联系起来。”
03
新闻制作
AI可以是可以帮助新闻编辑室更精细地创建内容:
“我们的编辑和记者目前使用采用人工智能来协助检查英语文章的语法和拼写。”
”我们已开始将AI用于一般文章,我们尝试将AI WriterDeepl.com一起用于翻译。”
但是,即使是最基本的AI例行部署也始终是数据循环过程的一部分,该过程通过良好的反馈循环促进了新闻业的生产:
“我们使用信息提取工具来分离不同类型的信息,并在文章生成过程中将其呈现给记者。这样可以提高我们使用的标签的质量。我们还将其用于内部新闻跟踪。当我们从世界各地抽取数十万篇文章时,我们必须丰富每篇文章的元数据并将其分类。”
AI的另一个重要功能是进行信息核查,它可以增强内容可信性。诸如ChequeadoFull Fact之类的网站采用了机器学习工具来进行自动事实检查:
“我们使用机器学习来帮助我们将事实陈述与其他句子分开。这有助于事实检查人员确定每天要检查的内容。机器检查会自动根据信息数据库检查事实陈述。我们使用国家统计局的数据实时检查事实陈述。例如,如果有人说“自2016年以来,就业人数下降了10%”,我们的系统就会找到正确的数字并实时生成图表、给出答案。”
随着错误信息利用新技术继续大规模散布,事实核查将成为新闻编辑室的关键增长领域,例如对“深度造假”的检测。语音转文本、自动翻译、图像识别、视频制作和叙事文本生成都是其用途:
“我们的档案馆使用AI通过自动提取关键字、主题、诸如人物和地点之类的实体来自动标记内容。它们通过使用面部识别算法标记新闻视频中的面部表情来构建自己的训练数据集,目的是给没有经过训练的面部识别软件识别不出来的政客建立数据集。档案馆还使用语音转文本算法来创建字幕。由于方言识别是一个难题,档案馆通过训练方言数据算法来启动方言识别项目。”
通过AI组织材料可以自动生成内容,且通常用于社交媒体:
“我们使用的算法可以在Facebook和推文上撰写帖子。它可以处理文本、在预定时间发布推文、发送电子邮件等等。”
芬兰公共服务广播公司非常相信自己的机器人记者:
Voitto机器人新闻记者每周制作数百篇内容(文字内容和插图)。Voitto可以为新闻应用程序以及各种新闻通讯和多个Twitter帐户量身定制内容。”
AI可以增强事件相关的用户信息收集,例如在《Sky News》最近的皇家婚礼现场直播中,该报道用面部识别技术来识别在婚礼现场的名人。
Le Monde的一个项目着重介绍了AI如何在选举期间进一步影响本地新闻报道:
2015年,我们与Syllabs合作自动生成报道内容。法国的选举地图由大约36000个城市组成,我们无法报道每个城市,但机器人可以。我们从法国内政部获得了有关数据,Syllabs的机器对这些数据进行了分析和管理,并在36000个页面上展示出大约36000个报道,我们在这些报道中列出了数据库里的信息,例如人口、位置、先前的选举结果、财富、就业率等。”
另一位受访者指出,“自动生成和发布”不仅可以用于“足球比赛评论”,还包括“交通事故和天气预报”。自动化新闻还可以撰写新闻标题和摘要。
AI也可以辅助新闻工作者,针对特定受众量身定制海量数据集。新闻协会的“ RADAR”(记者,数据和机器人)新闻服务结合了人与机器,以“犯罪率、住院时间和学生缺课”为主题,大规模地进行了本地报道。
卫报的ReporterMate”就是一个将AI与人类相结合的“增强型新闻”案例:
“机器人系统能帮助记者根据特定的数据集建立简单的模型。ReporterMate20191月发表的第一篇关于政治捐赠的文章就是基于澳大利亚选举委员会的数据的。”
人工智能正在促进新闻业新形式的发展,尽管对于许多受访者而言依然“路漫漫其修远兮”:
“我们还在尝试新的新闻形式。通过自动化系统进行的实验使我们能够结合各种基于数据的叙事方法。基于AI的实验使我们能够创建身临其境的内容体验,用户可以在其中直接定制内容。”
AI的许多功能还与调查性新闻有关,这部分是人类无法独自完成的:
“我们使用AI分析了大量的房屋和城市发展的图片,以识别各种住宅区的问题(例如霉菌、烟雾探测器缺失等)的集中度。如果没有大量数据集的话这是不可能的。”
人工智能还可以增加一般新闻的深度:
“我们正在使用AI来解决报道中的某些特定问题。例如,我们使用深度学习模型(ResNet)在成千上万的图像上搜索非法采矿的地方。我们还使用深度学习(基于ULMFit的模型)进行自然语言处理(NLP),从而从数百万条新闻中搜索需要的内容。我们还可以机器学习来创建不同主题的地图。我们还在其他两个项目中使用了机器学习,并从社交网络中获取数据,例如对Twitter消息进行的情感分析。”
或许新闻编辑室可以更开放地与其他新闻编辑室共享AI成果:
“我们已经与四个主要新闻机构就目前正在进行的项目进行了合作,预计将在未来几周内发布。”
AI不仅可以进行新的调查,还可以使新闻编辑室实时追踪新闻并跟踪其发展过程:
“我们用机器学习使新闻工作者披露竞选信息时更加方便。我们将继续与斯坦福大学的计算机科学家合作,并在有竞选新闻出现时,使记者更容易通过电子邮件警报获得通知。”
越来越多的创新受到基金等外部资源的支持:
“在骑士基金会的一项试点拨款下,我们正在积极帮助我们的记者和其他新闻机构的记者。例如,我们使用机器学习技术编写了有关Lyft首次公开发行股票的新闻,其中包含了Lyft风险因素的分析。我们拿到了警用直升机的飞行数据,这些可以让本地新闻编辑室实时了解他们所不知道的重大事件。”
04
新闻发布
借助AI网络新闻,内容生成和消费之间并不总是存在明显的区别。如上所述,一个案例就是AI驱动的评论审核。它增加了内容,但也是吸引读者的一种重要方式。人工审核评论很费力,但是AI可以有效减少有害言论并进一步促进互动:
“三年前我们创建了一个工具,它允许管理员创建一个评论监视列表,任何风险性评论都会提醒我们的管理员。后来,开发人员在现有基础上使用了机器学习技术,建立模型将评论分为好和坏,并进行自动审核,准确性很高。”
用户对内容的处理方式(包括参与度、共享、评论、综合浏览量和页面停留时间)可以帮助制定内容策略。《伦敦时报》花了三个月的时间使用机器学习将10个用户指标与16个不同的内容元数据(例如标题和文章格式)相关联,以了解最适合读者的内容。
结果导致为一些平台生成的内容的数量和类型发生了变化,并且更加着重于提高参与度。例如,通过社交媒体宣传哪些内容?如何使社交媒体的内容分发策略更加有效?许多新闻编辑室正在采用更全面、更个性化的方法改善用户体验:
“我们所有的网站都包含某种形式的个性化推荐。我们最大的网站的首页大约有50%的推送是个性化的。该个性化系统使用实时数据,根据各种因素向用户推荐商品。它使用一些机器学习算法,例如协同过滤、文章评分。但是,系统也有一些简单的规则。例如,一篇文章用户看的次数越多,它的得分就越低(因此显示在页面的下方)。我们使用这项技术来推荐内容,以及进行个性化的广告分发(购买订阅),并决定何时向用户进行内容营销。在不久的将来,我们将开始个性化和自动化推送的新时代。”
每个新闻编辑室与用户之间的关系都有不同的模式,其中一些可能会因为AI流程可能受到限制:
“坦白说,我只看到了推荐应用程序,它们并不能激起我的兴趣的。它非常注重互动,但不像是在给用户提供服务。”
用户即使面对自己不想要的内容也可以对其进行个性化设置:
“我们的用户对个性化新闻产品的接受程度还很低。他们要么看不到个性化的价值,要么就不想个性化他们的新闻体验。但是在测试中,个性化内容的参与度超过了人工分发。”
一些新闻编辑室正在将个性化引入新的分发渠道,例如音频:
“我们的算法可针对音频内容,根据用户行动并结合数据(从听故事到整个过程:跳过,在社交上分享等等)为用户量身定制音频内容。我们一直致力于优化数字平台上的人均收听时间,用户在数字平台上的平均收听时间远远超出了传统广播电台。”
AI允许针对不同的细分受众群自动生成和定制内容。这对受众体验和内容制作都有影响,将会带来支持诸如付费专区和订阅之类的商业模型。诸如《伦敦时报》和《纽约时报》等较大的新闻机构已经采用了先进的AI驱动系统,但是较小的发行商也表示其在“智能动态付费门槛”上部署了多种AI,且转化率更高:
“内容主题自动管理索引/主题页面;预测好内容的相对潜力;允许新闻编辑室做出相关的促销政策;兴趣内容跟踪等。”
尽管我们的受访者认同AI新闻业,而算法可能也是有效的,但人工判断对于计划、执行和管理这些过程仍然至关重要。
未来已至,我们的受访者赞赏的一系列AI应用程序:
《华尔街日报》的动态付费专区:机器学习治下的订阅策略“显示了不同的访问者不同的订阅可能性,以及对网站的访问级别不同”。
《华盛顿邮报》的Heliograf:例如,在报道2016年夏季奥运会和选举日的国会竞选时,成功运用了自动写作等功能。
新闻协会的RADAR:由新闻协会和Urbs Media建立的自动化新闻服务,“以人工无法实现的频率和精度来撰写当地新闻报道”。
《伦敦时报》的JAMESJAMES是“Journey Automated Messaging for higher Engagement through Self-Learning”的首字母缩写,译为“通过自动学习实现自动参与的自动消息传递”,它“使用数据来了解读者的习惯、兴趣和偏好。”
彭博的Cyborg:一个自动化系统,使用AI提取来识别数千家公司的收益报告中的关键数据点,并在几秒钟内生成标题和文章。
DeepL:该公司建立了以深度学习为动力的工具来理解和自动翻译文本。
《纽约时报》的Project Feels:“了解并预测《纽约时报》文章的情感影响”,然后相应地投放个性化广告。
TextyLeprosy of the Land::通过“机器学习模型”可以进行调查性新闻报道,发现了乌克兰非法开采琥珀的线索。
YleVoitto:一款智能新闻助手,通过在锁屏上提供智能新闻推荐通知,“确保您不会错过要阅读的新闻”。
05
新闻编辑室为何使用AI
我们可以看到新闻编辑室正广泛运用AI,但原因是什么?我们的受访者给出了三个核心原因:
正如我们将在第二章中看到的那样,新闻业有多种使用AI的方法。但只有一小部分人有特定的AI计划,大多数人用的方法都是临时性的。少数新闻机构有特定的目标,比如有些专业新闻机构更专注于调查新闻;其他新闻机构则处于早期阶段,因此实施的项目非常有限,侧重于个性化等方面;大多数新闻机构的动机多种多样,很多人采取了全盘接收的方法:
“我们的目的是为了增加用户、记者和新闻编辑室,并创建反馈循环。我们旨在提供更直接、有意义和引人入胜的内容体验。我们旨在增强新闻记者的新闻报道和故事叙述能力。我们希望创新方法和工具,以更好地了解自己和我们周围的世界。”
AI的复杂性给人们在实践和心理上都造成了阻碍,还有一个阻碍是新闻编辑室的开发工作过多。我们的受访者通常是早期技术采用者,因此总体基调还是积极的。他们的核心目标是改进现有产品,这意味着要支持新闻记者:
“我们认为,在资源日益紧张的社会中,我们需要通过减少新闻工作者需要做的艰苦工作和改善新闻事业来为其提供支持,让他们专注于真正重要和最擅长的事情。”
大多数受访者将“简化工作流程,通过AI削减成本,提高生产率”描述为实现改善工作而不是削减成本的方法:
“通过查看大数据集来提高调查能力。”
“为了更快地查找新闻。”
“加强事实核查/消除虚假信息。”
但他们还看到了AI在经济环境中的地位,在这种情况下新闻机构不仅仅只是相互竞争。他们通过在线上的其他服务来争取订阅和收入。AI被视为潜在催化剂:
“媒体行业正处于危机之中,必须采取一切可能的措施增强竞争优势。”
“没有技术的新闻将无法在数字时代生存。”
他们认识到其他行业也在使用AI,因此新闻媒体也必须使用AI
“机器学习算法的进步为银行、零售商、金融公司、执法机构、社交媒体公司等提供了强大的支持。尽管我们可以(并且应该)讨论一下这些行业是如何使用AI的,但这些方法为他们的从业人员提供的好处毋庸置疑。现在,积极进取的新闻工作者也可以使用机器学习方法,从而利用这种能力来报道原本很难报道甚至不可能的新闻。这就是下一代数字新闻。”
正如我们将在第二章和第三章中看到的那样,这主要是关于现有产品和过程的新增或替代,但逐渐地,这将成为新闻工作者的结构性问题。
06
什么是有效的,什么是无效的
新闻编辑室中技术创新的结果总是不可预测的。技术创新是迭代的,并受现实世界新闻环境的限制。不同的技术有不同衡量成功的标准。但对新闻编辑室而言仍有一些常用的方法是有用的。对于许多受访者来说,现在下结论还为时过早:
“大多数应用程序仍处于新生阶段,其成功或失败仍不确定。对于基于语音和聊天环境的智能产品而言尤其如此。”
对于一些人来说,他们也曾有过失败,或者他们意识到AI不是解决某问题的正确方法:
“我们在AI使用上经历了多次失败。大多数成功的创新应用程序并非基于AI。”
失败这个词很难一概而论,但它们往往与和新闻编辑室需求无关的复杂性或紧急程度有关:
“当前可用于新闻行业的NLP (自然语言处理)系统并不适合新闻编辑室的需求。第三方NLP协议无法提供符合编辑标准的信号。新闻行业迫切需要开发一种通用的NLP方法,将其作为用于个性化和内容推荐的工具。”
有些案例本来就很棘手:例如让人们掏钱,或核实复杂的意见。一些最显而易见的成功往往是有着明确目标的特定任务:
对象提取/自动标记;
自动事实核查;
内容(预)审核;
语音转文字;
广告定位工具;
兴趣模型;
机器生成的内容。
但是无法立即解决问题并不意味着受访者放弃对数字技术的痴迷:
“我们认为重要的是继续进行测试并继续努力,为我们的个性化工作方式建立透明性,让用户可以实现个性化。”
“在AI方面,我们会采用MVP(最小可行性产品)思路。从本质上讲,这意味着启动早期版本,从用户那里获得反馈,然后推出新的功能,然后不断地对反馈进行迭代。虽然AI可能无法解决所有问题或挑战,但我们坚信创新AI驱动可以有效地促进我们的内容生成、广告和营销工作。”
尽管一些新闻编辑室尝试使用一系列工具或产品,但大多数新闻编辑室都致力于以下几个方面:
“尝试做太多事情通常会导致什么也做不成。”
正如我们将在第二章中看到的那样,部分问题在于如何定义“成功”。起作用的不一定是需要的。对于那些指责新闻媒体缺乏创新欲望的人,我们的受访者表示:
“这取决于您如何定义成功。我们从尝试过的每一件事中都学到了很多东西。”
2章:AI策略的制定
01
策略需求
一般而言,新闻编辑室没有时间或资源来随意尝试。实际上,如果要将新的想法大规模转化为可持续增值的资本,即使是由风险投资资助的初创企业也需要制定战略。当涉及可能对新闻编辑室发展产生结构性影响的创新时,组织的总体长期战略就显得尤为重要,需要对诸如KPI之类的标准进行衡量以确定影响。
目前新闻编辑室尚未大规模、有效地应用AI。新闻编辑室必须掌握相关知识和技能,任何AI策略都必须反映出使用AI的必要条件。它必须能诊断当前状况,了解新闻编辑室要达到的目标以及达到目标所要采取的一致行动。
调查显示,为了实现此目标,我们需要做到从制定总体计划到更详细的操作时间表和评估程序不等。为了适应过去二十年来的技术和市场发展,大多数新闻机构已经制定了业务和生产策略。对于习惯了商业模式和技术模式的新闻组织来说,这种发展“战略”的思想是一个新颖的事物,而这些商业模型和技术模式在过去的半个世纪中一直没有变化。上网、数字化和基于订阅、付费专区或会员资格建立新的业务模型都是结构性战略调整。所有这些都对工作流程和受众关系产生重大影响。总体策略包含针对特定细节的子策略,例如平台、电子商务或内容制作。新闻编辑室如何制定AI战略?
我们对这一问题采用定性分析方法,因为了解新闻机构的想法和行为至关重要。根据编辑技术策略师Francesco Marconi的说法,他们可能会这样想:
挑战:您要解决哪些挑战?
流程:您如何将这一挑战转化为工作的实际步骤?
数据:您是否拥有解决问题的正确数据?
研究:数据来自何处以及如何进行审查?
陷阱:算法可能会出现什么错误?如何加强监督?
02
新闻机构的AI策略
超过三分之一的受访者声称已有灵活的AI策略,三分之二的受访者则表示没有。这似乎与先前答案中涉及AI的新闻事业成功或失败的结果相一致。
数据/技术/数字/创新团队的职责通常是有明确的AI策略:
“数据部门是融合所有与AI相关计划的部门。他们收集公司其他领域的需求,并制定实施路线图。”
一方面,战略制定部门承担责任。另一个方面,产品团队承担责任。一位受访者说:“这是由数字新闻编辑室领导的,包括相关项目涉及的不同部门”。因此,AI策略不是通用策略,而是部门或团队级别。其他部门表示,人工智能的责任是完全分散的:
AI策略在新闻编辑室、技术、数据和产品团队之间共享。”
有时,AI工作被放在一个不受约束的独立部门中:
“我们已经将参与AI策划的团队作为一个单独的孵化器。AI之类的新事物与当前的IT并不匹配。只有独立出来,才能吸引人们的注意力。”
许多受访者称他们对角色和责任感到困惑。几位受访者认为,在使用AI的早期阶段,最好有一系列AI应用的不同方法,而不是一个正式的总体策略:
“由于与AI的应用非常多样化,因此多设置几种策略才是合理的。到目前为止,这项工作涉及的部门有很多:新闻编辑室(特别是编辑研发团队)、数据新闻部门、社交媒体部门、营销部门、产品开发团队。”
一些受访者也在尝试以多种方式来组织工作,从而体现这种多元化:
“我们与跨职能的Scrum团队合作,其中包括产品团队、数据科学家、数据工程师、软件工程师和Scrum管理员。根据项目的不同,这个组合也会有所不同。这些团队成员将向组织中的不同人员汇报工作,但是团队工作对我们而言很重要。”
解决问题的核心思路是“学会走路之前不要跑”。在制定AI策略之前,您需要了解您的新闻编辑室现在是如何工作的,这是新闻组织过去经常感到理所当然的事情:
“在使一部分工作流程自动化之前,您需要了解您的工作流程。在给你分配任务时,通常来说下一步是交出你完成的内容,而这之间发生的一切都会被遗漏。当涉及到AI时,这中间的过程必须明确。作为记者,你的工作并非全部与创造力有关。”
03
准备好使用AI了吗?
在经历一系列其他数字挑战之后,AI相关的技术仍然相对较新、多样且复杂。因此,受访者对AI的准备程度的差别很大,这并不奇怪。感觉自己赶上潮流的人和觉得做得还不够的人大概一半一半。尤其是因为我们的许多受访者都是早期使用AI的人,他们认为自己已经迈出了第一步:
“我们知道事态发展情况,我们有负责该技术的部门,我们有解决这些问题的项目。”
通过启动AI项目,许多受访者已经意识到他们的组织尚未准备好通用的战略。例如,针对人工智能仍存在文化/管理方面的挑战:
“作为大型的新闻编辑室,我们比大多数新闻编辑室更了解自动化/人工智能的潜力和挑战。但是,我们仍然需要在整个公司范围内传播这些知识,以使每个人都意识到并思考如何优化技术并考虑风险。”
人们经常提到这些管理挑战,这是在整个组织中实现战略变革的重要障碍:
“业务区域和新闻编辑室之间存在不平衡。文化变革是最大的挑战,并且围绕AI制定的策略不仅限于战术。”
在那些声称自己还没有准备好的人中,他们都感觉到加快速度是一项紧迫的任务:
“我们对第三方过于依赖,缺乏内部资源,无法假装已经准备就绪。我们必须弄清楚AI的用途,我们必须明确一家中等大小的公司的损益。我们希望能够在2-3年内制定出真正的AI路线图。”
对于较小的新闻编辑室,这是一个超前的问题:
“我们已经开始有这方面的想法,但我们的组织规模很小,我们缺乏资源来充分利用AI进行新闻报道。”
04
AI对新闻编辑室岗位的影响
任何有关AI战略讨论的关键问题之一就是AI将会带来什么。机器人会取代人类吗?电脑奇才会取代经验丰富的黑客吗?传统技能会被算法取代吗?我们的受访者强调,人工智能既可以创造劳动力,也可以减少劳动力。但是可以肯定的是,人们的行为将会因此改变。但是在新的环境中,传统的新闻技能可能会变得更加重要。许多人认为AI将影响组织的所有领域,尽管不会以相同的方式产生影响:
“新闻的生产、分发和消费都将受AI驱动的技术的影响。基于AI技术的全新内容体验仍然遥远。在新闻制作中,音频和视频节目的编辑工作很可能会成为最早受影响的领域。在新闻的分发和消费中,个性化内容的提供,尤其是单个内容或体验的个性化,也可能最早受到影响。”
这将意味着AI将增强新闻业而不是替代。正如一位受访者所说:
“我认为影响将是微妙的。我反对‘机器人新闻工作者’的想法,实际上‘机器人新闻工作者’并不实用。我认为大多数AI应用程序将很快存在于后台,支持工作流程和报道,但不能替代人。取而代之的是,我们将看到任务的自动化和扩充,例如翻译、转录、图像搜索、扩充写作、自动化摘要,或者新闻框架内的某种形式的个性化。我正努力不被AI带来的宏伟愿景和想法所迷惑。”
新闻的核心功能之一是编辑,即对新闻的把关。尽管这可能变得更加重要,但AI将改变:
“主页的编辑人员将需要一种不同的工作方式。一年前,他们以编辑论文的方式编辑首页:确定统一的消息,将各部分组合在一起,并使其看起来有某种联系。如今他们了解到不同的用户对页面的体验将有所不同,那就是另一种工作方式了。同时,编辑的工作也变得越来越令人兴奋。现在,他们可以在更细化的层面上进行布局。例如‘显示此文章,除非用户已经看过,否则就显示其他文章’,这在以前是不可能的。不过,如果我们展望10年后,‘首页’可能不再扮演主要角色。当然,这也将改变编辑的工作方式。”
随着AI开始产生影响,许多新闻编辑室开始引入AI。但绝大多数情况下,受访者表示,在新闻编辑室中很少创建新的AI特定岗位,部分原因在于资源问题。无论在哪里,关键角色都在于充当“大使”的技术:
“尽管数据新闻业是一个非常有前途的领域,但由于缺乏财务资源,我们没有雇用数据记者团队。在我们的软件部门中,我们越来越多地开始聘请数据科学家和数据工程师以及AI专家。除了大数据分析和与AI相关用途之外,他们的任务是进行内部讲座和培训,向员工详细说明AI的实际潜力。”
多数观点认为,创建全新的、与AI完全相关的全新岗位可能适得其反。随着技术的实施,焦点似乎集中在调整现有工作流程和岗位上,而不是创建全新的工作流程和岗位:
“尽管我们拥有不断壮大的数据团队来支持这些工具和AI技术扩展,但我们的新闻编辑室使用AI的意义不在于创建新岗位,而在于发展现有资源、训练和教育到更多精通AI技术的人。我们认为,数据和AI不应仅局限于少数几个角色,它们必须在整个组织中保持数据流通。”
“我认为我们不需要特定的AI岗位,但是需要有人专注于工作流自动化和扩充。人工智能在这里确实发挥了作用,但是其他不同的技术也是如此。”
不过,目前新闻工作者的工作流程正在发生变化:
“我们没有确切的AI岗位,但是已经有很多人受到影响。调查记者对自动执行的任务越来越满意。人们越来越期望高级管理人员了解AI基本概念,并注重新的发展机会。”
其中一些新的工作流程将意味着创建以AI为重点的新闻编辑室岗位:
“我们现在有许多特定于AI的岗位(当前由8人组成的数据科学团队工作,包括数据科学家、数据工程师和产品所有者)。”
但使用AI将逐渐成为新闻编辑室的潮流,它将通过逐步发展和适应带给新闻编辑室变化。将近一半的受访者表示他们已经使用AI,但是大约有1/3的人认为AI要真正发挥作用还要等上25年。
在大多数新闻编辑室中,对于如何发挥AI的作用尚不确定。临时或灵活的策略可能是一个现实的选择,但这意味着很难进行系统规划。正如我们将在第四章中看到的那样,人们对关于人工智能在其他行业中的真正潜力仍争论不休。极端的情况是有人对AI的影响持怀疑态度:
“我不认为AI会产生重大影响。”
另一方面,少数人表示:
“这不是技术转变,而是文化范式的转变。”
这反映了AI技术会扩大处于不同规模、资源下新闻机构之间的不平等。变革即将到来,但分布不均。
05
人工智能采用的战略挑战
受访者认为使用AI最大的挑战是资源、知识或技能,但与其同样重要的是文化抗拒:害怕失业、改变工作习惯以及对新技术的普遍敌视。整个新闻机构缺乏对AI知识,以及缺乏战略管理认知。但是,最重要、最具体的因素可能是缺少了解该技术及其与新闻编辑室之间关系的专家。其他问题也很重要,例如所提供技术的质量或相关性,以及道德伦理担忧(例如过滤气泡),责任和法律问题(我们将在第三章中详细介绍)。
我们面临的AI主要挑战体现在:
缺乏财务资源和/或不愿意投资。
缺乏AI相关技能,以及难以吸引和雇用人才。
怀疑新技术以及恐惧失业。
结构性问题,包括部门之间的技术差距。
对人工智能的潜力缺乏认知和了解。
缺乏战略,尤其是管理层。
缺乏时间,难以确定AI项目的优先级。
(其他挑战包括:数据质量、道德问题、复杂性、缺乏技术基础设施、语言障碍、现有AI技术的准确性较低)
令人鼓舞的是,人们并不认为这些挑战是无法被解决的。人与复杂的新技术之间存在知识鸿沟并不奇怪,但它并不仅仅意味着信息短缺。受访者认为这是一种进步障碍:
“人们对‘AI’一词没有共同认识,而这在实施机器学习算法时会有所帮助。缺乏共同认识不仅会导致错误的预期,还将使人们难以寻找AI的合适用法。
与此相关的是更普遍的文化抵抗,其特征是对“技术炒作”的恐惧:
“我认为人工智能的最大问题之一是围绕这个术语传达的想象力和愿景。大多数人都是从科幻和投机活动中了解人工智能。我们希望公司的其他部门不会用到AI技术,这将有助于避免任何不必要的讨论,因为人们担心AI会使他们失去自己的工作。”
记者们意识到,引入新技术有时会带来更多的工作:
“关键问题在于文化挑战,因为AI确实会减少工作流程,从而给新闻编辑室中的人们带来更多时间。但这也意味着要提高生产率,这是很多人可能并不希望看到的。这些文化障碍需要在内部协作过程中加以解决:计算机科学家和记者之间存在文化鸿沟。对于计算机科学家来说,使用算法个性化等技术是直接明智的选择,但记者更关注技术带来的编辑责任、过滤气泡等问题。在出现解决方案之前,我们需要让所有人参与其中,彼此讨论交流。我们(AI团队)目前每月都会与编辑举行会议,以使每个人都参与其中,提出我们的想法并要求反馈。”
人工智能不是随随便便就能提高效率和创新的神奇事物,它需要耗费大量资源。这可能会导致人们不愿使用AI
AI的构建和管理成本很高。确保数据干净和有效的机器学习需要做大量的工作。这是大公司才有可能承担得起的工作,他们可以开发人工智能服务并将其出售给较小的公司。”
过去,作为一个行业,新闻媒体一直倾向于在不向记者提供更多技能或经验的情况下将其提升为管理人员。近年来,随着各种技术和市场的混乱,这种情况正在改变,但受访者仍然强烈地认为,管理层没有能力甚至不了解AI带来的问题:
“经理不了解技术,并且由于没有技术技能而缺乏想象力。”
AI非常复杂,因此存在管理问题也就不足为奇了:
“我们遇到了很多挑战:怎么知道我们应该自动化什么?最先进行哪个AI项目?与所有报道一样,你必须权衡受众的需求、报道的影响、新闻编辑室的收益等等。缺乏对人工智能的了解会造成非常实际的文化问题:在竞争激烈的市场中,你要为效益负责,因此很难聘请有才华的数据工程师和科学家。”
人工智能技术有自己的术语和逻辑,且通常是为其他行业创建的。对于某些新闻编辑室来说,投资AI知识和技能是不值得的。虽然有时候他们也会面临语言方面的问题,但数据质量才最重要:
“对我们想要做的许多AI应用程序而言,它们都需要高质量、标签明确的数据,但是我们目前还没有这样的数据,标记这些数据需要大量的资本投资。”
受访者的反馈表明,需要提高新闻编辑室和整个行业的AI素养水平并解决文化问题。新闻机构需要建立一个技能库来创建相关有效产品和系统,以及衡量成功或失败的指标:
“整个媒体行业的转型实际上才刚刚开始:没有人知道如何建立并重新定义组织文化,使其转变其核心业务和产品,从而在新兴的、人工智能驱动的世界中蓬勃发展。整个组织面临的最大挑战是了解当前业务及其活动的优化,以及创新和建立未来业务所需要的是什么。优化和创新需要不同类型的指标和KPI来评估哪些有效、哪些无效。简而言之:如何以最有效的方式协调资源并用于以后的发展。”
对于已经习惯应对变化的行业而言,其中一些障碍并不陌生。尽管技术培训是艰巨的任务,但假如新闻媒体不想落后于其他行业,就必须要采取行动,哪怕去寻求外部支持。
06
人工智能战略的途径
从我们的调查中可以明显看出,新闻编辑室普遍缺乏AI战略规划。该策略将始终根据新闻机构的性质及其到达的阶段而有所不同,但这些才是研究中需要考虑的关键因素:
如何为您的新闻组织准备AI战略:
评估您所处的AI使用阶段
了解您正在考虑的AI技术并为其分类
决定AI如何与您的品牌和总体策略相关联,包括可能解决的问题或可以满足的需求
评估您所在的新闻编辑室的哪些部门可以使用AI以及为什么
确定主要障碍:资源、技能、文化、管理等,并计划如何系统地解决这些问题
分配角色和职责,并在整个组织内建立一个沟通框架,以囊括所有利益相关者
建立审查绩效和优先级的系统
与合作伙伴、客户及其他拥有AI资源的外部关系合作以整合AI创新。
AI可能部署在非常狭窄的领域,例如某些功能的自动化。但是,即使将其部署在特定领域,进行整体规划也将使AI最有效地发挥作用。受访者认为孤立的工作总是会受到固有限制,使用一种战略方法必须考虑整个新闻编辑室。AI需要新闻编辑室有技能、知识基础、明确的角色定位、系统的评估以及将技术与编辑或营销联系起来的文化。
人工智能将改变新闻编辑室的工作方式及其与观众和收入的关系。正如我们将在第三章中看到的那样,这同样会带来道德问题以及财务影响。在第四章中,我们将了解新闻组织如何制定这些未来战略。
3章:道德和编辑政策
01
人工智能造成了什么影响?
人工智能改变了新闻的创造和消费方式,但它如何改变新闻本身?什么样的内容会被生产出来,又如何改变新闻与个人消费者和社会的关系?任何新技术出现,人们都会担心它对业内人士和普通民众的影响。人们的期待和恐惧往往基于错误的前提和猜想。纵观媒体的历史,我们知道印刷术、广播或电视等“新媒体”也引发了乌托邦式的期待以及反乌托邦式的道德恐慌。技术不应被孤立地看待,但它的影响确实超出了实际问题。人工智能引起了人们的广泛关注,不仅因为其力量和潜力影响新闻的方方面面,更是因为它是一种复杂而隐蔽的技术。
受访者一般都精通技术,所以相对于新闻机构或其他利益相关者,他们可能不太担心人工智能的负面影响。对人工智能的熟悉也意味着他们确实对新闻业受到的影响有深入的了解。他们谈到了六个关键领域,这些领域都是相互关联的:
经济问题:存钱还是投资?
算法偏见
虚假消息和“过滤气泡”
增强编辑决策和透明度
平衡人工智能和人类智能
科技公司的作用
本章介绍了新闻编辑室使用的人工智能道德和编辑政策。这是我们采访新闻编辑室得到的内容,而不是有关技术或解决方案的详细指南。我们对“道德”的定义较为广泛:与可信度、准确性、问责制和偏见等问题相关的思辩。“编辑政策”是围绕新闻“质量”产生的广泛问题。
人工智能如何改变内容的标准或性质,以及对受众的社会价值?新闻业本身具有悠久的道德历史,在前所未有的政治和经济压力下,公众对新闻的信任并不是很高。与此同时,关于人工智能的公开辩论有:算法是否歧视某些人群?这项技术是否会导致大规模失业?社会如何对这项技术负责?
来自新闻编辑室的受访者和我们讲述了人工智能如何影响他们与内容和受众之间的关系。我们同样就技术及其影响询问了他们对技术的责任或控制技术的态度,特别是那些提供特定工具和基础设施的科技公司。尽管它们确实触及了新闻学的思想和宗旨,但这些不仅仅只是哲学问题。它们也是实际的、直接的问题。例如,现在的世界虚假消息日益增加,可信度是保证用户信心和注意力的关键,这些用户很有可能会继续支持新闻编辑室的发展。
约五分之一的受访者表示,至少在现阶段,他们并不是非常担忧技术的发展:
“说到人工智能的影响,比起担忧,我其实觉得更兴奋一些。目前有一些对人工智能的负面情绪,我反而认为这些技术将增强新闻编辑室的能力,并节省宝贵的资源,以便解决亟需新闻工作者关注的重大问题。”
在新闻工作的某些领域中,可能在质量和数量之间存着在合理的取舍。新闻工作往往需要做出很多妥协:   
“特别是在机器创造新闻的早期,我们正在以质量换取数量,从整体上来说,它仍然提供了更多有价值的用户体验。我个人认为这是正确的事情。但显然,仔细选择这样操作的新闻工作类型十分重要。”
大多数人相信,如果新闻机构坚持其道德和编辑立场,这种影响总体上看是有益的。这可能表明,受访者为具有良好历史声誉、注重可信性和公共服务的新闻机构工作。一些人认为,即使他们现在没有发现问题,但如果机构内部没有适当设立和监控人工智能,问题可能就会出现:
“我现在并不担心。我认为关注数据偏见十分重要,同时也对新闻工作者和新闻机构经常考虑(或至少尝试考虑)工作中的偏见问题感到振奋。”
02
经济问题:存钱还是投资?
最显而易见的问题是,使用人工智能节约下来的资金是否被重新用于编辑,或用于减轻新闻机构的财务负担:
“最大的问题是,省下来的钱(如果有的话)是否会被用来进行新的投资,或是用来应对营业额减少的问题?”
少数人担心,如果人工智能用于提高效率,人类投入的价值可能会降低:
“‘低价值’新闻可能会更快被制造出来。声誉良好的新闻机构对故事进行的分析和验证可能将成为稀缺资源。”
大多数受访者相信,节约下来的金钱将用于投资技术或提升新闻质量。然而,人们更担心AI会加剧新闻机构之间的不平等,从而影响媒体的多样性和“优质”新闻生产的可持续性:
“关于新闻工作质量的最大问题是,与能够构造/购买和部署人工智能的新闻编辑室相比,缺乏相关资源的工作者可能会受到影响。换句话说,未来很可能会有一场军备竞赛,而只有资源最充足的新闻编辑室才能参与。”
新闻机构认识到,他们面临道德选择。如果采取有利于短期目标的财务决策,他们可能会损害公众价值和新闻标准。显然,这取决于其企业文化,以及对“优质”的定义:
“即便是被公众信赖的媒体品牌,也可能从错误的数据库中自动生成文章,可能导致虚假信息传播。一般来说,我们必须谨记,优质媒体不能只关注经济上的成功。如果训练机器学习算法的目标在于最大限度地提高收入,那么很有可能导致诱导性文章比调查新闻更加优先。因此,应该仔细考虑对哪些指标进行优化,以及如何维护质量标准。”
许多受访者相信,行业正在做出正面选择:
“我对知名的媒体机构很有信心,我自己也在这样的机构工作。任何新的技术,无论再怎么自动化和电子化,总是会被滥用,我相信现在和将来都会有人利用这一点。尽管如此,真理是一种永远不会失去价值的商品,我相信大多数新闻工作者都会意识到这一点,并将使用人工智能来尽其所能地叙述真理。”
03
算法偏见
每种算法都可能含有某种“偏见”,就像所有的新闻都包含某种程度的“偏见”,这反映了的是生产背景。一般来说,算法偏见属于“生产型偏见”,即由于输入数据、数据训练和操作而导致的偏见。这些可能是非常技术性的因素,例如数据分类类别,但它们在确定内容的质量以及如何消费方面仍然具有重要意义。
然后还有我们常说的“不公平”偏见,如种族或性别偏见。这种偏见不仅不被社会接受,而且还有道德、政治甚至法律方面的风险。所有系统都会含有偏见,因为它们反映了其创造者和使用者的意愿和立场。重要的是,如何意识到偏见的存在,以及如何优化管理、减少偏见。这意味着,处理道德和编辑问题要依靠系统战略。尽管受访者整体心态乐观,但的确有一半人担忧行业内的人工智能应用:
“我担心新闻工作者过度自信,过度依赖算法,最终可能对受众造成伤害。目前在新闻业中存在许多使用人工智能并产生偏见的案例。训练有素的算法可能会对新闻业造成更大的伤害。”
监控和纠正算法偏见需要高度的知识水平。不仅需要技术知识,还有在新闻编辑室的限制范围内应用该技术的时间和资源。新闻工作者还有向消费者进行解释的责任:
“新闻业需要在使用算法和数据上保持透明。如果要使用算法,我们应该尝试阐明并帮助用户理解算法,并尽可能控制算法对用户的影响。”
04
虚假消息和“过滤气泡”
还有一个问题关乎新闻可信度,即新闻在打击虚假消息和促进良性公开讨论方面的作用。在针对虚假消息的斗争中,新闻工作者需要控制和信任自己使用的工具:
“在发生政治攻击和虚假新闻时,使用AI导致的错误可能会使媒体信誉受到威胁。”
还有人指出了人工智能技术和信息面临的更广泛的道德挑战。例如其在扩大(和打击)虚假消息不断增长的作用:
“机器学习是生成“深度假货”和虚假内容的完美工具,这将是所有新闻机构和可靠媒体面临的主要问题。此外,内容验证将变得更加困难和(或)依赖于工具。我们需要机器学习工具来检测机器学习假新闻。”
许多受访者强调,算法个性化可能进一步巩固所谓的“确认偏误”,即认知心理学家提出的概念:人们倾向于提供反映自己的信念和价值观的内容,而不是对自己的认知做出挑战。
这是一个复杂且往往主观的问题。最近的学术研究表明,在线消费新闻的用户更容易接收多样化的内容,尤其是相对于拥有传统媒体消费习惯的用户。但无论绝对趋势或总体趋势是什么情况,受访者担心商业需求会突出所谓的“过滤气泡”、两极分化和冲突问题:
现今社交媒体中的过滤气泡非常危险,但我们希望这个问题能随着时间的推移而得到解决,一方面通过更改算法、改进规则和标准以提升透明度,一方面希望我们的受众对此影响有进一步了解。
许多受访者已着手解决这些问题,他们通过自定义人工智能以适应道德或编辑政策:
“对于某些关键质量指标,我们的系统赋予其较高来源排名,如原创性(此来源是否专注于该主题?)、多样性(此来源是否提供独特观点或反映未被充分代表群体的声音?)、真实性(此来源历史上是否含有虚假消息记录?)。人工智能去偏见化,可能还有其他标准,包括情感和可读性。”
受访者表示,这是说明“增强”新闻的一个好例子:人类的编辑洞察力与人工智能相结合:
“为了防止用户陷入某种意识形态,我们纳入了“编辑评分”。这是由人工判断某话题的重要性,以提升新闻编辑室提供的内容服务。”
但是使用人工智能并不是简单的事情,某些情况下甚至不应该使用:
“根据我们使用人工智能的经验,算法判断男女来源比例的结果非常不可靠;很难自动进行性别评估,特别是判断外国姓名。所以如果现在我们要做这样的事情,不使用人工智能会更好。”
“我们正在努力去除训练数据中的偏差,但如果不能的话,应该把它们标注出来并告诉用户。如果我们无法识别数据集中的偏差(或偏差难以描述),那么该数据集(以及人工智能算法)不应该用于编辑中。”
05
人工智能是否能够提高编辑决策和透明度?
所有的新闻编辑室都有“偏见”。有些偏向性的作用是积极的,例如特别关注某种问题。然而,最近有这样一个热议,关于传统的媒体文化是否会导致编辑议题缺乏多样性,以及新闻编辑室是否与某些人群或公众关心的领域脱节。人工智能能否帮助我们发现本来会被遗漏的问题、故事或事实?人工智能是否可以帮助我们创造不受专业假设或规范限制的新闻报道?
大多数受访者表示,他们还没有见过这样的纠正效果。他们的重点仍然在集中在算法或受众的偏见上,而不是新闻的“过滤气泡”。但只有极少的人表示,对人工智能偏见的质疑导致他们重新考虑自己的假设,并重新考虑读者的需求:
“我认为,人工智能对揭露行业内已经存在的偏见和意外后果方面发挥着重要作用。我们有机会进行反思,思考我们如何制定决策,还有以更公平的方式“重新设计”决策。”
用户数据是人工智能挑战新闻编辑室猜想的一种方式:
“我们使用的工具(新闻标题测试、倾向模型和算法推荐)表明,我们认为读者可能感兴趣的内容与他们真正感兴趣的内容并不总是相符。我们对“严肃新闻”的认识存在很大的偏见,这不一定是用户想要的。”
尽管这有违直觉,但受众反馈可以帮助新闻编辑室优化内容:
“新闻编辑室往往会认为新内容更具相关性,所以常常没有旧背景信息的内容。我们的个性化算法更擅长处理此事。”
“我认为这是一个良性循环,彼此促进。人工智能使我们意识到我们的偏见,反之亦然。在新闻编辑室,编辑倾向于根据直觉和经验做出决定,而不是根据数据。人工智能让我们意识到,必须改变这种不良习惯。”
我们将在下一章节进一步探讨,人工智能可能使新闻工作者重新考虑行业的基本概念:什么是信息?新闻工作者如何决定何为真实或重要?公众为什么使用新闻?人工智能有能力从更广泛的消息源中收集、整理和解释数据,但它能在多大程度上改革传统范式和陈规旧习呢?
“人工智能使你质疑一切。人工智能模型的质量取决于建构和训练的人类。通常反映了新闻工作者对某些话题的了解和理解。我们小心翼翼地把人工收集新闻的标准应用于我们开发的人工智能工具上。还需要不断地重新训练人工智能并测试偏差,这也是我们流程的一部分。”
更加了解流程这一趋势使得受访者提出将提高透明度作为解决方法,既避免算法偏见的损害,还可以建立公众的信心:
“这始终取决于新闻机构如何决定解决问题:公开透明是关键。用户永远对内容的生成和发布有知情权。”
新闻编辑室之所以能够更好地展示自己的工作,部分原因是新闻媒体面临直观的信任危机,以及大众对权威、可信、经过验证的新闻与网络虚假消息加以区分的愿望。对此人工智能可以提供帮助,因为它能显示哪些人消费了哪些内容:
“知晓哪些用户看到哪些内容,并在一定程度上能够核查技术代替新闻工作者所做的选择。”
但是这很困难,因为它们是新闻的一部分,“大多数人工智能程序将隐形”:
“有必要开始考虑我们工作分配的透明度,以此获得公众的信任。无论是个体用户还是机构客户,算法都不应反映其过去或现时的偏见。我们必须深入思考内在偏见及其影响。”
解决这个问题,意味着更多地关注新闻编辑室的标准意味着什么,以及如何展示高质量:
“如果我们妥善设计和使用人工智能系统,我觉得完全不必担心质量或原创性问题。不过要想达到这一效果,我们必须阐明新闻质量。哪些新闻需要两个一手来源,而哪些一个就足够了?在道德层面,我认为沟通和透明度问题至关重要。为了不让读者失去对我们的信任,我们必须有效地说明哪些内容由算法创建,以及遵循了哪些原则。”
关键领域是围绕人工智能使用数据的隐私,以及使用的新型平台:
“在人工智能助手的竞技场上,社交平台目前的隐私、选择、回声室等问题可能会被放大,这是非常现实的问题。”
新闻编辑室正在考虑如何正规监督。偏见总是出现,但是问责制呢?:
“从理论上讲,智慧的批评和开放的心态应该能够驱使新闻编辑室不断质疑他们的假设、数据和偏见——但在实践中很难做到,并且把这些编入代码就更难了。可能需要某种内部或外部的监督机构来定期检查新闻编辑室的偏见。”
公开透明是一种美好的愿望,但是,除非它是工作体制的一部分,并且标准公开,否则是纸上谈兵。例如,美联社正在思考在风格指南中增加内容,以反映这些问题。但是有很多解决方法,例如保证内容本身的来源合乎准则。
已有代码试图解决数字技术和新闻界提出的特定问题,如ONA社交媒体代码。现在人工智能需要新的代码或指导方针。保罗·布拉德肖(Paul Bradshaw)主张,建立有效透明度的一个关键因素是,新闻工作者要清楚人工智能的局限性和不确定性的程度。透明度做法可以借鉴金融和医学等其他学科。而且已有一些实际的方法可以使新闻编辑室更加透明化,例如在文章署名中标明人工智能编辑。这不是新闻工作者自己可以解决的问题,因为他们的许多工作依赖于高科技公司提供的基础设施而进行:
“新闻媒体实际上没有对编辑指南和编辑工作的最终发言权。现有的技术平台及其算法已成为无所不能的编辑过滤器,新闻机构并不能真正直接对其产生影响。”
我们也将在之后的章节中提到,这属于新闻业处理与科技公司关系中更广泛的顾虑的一部分。
06
平衡人工智能和人类智能
另一个关键的道德和编辑隐患是:新闻失去“人”的元素。
“自动化技术会使新闻报道中的“人类智能”减少,这可能会产生不可预见的后果。”
这一隐患包括不同问题。我们已经解决了针对技术的文化敌意问题,打消了大家对失去工作的恐惧。但是,新闻业依然有许多隐患,并且和算法的关系越来越大。一是新闻工作贬值导致新闻业地位下降:
“如果内容是由人机合作甚至由人工智能重新整合,那么新闻对“故事大师”的吸引力是否会减弱?如果是的话,那么何时会产生影响?基础工作自动化是否会导致新闻基本概念衰落?”
在考虑与人工智能相关的道德和编辑政策时,新闻工作者更需要监控机器:
“在获得受众同意的前提下,我们可以尝试根据相似行为来个性化每个人的新闻源,提高我们的内容元数据的完整性,自动识别故事中的人脸、名字和有用的数据等。但是,我们认为有必要为每天做出的每个有意义的决定保持坚实的人文基础。”
这是一种平衡术,但受访者明确表示,从一开始就必须将新闻的“人文价值”嵌入技术应用中:
“新闻价值观和原则需要支配人工智能解决方案的发展,以确保影响是完全积极的。”
受访者认为“人类价值观”适用于受众和新闻业的社会角色:
“如果媒体过多地受到错误的技术指标驱动,可以鼓励新闻工作者尝试与机器人或人工智能推荐系统竞争。相反,耐心、毅力和好奇心是人类宝贵的品质,在新闻编辑室内应当得到鼓励。”
在海量信息通过网络传播的世界中,在新闻中使用人工智能引发了整个社会的道德问题,而不仅仅是新闻行业的道德问题:
“我过去看到的最大错误是,把技术融入社会看为简单的信息技术问题。实际上,这是一个复杂的社会问题。”
07
科技公司的作用
[利益相关声明:这项研究得到了Google新闻计划的支持。
科技公司有着不同的商业模式和公司文化,因此他们与新闻以及人工智能的关系也有着很大不同。谷歌、亚马逊、苹果、Facebook和微软等科技巨头都进行研发、产品创新以及提供新闻机构使用的基础设施。一些公司还资助新闻制作,为新闻编辑室或新闻教育和创新提供支持。
出版商认为,这些公司与新闻机构抢夺广告收入、消费者的注意和时间。他们提供了发布新闻的设备和网络,以及许多对新闻生产至关重要的工具。他们对数据的胃口很大,在人工智能技术上的支出也很大。所以,新闻机构和受访者所描述的高科技公司之间,不可避免地存在矛盾。
关系在不断发生变化。例如,在我们调查完成后不久,Facebook发布了“新闻选项卡”功能,该功能结合了人工编辑和个性化算法,对来自出版商的内容进行独立新闻提要策划,其中一些需要付费。谷歌最近也宣布将要改变算法,在搜索结果中展示更多的“原创”新闻内容。
受访者普遍了解技术,并对其作用持积极态度。但有少数人公开表达了对科技公司的抵触:
Facebook和谷歌是人工智能公司,他们窃取消费者的注意力和广告收入,影响到了新闻行业。”
受访者意识到,他们无法完全控制技术。新闻机构已经与科技公司合作,创建新的工具或系统:
“大多数现成的解决方案都是大型科技公司的云API。这会对我们上传的数据造成影响,并使许多解决结果质量下降。这也导致新闻业对科技公司的轻度依赖。如果已经采取了某种解决方案,那么就很难从这一种切换到另一种。好消息是,数据模型和框架的品质都很出色。”
例如,《纽约时报》和《国家报》利用开源工具Perspective来改进其评论审核,该工具由谷歌母公司Alphabet旗下的技术孵化器Jigsaw开发。受访者意识到,科技公司可能是下一个人工智能和新闻结合产品的始作俑者:
“在未来, 任何“对话式新闻AI”都将由大型科技公司(如谷歌)生成,而不是新闻机构。”
如果这些工具或系统需要符合新闻工作者的优先项和公众利益,那么科技公司和新闻机构之间的关系就变得至关重要。受访者提出了一系列改善关系的方法。这是很不平等的一点,因为科技公司拥有资金和技术知识,他们的价值观或优先级事项很也可能与新闻工作者不同:
“推动新闻工作者和新闻业发展的因素——信任、影响力、增进理解、促进公民参与和对话——都很难作为这个行业可衡量的KPI指标。我们与技术合作伙伴对成功的定义不同,如何有效地合作?”
有人呼吁科技公司与新闻机构就道德和工程问题进行对话:
“对于已成功利用人工智能,或者正在努力开发人工智能的科技公司,我希望他们能够去宣传用途并担任大使。人类社会过渡到由人工智能驱动的未来,科技公司至关重要。他们不仅要在正确制造人工智能上承担重大责任,还应该为创造健康的生态系统负责。”
要实现这一点,双方都需要关注这些问题:
“对于新闻工作者来说,现阶段极其重要的工作是遵循大型科技公司的步骤,并尝试分析其算法。同样重要的是,科技公司了解这种新闻的重要性,并且愿意公开讨论。”
训练至关重要,而科技公司有能力支持训练:
“平台在训练、教育和创造关于人工智能的透明度文化等方面发挥着至关重要的作用。对于新闻工作者来说,这关乎信任问题,非常重要。”
许多受访者表示因科技行业炒作而感受到压力。尽管不太情愿,但他们也认为科技公司在解决媒体技术道德问题和支持研究方面处于领先地位:
“部分大型科技公司在公平公正和人工智能(如微软公司,在此投入了大量资金)方面占据领先地位,大多数大型科技公司在(学术)出版和分享方面做了很多实事,这推动了我们进步。”
受访者表示,科技公司中人工智能相关业务必须公开透明:
“通过云服务,科技公司使人工智能技术更加普及易用。但对于如何建立这一系列人工智能机器,他们并没有给出详尽的解释。他们应该公开数据集中的算法和偏见。”
平台算法对新闻机构制定营销策略有很大的影响。随着近年来搜索和推荐算法发生变化,对科技公司最常见的要求是“公开数据集中的算法和偏见。”这不仅仅是一个商业问题。最近的学术研究认为,人工智能技术的作用正在改变“透明”的含义。在人工智能时代,值得信赖的沟通者意味着什么?对于公众来说,“机器”可以成为新闻来源。这听起来可行,但有些人认为这意味着,如果将某种责任转移到“机器”上,这项技术就会挑战新闻权威的核心。这就是为什么一些受访者希望采用共享、开源的方式来评估技术的内部运作:
“科技公司已经提出用API以低成本展开人工智能实验,媒体公司的创新者对此都非常感兴趣。我希望能有更多的开源和离线项目可以让我们进行操作并做出贡献。”
受访者表示,他们非常欢迎科技公司更好地理解新闻及其当前的问题:
“他们有资源来改变现状:DeepMind和谷歌就是一个例子。但他们也会在数据和道德方面犯下严重的错误。我希望他们真诚地接受新闻领域中的问题,并为我们提供有意义的专业知识和支持,以探索大家提出的问题。我相信所有的主要平台也会从中受益:他们在新闻推荐和出版时可遇到了不小麻烦。”
这是一个通病。新闻业在有关运作方式的公开辩论中表现不佳。公开透明可能损害其独立性。科技公司在采用透明度方面也进展缓慢。他们认为这是商业机密,泄露代码或算法可能是不良的商业行为。但受访者的总体态度是,需要进行更为坦诚的对话。围绕道德和编辑政策(以及商业问题)需要进行的讨论还有很多:
“科技公司有能力也应该在创建工具时减少偏见,尤其是因为他们聘用了领先的人工智能研究人员,并在该领域建设了许多基础工具并发表了众多论文。我们希望“谷歌新闻倡议”和“Facebook新闻项目”一类的项目能够迎来更多的对话和资金的持续增长。最终,这些对话应该推动制定更好的策略和协议。”
08
新闻工作者应如何讨论人工智能道德?
讨论道德、编辑政策以及人工智能的关系不仅仅是为了处理后果,产品开发过程中就应该加入这个环节。新闻工作者需具备一定的技术能力,不要把讨论推给开发者或技术专家。这个讨论必须始终将用户的观点考虑在内。
道德/编辑讨论也需要考虑更广泛的社会影响——包括人工智能的好处。此事即将发生。举例来说,骑士基金会的“人工智能和新闻公开挑战”已采取了一系列举措,目的是识别和解决上述问题。本报告的受访者表示,新闻编辑室欢迎这种讨论。
4章:人工智能和新闻的未来
01
一切将走向何方?
我们让受访者思考未来。如果你有资源,你接下来会做什么?人工智能的什么功能对你的机构最有帮助?我们也想知道怎样才能达成这种效果。最后,我们要求他们思考,如何改变整个行业,以及如何改变新闻本质。在我们的调查中,各家新闻机构还处于采用AI的不同阶段,所以对于某些人来说,未来已触手可及,而对于其他人来说,AI仍然是科幻小说中的概念。
对未来的畅想分为三个层级:
第一层:利用已有的产品和编辑团队对现在的工作进行改进和迭代
第二层:在未来2-5年里利用新的工具进行中期创新
第三层:长期创新和试验,可能包括全新的方法或结构。
受访者通常既参与技术又参与编辑工作,因此可能与其他部门对将来发生的事情有不同的看法。
人工智能的发展向来不是一帆风顺的上扬。在人工智能世界中,依然存在着关于最好的前进路线的基本讨论。目前许多长期的人工智能研究项目都基于深度学习,但一些计算机科学家认为这或将是一个“进化死胡同”。这种讨论不在本报告的范围,但提出了更紧迫的问题。
令人感到惊讶的是,我们询问受访者什么可以在未来应对人工智能的挑战,他们提到的两个关键点与技术并没有直接关系。46%的受访者提到新闻编辑室的培训、教育和扫盲,43%的受访者提到需要招募具有新技能的员工。
我们的调查显示,在将来,另一个重要的非技术主题是,新闻编辑室和其他机构(如大学)之间的合作可能性,以及向其他行业学习及其人工智能使用方法的需求。来自新闻编辑室的受访者坚持认为,新闻可以在人工智能世界中蓬勃发展,但人们确实担心随着技术的进步而落伍。
02
未来的应用和战略
受访者投出的未来三大人工智能工具愿望清单:
更多自动标记/实体提取(新闻收集)
更好的机器生成内容(新闻制作)
更好的个性化/推荐引擎(新闻发布)
大家对人工智能有着浓厚的兴趣,这会微妙地改变新闻编辑室与内容或新闻编辑室与受众之间的关系:
“我认为,就广播公司而言,人工智能带来的最根本的变化不是在新闻编辑室流程中,而是在内容和受众之间的互动中。理解用户的语音请求并根据我们的存档内容明确回答问题,而不是依赖于我们与用户之间的第三方(Google、亚马逊等)及其框架,这将是激动人心的变化。但显然现在还做不到。”
通常需要对其他新闻编辑技术进行结构性调整,这种辅助关系才能正确集成人工智能,从而将最初级的创新转变为中期乃至长期发展成果:
“我们将重建IT系统,并更迭新闻编辑室管理层的关键职位。”
大概不止一家新闻编辑室拥有这种宏大的野心:
“我会建立一个能够获取千兆字节文本的系统,并以对话的形式回答有关当前业务的问题。没有一家新闻机构有足够的资源来做这件事,而且任何出版商提供的可用文章的规模都太小,无论如何都无法用来训练大型深度学习系统。”
一些受访者已经厌倦了持续的变化,不愿对未来大加思考:
“我们首先要专注于了解已经完成的工作。”
但大多数人都想要改变新闻编辑室的结构,以便建立、管理和开发人工智能。
正如我们在上个章节中提到的,战略十分关键,但情况在不断变化。虽然人工智能开发在存在文化和知识壁垒,但人员依然被视为未来的关键资源因素。如果组织结构不发生变化、不能正确认识人工智能,就无法为开发特定工具或产品持续提供更多资源:
“有能力在技术、产品和形式上进行更多的创新,这是好事,但是如果没有(可能的)重大组织结构变革,很难将这些创新融入进去。”
迈向未来的第一步是,了解如何到达未来:
“我会把资源投入到阐释我司作为传统媒体的前进方向,并制定战略,让员工和部门能够为之铺平道路。以当前的技术发展速度,制定详细计划是不太可能的。如果不了解潜力和极限,就不可能在未来制定战略并保持竞争力。”
大多数受访者建议创建团队,开发综合人工智能和制定数据战略,然后在有足够资金的情况下确定优先级并执行任务。也许这并不奇怪,因为一些受访者已经在这样的团队中工作了。尽管这些部门各不相同,通常从事特定项目,但大多数受访者强调有必要与其他新闻编辑室整合。受访者提出了两种方法,分别是实验法和学科交叉法:
i.实验法:
我会建立一个小团队,负责对人工智能进行实验。任何项目都需要一名相关编辑或新闻业内人士。我不要求他们生产最终产品,而是在开始确定可实现的方案和预测可能的危险。
我会建立一个内部实验室,由人工智能专家组成核心团队,然后每个部门的同事都可以在实验室待上一或两个月。实验室的内容是分析过程,研究读者对人工智能生产内容的理解,测试或自己发明新工具。
ii.学科交叉法:
我认为我们需要一个专注于更广泛领域的小型团队,例如自动化和内容增强。这个团队不应仅由新闻工作者和开发者组成,还应有社会科学家和设计师加入。团队也不应该固步自封,只停留在新闻编辑室内,而是成为公司不同部门的桥梁,所以资源和知识不只用于内部。报社不仅仅是新闻编辑室。
我会创建一个团队,大约1520名新闻工作者(文字,视频)+一个专门的项目团队(PO+UX+UI设计师+图形设计师+运动设计师+3名开发者和1个技术主管+1-2名开发人员)+2名项目经理+4名数据分析师+1名增长分析师以及1位项目负责人。这个团队将拥有专门的支持和我们的5%观众(当然还包括志愿者)。它将有自己的路线规划和专门的优先项/KPI。但这将是一个很棒的工作团队 :-)
03
教育和培训需求
受访者对未来的最大期望是,针对人工智能的通识教育和专业培训。在新闻机构中,“科技扫盲”被认为是改变风尚、增进对新工具和系统的了解的重要因素。解释和揭秘人工智能可以使人们学会它的使用方法:
“扫盲非常重要。从基础编码,到数据科学,我们正在研究怎么从这些方面更好地教育新闻工作者。从经验来看,越是能够接受技术、越早提出人工智能项目想法和储备专业知识的新闻编辑室,他们的结果就越好。”
培训可以通过在线课程或第三方来完成,但这与整个新闻编辑室的发展以及个人学习一样重要:
“参与技术运行原理和潜在应用的基本培训,可能会帮助我们认识从前错过的应用程序,从而发现商业机会。”
技能培训针对特定功能,但也可能包括新闻学的基础知识,比如说编码:
“我们都需要具体的人工智能培训:即使是密切相关的人员也可能无法完全理解技术,因此也无法预见各种可能性。对于新闻编辑室来说,新技能着重在人工智能素养和数据分析上;对于技术团队而言是基础层次的人工智能解决方案知识。”
潜藏在人工智能培训需求背后的问题是编辑人员的STEM(科学、技术、工程和数学)素养短缺、以及反思现有的新闻实践和原则之间关系的能力的短缺:
“新闻工作者并不需要立刻掌握编写代码的技能,但他们应该了解去往美丽新世界所需的基本工具。这意味着要围绕数学、数据和计算机科学建立核心能力。对于自动化项目,你要经常总结新闻经验和判断。这就要求新闻工作者以系统的方式思考,为什么要做出某类决策,以便机器进行学习。”
一些受访者认为,创新训练应包括实验元素,而不是简单地提出行为模板:
“我认为训练的侧重点是,由来自不同领域的人员组成小团队进行实验。这将有助于沟通彼此的想法,可以在未来产生巨大的影响。”
人工智能培训被认为是所有参与者的职业发展的一部分:
“以前没有接受过计算新闻学方面训练的人需要接受基础培训,还有关于数据抓取技术的基本培训。而了解技术较多的人员需要进一步接受训练,把深度学习或机器学习的结果应用于现实生活中的新闻故事。”
了解人工智能是新闻机构中管理人员必不可少的知识。这不只是为了改善系统,还促进新闻编辑室从其他地方学习,以便进行战略调整:
“提高认识:了解竞争对手的技术水平如何,了解其他新闻编辑室的实际情况,然后确定该技术如何改变我们新闻编辑室——然后留心这些问题。了解机器如何提高我们的表现和输出,而不是取代我们。观察发现表现出色的类似/其他行业。”
我们在上一章中提到了,我们需要理解广泛的道德问题,才能解决人工智能中的偏见和其他道德问题。只有拥有更好的洞察力,才能以系统的方式达成公开透明:
“我们要理解提供给算法的输入值和变量,以最大程度地减少偏差。建立反馈和迭代过程。在编辑大会或其他论坛上公开透明地讨论“过滤气泡”、道德和人工智能倡议。在多个部门建立测试组,加入多种编辑功能(例如订阅者模式/编辑者模式),以演示新功能并提供反馈。”
除了开展培训,新闻编辑室还需要拥有能够持续收集技术变化趋势信息的系统:
“新闻编辑室和新闻工作者需要就技术的前进方向、技术如何改变世界、以及新闻在其中的作用等问题进行更多的讨论和培训。这不是学习特定的技术或人工智能技能,更是了解变革的步伐,了解可能性,以及知晓如何保持现在的优势。”
新闻编辑室中,并非每个人都需要了解人工智能的方方面面。但至少一部分人需要对技术可能产生的整体、系统性影响有综合的了解:
“我认为,新闻编辑室中所有使用人工智能的人都需要知道这些事情:在相对较高的层次上,人工智能系统是如何工作的。例如:定义问题,收集数据,建立模型,评估模型,生产过程,反馈到定义问题组以及迭代。我觉得现在存在着一个误解,大家认为构建模型或工具是困难的部分,而实际上最复杂的地方在于定义和评估阶段。在做出编辑判断之前,了解系统行为也很重要。系统规定参数是什么,有什么限制?然后是相关人员需要了解的特定事项,例如评估指标。”
少数人认为,不应该把高水平的培训或教育浪费在新闻编辑室上。他们认为,为不懂技术的人创造工具是技术人员的工作:
“技术人员需要为新闻工作者创造易用的产品和服务,并且应当界面简洁、操作方便。人工智能需要被揭开神秘面纱。”
“如果我们做好本职工作,人工智能在人们的日常工作是会隐形的。唯一的例外大概是我们的数据团队,但他们也正在努力。”
04
新闻编辑室的合作关系
传统意义上,新闻业是一个互相竞争而非携手合作的行业,受访者对人工智能的热情代表了业界思维甚至是新闻制作方式的重大转变。受访者往往有来自其他行业的工作经验,因此可能比其他新闻编辑室员工有更多的合作经验,这是新闻业的真实趋势。技术驱使着我们改变,但市场、受众的变化甚至是道德也是原因。绝大多数受访者同意这一点:新闻业需要更多的合作关系。在之前的章节中我们谈到新闻编辑室的内部合作,它也是外部合作的先决条件:
“使用人工智能技术进行创新的一个主要障碍是,新闻机构对自己的内部流程和工作流程的了解不足。很难自动化执行流程,只有执行部门才懂得如何去做。解释清楚过程/工作流将是合作的良好起点。”
人工智能提供了与其他机构合作的机会。这包括一系列广泛的活动,包括研发、新闻调查、数据共享以及培训。还有,可以与其他新闻媒体一起合作解决某些问题:
“建设一个用于人工智能和机器学习的集中式历史文章数据库,全国各地的新闻编辑室将从中受益。”
合作还可能涉及科技公司、学术界和民间社会组织。一些受访者认为自己已经有很多合作经验,有人认为现在谈合作还为时过早。总的来说,大家有意愿进行合作:
“媒体机构之间的合作越多越好,但也可以与跨学科人士合作,例如社会科学家,他们可以帮助处理数据。这也是统一数据和人工智能道德规范的方法。”
合作可以创造经济效益。团体协作有助于为研究提供资金:
“合作越多越好。独立出版商在新闻所需的人工智能创新和产品开发方面缺少资金。具有明确战略目标并与合作伙伴步调一致的创新团队可使研发更具影响力。”
新闻媒体目前的竞争非常激烈,并为新闻独立感到自豪。越小的组织往往对合作最为积极,但是有人建议通过中介机构来促进合作:
“有实力的新闻编辑室往往拥有强大的独立文化,让他们进行紧密合作的难度很大。具有讽刺意味的是,小型新闻编辑室通常不担心这个问题。我们需要的可能是诚实的经纪人(来自学术界、非营利组织或投资人),此人能够召集所有人并制定出人人愿意参与的条件。”
协作有好处,但也有代价:
“我们相信,合作对于人工智能在该领域的成功至关重要。但是,合作本身就是一项工作。组织跨地域的机构非常耗费资源。但是,如果我们想建立全球适用的工具,就必须做出这样的权衡。”
新闻往往跨越国家,因而合作对于全球报道具有重要意义:
“跨国新闻合作关系是新闻界一大热门话题。我们见到了一些合作案例,并期待全球话题(例如跨境腐败和气候变化)方面能有更多合作。”
这在各个国家/地区都具有价值,来自捷克、荷兰和斯堪的纳维亚半岛国家的受访者都表示这些合作会成为未来的榜样:
“丹麦版美联社正在尝试建立自然语言处理方面的合作,分析丹麦各媒体公司的内容并加上标签。希望这只是开始。”
“至少在斯堪的纳维亚半岛,新闻界人士在分享人工智能技术的进展和发现时放下了戒心。这是因为所有人都意识到,竞争已从新闻编辑室之间转移到了有影响力的大型技术平台。”
国际调查记者同盟(ICIJ)是新闻业的专门组织,不仅在《巴拿马文件》的帮助下产出许多优秀的跨国新闻,而且还提供普及的培训和合作资源。它与 Quartz 人工智能工作室、斯坦福大学以及众多新闻机构进行合作。这个例子很好地说明了,独立供资的中间机构也能提供人工智能新闻资源和专业知识。
05
人工智能如何重塑新闻业?
这份报告展示了新闻编辑室现在在用人工智能做的事情,以及未来要做的事。我们已经看到了人工智能对新闻资源和公众关系产生的影响,以及引发的新型挑战,例如科技公司的作用和培训的需要。但是,受访者如何看待人工智能的长期发展趋势?本报告的受访者常常与人工智能接触,因此不出意外,他们认为人工智能对重塑新闻业有着至关重要的作用。
“采用人工智能不是可选项,而是必选项,如果哪家新闻机构还没有加入到这场马拉松中,那么他们应该尽快开始了。”
纵观媒体历史,我们知道,技术有着浅显和深刻的影响:
“技术一直影响着新闻业:互联网改变了传播方式;打字机和计算机先后提高了生产力;印刷机扩大了报纸的规模。自动化和人工智能已经改变了行业的各个方面,这一趋势将继续下去。”
大多数受访者认为,人工智能对未来的影响是渐进的、增强式的。但少数人认为,人工智能是推动新闻“结构化”转变的核心,未来将由自动化和个性化算法推动内容创作:
“人工智能技术实际上使我们从单向输出,也就是广播通信面向读者,变成了双向交互式交流。”
未来的新闻将是围绕人工智能的跨学科行业,这意味着需要创造新的技能组合、组织管理模式和新闻学科方法。新的工作模式可能会产生与人工智能相关的新职位,如自动化编辑、计算新闻记者、新闻编辑室工具经理、人工智能道德编辑等。但他们做的事情会有什么不同?
新闻编辑室期待人工智能重塑新闻的十大方面:
更好的个性化内容发布
更高效、自动化的内容生成
动态广告和订阅价格策略
在数据中找到更多故事;在故事中找到更多数据
更好的自动化转录
更好的内容审核管理模式
假新闻/机器生成假新闻识别
用于揭穿真相的新工具
增强的图像/视频搜索
更深入的用户生成内容情感分析
06
仅仅是增强还是完全改变?
大多数受访者认为,人工智能将强化现有的工作流程,或使流程更有效率:
“我认为新闻编辑室的任何工作都可以借助人工智能进行增强,真正的问题是,这样做对吗?值得我们花时间吗?有前景的领域可能是……评估内容、简化评论审核、提供优化建议还有提供更好的语境。像“识别新闻报道或独家新闻”这样的领域可以使用人工智能,但是我会我会小心翼翼地使用,因为语境经常变化,编辑判断十分关键。”
对于人工智能的具体应用还有许多大胆想法:
“把文本自动转化成任意形式,文本到语音,文本到视频,这可能是不久的将来最常用的功能。”
即使是增强作用,新闻媒体现在也正在竞相利用这项技术:
“在人工智能的帮助下优化工作流程,这将是保持竞争力的必要条件。要做到这一点,新闻媒体公司会越来越像科技公司,建立自己的软件开发部门。”
人工智能增强可能会累积正面的影响:
“人工智能可以使文章内容更有深度,并在研究中收入更多的第一手资料。对我来说,通过窗口小部件丰富个性化的内容生产似乎也很有意思。”
在过去的二十年里,新闻编辑室一直在应对不断扩大的规模和日益复杂的新闻采编、生产和发行等问题。最近,许多人提到高度集中且十分复杂的定制内容、订阅和用户参与的模型。收入来源、受众行为以及行业“重组“都发生了巨大变化,许多领域的产能不足,行业新鲜血液也得不到补充。许多受访者认为,人工智能将成为整个行业发生改变的另一大主要力量:
“现有的新闻制作工作流程可能会被彻底颠覆,新闻产品会出现全新类别(例如自动化新闻和程序汇编)。目前还不能确定这种人工智能颠覆力量会来得多快或多强,但它很有可能改变新闻业,这是人们所公认的。将新闻内容发布到支持人工智能的平台,然后基于这些已发布的内容资产创建数据经验,这可能会严重破坏新闻行业的业务模型及其创建独特的编辑经验的能力。行业结构加剧了这种情况,具有强大市场力量的平台越来越少。迄今为止,在这些环境中还没有建立起新闻发布的范例。”
思考未来,就需要重新考虑新闻实践和行业结构:
“我们需要更加坚定立场,了解自己的使命,以及掌握分配给系统的任务。如果我们不加强密切合作,人工智能的发展可能会增加垄断,因为小型媒体公司无法负担任何新闻项目。”
新闻媒体不再仅仅是与同类竞争:
“大多数竞争者来自新闻界外,拥有比信息产业还多的资源,在这样的世界里,我们需要找好定位、发掘效益。”
人工智能可能是一种改革力量,但它带来的好处是否会被平等分配?人工智能在新闻业是为多数人服务还是为少数人服务?
“人工智能在新闻和信息的挖掘、生产和发布中的作用日益重要,一个关键问题是,传统且资源匮乏的新闻编辑室在这个生态系统中能发挥什么作用。他们能拥有和人工智能竞争的工具吗?他们是否会提供‘人工’内容,以作为大型组织在人工智能新闻引擎中使用的‘原料’?新闻生态系统的哪些部分不会离开新闻编辑室?”
人工智能将有助于推动的一个变化因素是“物联网新闻”,将发布内容转移到不同的设备上。随着日常设备互联互通,它们以新鲜的方式方法向消费者传播新形式的新闻。
弗朗切斯科·马可尼(Francesco Marconi)在美联社进行了实验,例如使用传感器收集新闻数据,并开辟了新闻制作新方式:“我们可以监控娱乐场所和政治场所的振动和噪音,以此确定音乐会上最受欢迎的歌曲,或者比赛中气氛最好的一局,甚至是竞选集会上产生最大共鸣的语句。”
无人机、可穿戴设备、语音和虚拟现实都成为了新闻制作和发布的一部分。正是人工智能使这些功能可用并具有扩展性。这种增强新闻有许多形式,需要新技能和创造力。有关受众行为的数据是理解这种新的“发布式新闻”的关键:
“我们希望从单向沟通变为双向反馈,似乎人工智能可以帮助我们理解用户并与之互动。”
借助受众互动、社交媒体和和多平台发布,新闻编辑室已经习惯了“互联式”或“发布式”新闻形态。人工智能会增加差异性:
“我认为在新闻编辑室中,增强对技术及其含义的抽象能力和提高分析技巧,这两项是必要的开始。我们需要提高新闻编辑室中处理新闻模式的人员比例,而不是讲述单独故事的人员。”
除了了解数据和抽象概念之外,新闻工作者可能不得不更加努力地在人情味上下功夫。在坐拥众多技术的情况下,你是否仍能保持人类思考角度并将用户体验作为核心?
“人工智能是否可以支持我们与读者的互动,而不会造成其他影响,我也很想知道这一点。如果我们能使工作更加透明,并且惠及更多人群,那么前景将十分广阔。”
培养公众对新闻的信任和兴趣的关键因素是情感。新闻需要从用户的角度看待世界,并让他们觉得新闻反映了自己的价值观、身份和情感。情感一直是新闻界中“人类利益”的一部分,但在数字和社交网络时代,它是获得关注和促进分享参与的关键因素。随着人工智能在理解“情绪”方面的进步,这项技术将有助于新闻编辑室更好地与观众产生联系。
07
可以从其他行业学到什么?
新闻业是一个独特的行业。新闻工作具有许多特殊条件:新闻周期、公共利益、监管制度、不同的商业模式、不同的格式、高度差异化的受众和多样但强大的“专业”文化。出于道德和商业原因,新闻十分重视独立性。因此,一些受访者(约10%)认为,不需要花费太多时间去看待其他行业在人工智能方面的表现:
“在这个领域里,我宁愿只关注自身。”
然而,大多数人认为新闻媒体过于孤立:
“我认为新闻应该关注其他行业。事实上,我担心的事情是,作为一个行业,新闻业总是在内部寻找指引。《纽约时报》在做什么?《华盛顿邮报》在做什么?我们需要向其他行业取经,看看他们的创新、错误和忧患是不是也适用于我们。”
一些受访者曾经在其他行业工作过,许多人觉得,除了新闻媒体还可以从业界之外学到很多东西。呼吁“新闻界的Spotify”或“新闻界的Netflix”已经成为陈词滥调,但是有对比可能就有进步。这些是充分利用人工智能技术的新兴公司。但受访者也将视线投向其他传统行业,特别是结构经过优化并将技术带来的威胁转化为可持续模式要素的行业:
“如果从长远出发,我们应该看看任何存在供应链管理问题的行业。例如,20年前的音乐产业。”
显然,广告和营销等媒体行业与新闻行业密切相关,但其他不太相关的行业也被引用进来,如Ebay、亚马逊和阿里巴巴等在线零售公司:
“在线零售是一个已经将人工智能深度集成到其自动化流程中的行业。部分原因在于,在线零售会生成大量高度结构化的数据,这使得对用户行为及高级目标的深入分析变得更加容易。尽管媒体行业可能无法复制在线零售中使用的点对点技术,但是产品推荐、动态定价、客户决策过程分析甚至自动化产品描述/标题生成的等最先进的机器学习模型绝对值得一看。”
我们甚至从赌博业也能学到如何使用技术来了解受众:
“博彩网站真的很有趣,他们对用户行为的追踪程度超过了其他任何行业,而这正是我们真正想达到的效果——被本地新闻所吸引。”
游戏化新闻最巧妙地采用了新技术来展现全新内容格式,例如《金融时报》的Uber Game,但受访者认为游戏行业本身更具相关性:
“就个人而言,我认为游戏行业是所有人工智能使用领域中的最佳实践。人工智能在人机交互中的无缝实现令人印象极为深刻。”
进行比较,可以得到正面的启示和负面的教训。例如,法律从人工智能支撑的数据搜索中受益,但人工智能也对合法劳工模式造成了负面影响。教训不仅仅来自技术层面或经济层面。其他行业的人工智能正在引发一场全新的争论,即在我们和用户之间隔着自动化的机器,信任意味着什么。医学、制药和生物技术行业都面临着深刻的道德挑战,新闻业应该予以正视:
“我们应该向他们学习在数据精度、验证、数据完整性以及匿名大型数据池使用方面的标准。”
但最常见的老师是各大科技公司。他们在研究方面占主导地位。他们正在创造新闻工作者可能会使用的新产品和网络。科技公司也面临着同样的市场和道德挑战,新闻业可以从中学习:
“软件巨头和数字技术公司(例如MicrosoftGoogleFacebook)是该领域的领先者,我们需要不断向他们学习和借鉴。”
“科技公司就是明显的例子——他们犯了很多错误,也提了很多假设,我们可以从中学习,避免问题发生。”
最近的历史已证明,面对技术变革,新闻行业适应性极强。然而,新闻业的规模不断缩小,并苦苦争夺资源。
根据受访者的看法,人工智能会带来更多的变化和巨大的挑战,但也为那些理解和部署技术的人提供机会,提高他们的工作水平。新闻业是一个相对规模较小的行业,而人工智能是一项庞大而昂贵的技术。如果以人工智能为动力的增强新闻蓬勃发展,新闻业就必须再一次展现想象力以及决心。
结论:人工智能对新闻业意味着什么?
本报告代表了全球多家新闻机构从事人机合作人士的观点。受访者较为熟悉人工智能,并对其应用抱有积极的态度。所以,当他们指出人工智能的局限性以及使其正常工作需要付出的努力时,事情的发展就更有趣了。他们表明,人工智能正在赋予他们更多力量,但随之而来的还有编辑和道德责任。
受访者强烈认为,人工智能有助于提高新闻工作者的工作效率,并使他们更好地办到以下两件重要事情:
1.在新闻行业为取得经济发展以及公众信任而努力的时代,不管有没有人工智能的帮助,让新闻工作者有时间创造更好的新闻工作。
2.帮助公众应对新闻过载和信息失真的世界,并以轻松的方式把人们与其生活密切相关的、实用的、令人激动的新闻联系起来。
要做到这一点,新闻机构必须(再一次)改变。他们需要采取某种形式的人工智能战略。还要改变工作流程、管理系统和招聘方式。
即使如此,这将是一次艰难的改变。人工智能是一种新兴的技术,其应用可能会十分复杂和昂贵。它也有严重的问题,比如说算法偏见或对短视的收益政策。某些挑战是全行业的危机。作为一个行业,新闻业必须有更多的内部和外部协作。新闻编辑室需要进行重大投资,吸收新闻需要的技能、知识和创新创造,以优化人工智能并减少潜在的危害。
这需要行业思想的转变。新闻行业一直以来竞争严重、相对孤立。而改变需要灵活调整和长期规划,可能与新闻周期的快速优先以及来自市场的压力相矛盾。公共媒体部门将面临类似的挑战,也需要适应。新闻媒体需要强大而有效的方法来处理与其他利益相关者的关系,如科技公司。
人工智能技术既不会拯救也不会扼杀新闻业。新闻业本身面临许多其他挑战,如公众的冷漠和反感、其他事物的吸引力。
也许,在这个人工智能领跑许多领域(从政治到医学)的世界中,新闻业最大的希望是人工智能和世界比以往任何时候都更需要良好的新闻。在这里“引用”美国总统肯尼迪的话:新闻工作者不应只问人工智能可以为他们做什么,他们应该问自己可以为人工智能世界做什么。
首先,他们需要和人工智能一同行动起来。这并不意味着它会屈服于炒作。这意味着业界要对技术的价值以及战略部署的方式做出明智的判断。这还意味着业界要再次接受事实,必须适应新闻及其消费方式正在发生变化。“远见”对新闻业仍然很重要,特别是在世界似乎变得更加混乱和矛盾之时。
人工智能为新闻提供了一系列工具。不是推倒新闻“信息守护人”的卓越地位然后重来,而是成为可信赖的信息创建者和策划人,成为具有批判性和独立分析的新闻来源,以及成为能够进行各种相关讨论的论坛。正如克莱·舍基(Clay Shirky)十多年前所言:“不存在信息超载,只有过滤失败。”人类的新闻技能和价值观若能和技术完美结合,会十分有益。
各家新闻无法单打独斗,因为对算法和新的通信网络还不够了解,需要更好地理解人工智能如何为新一代公民塑造信息生态系统。新闻机构需要找到其他资源和专业知识的利用方法。他们需要向公众和社会证明,新闻可以成为这项技术健康发展的关键因素。
也许我们从这份报告中获得的最有用信息是,我们正处于另一个关键的历史时刻。如果我们认为新闻业是一种由人类提供的社会福利,那么在所有新闻机构必须采用这种技术之前,我们还有2-5年的时间。好消息是,调查中获得的回应显示,全球新闻业大部分成员正视这一挑战,并努力实现目标。他们热衷于使用新力量,但也接受新责任。
就我们而言,期待建立新闻和人工智能网络,目的是促进相关方沟通、促进更好的培训、激发研究,以及推动最佳实践和对话的交流。
查理·贝克特教授
201911月于伦敦政经学院
来源| 腾讯媒体研究院(获授权转载)
     作者| Charlie Beckett

来源:NEWS全媒体采访与写作
链接:https://mp.weixin.qq.com/s/OOrPSdXhgGZ4lOAK4sdNIg

387#
 楼主| 发表于 2020-1-28 19:30:31 | 只看该作者
【案例】
AI驱动算法成功预警武汉肺炎后,再助力疫苗研发
当前的新型肺炎疫情持续近一个月,受感染人数还在不断攀升,尽管在这场战斗初期,也有些许利好的消息不断传出,但无疑人们的耐心也会在这段时间内一点一点的消磨。难关当前,时间尤为珍贵,因此,借助科技手段提升效率也就成为我们接下来要思考的方向。
这是一个非比寻常的新春佳节,与往年相比有着极大的不同。以往的欢声笑语在今年显得尤为珍贵,本该是阖家欢乐的日子,却有一批又一批美丽的“逆行者”奔赴湖北武汉;本该是新年聚会、相亲的日子,但大多数人却选择自愿留在家中……
此时此刻,新型冠状病毒引起的肺炎疫情依然牵动着全国人民的心,尽管随着全国各地同步采取了防御措施,但新增受感染人数却依旧不见“拐点”,一天一个新数字,深深刺痛着我们。疫情发生之后,全社会拧成了一股绳,各种社会力量持续注入到此次的防疫防灾中。
值得一提的是,此次防疫工作中,注入的科技力量已经越来越多了。不仅是阿里巴巴设立10亿元专项基金;腾讯基金捐出3亿元;百度成立3亿元疫情及公共卫生安全攻坚专项基金……科技公司拿出真金白银用于疫情物资、食品、医疗设备补给的同时,还有越来越多的新兴技术投入到疫情的控制中去。
众所周知,一场突如其来的新疫情,在检测到治疗、从控制到病毒变异、由开始到结束之间存在诸多变数和不确定性。当前的新型肺炎疫情持续近一个月,受感染人数还在不断攀升,尽管在这场战斗初期,也有些许利好的消息不断传出,但无疑人们的耐心也会在这段时间内一点一点的消磨。
难关当前,时间尤为珍贵,因此,借助科技手段提升效率也就成为我们接下来要思考的方向。
大数据分析“狙击”疫情蔓延
此前智库曾介绍过大数据对控制疫情扩散,使其变得更加透明,效率也得到大幅提升的作用。在123日,武汉市针对新型冠状病毒感染的肺炎疫情做了“封城”的决定,这有史以来的首次封城也让公众逐渐认识到此次疫情的严重。然而,封城所引发的另一个思考成为焦点:封城之前武汉人的去向与疫情预防问题怎么解决?
如果是通过寻找到个人,一个一个进行登记,恐怕防疫效率会大打折扣,同时还会增大病毒传播的风险。令人欣慰的是,中国互联网公司和运营商高度参与疫情防控中,利用手中掌握的大数据资源,使其成为预测和控制疫情扩散的有力武器。
比如百度迁徙数据所统计的截止到122日的从武汉流出人口数据显示,省内流出城市主要为孝感市、黄冈市、鄂州市;省外流出城市前三则为深圳市、上海市和北京市。而除了上线了时空大数据及分析技术外,百度还宣布了提供人工智能技术支持以及配套亿级计算资源,成为率先在疫情面前提供人工智能技术的公司之一,这在后文也会有所介绍。
除了互联网公司的数据,运营商通过基站采集的大规模手机轨迹数据也是一种极具参考价值的大数据资源。这在2016年就曾有科研人员提出过印证方法,具体是先对手机轨迹数据进行数据预处理,以提取用户的活动轨迹;然后根据进出城市数据模式提取重要特征,再根据真实标注数据集合利用多种分类模型进行参数训练;最后,由模型训练结果判定用户轨迹是否为进出城市行为。
这种有的放矢的办法,不仅在一定程度上精准掌握了可能携带病毒人群的动向,也更容易对重要的、流动大的交通枢纽进行防疫部署,提高效率的同时有效防止疫情进一步扩散。而除了大数据分析用于疫情控制外,被公认为能大幅提升效率的AI也已经在此次疫情中发挥了巨大的作用。
AI深度参与疫情防控
在疫情预测和防止疫情进一步扩散中
19日世界卫生组织向公众通报此次中国的流感状况——可能由于接触华南海鲜市场内活体动物,武汉市出现新型肺炎病例之前,一家来自加拿大的健康监测平台就已经于1231日向其客户推送了疫情消息。
这个名为BlueDot的健康监测平台通过人工智能驱动的算法,可以搜索外语新闻报道、动植物疾病网络和官方公告,通过收集到的数据处理向其客户提前推送疫情警告,以避开武汉等危险地区。
BlueDot的创始人兼首席执行官KamranKhan经历过2003年的SARS,那时他就希望通过一种方法来更好、更有效率的追踪疾病,因而他在2014年推出了BlueDot,并筹集了940万美元的风险投资资金。
这套算法使用的是来自全球的机票数据,通过掌握和预测受感染居民下一个去向和时间,从而正确预测该病毒首次出现后,在几天内又从武汉蔓延至台湾、泰国、韩国、日本、美国等地区和国家。
Khan表示,他们所做的是使用自然语言处理和机器学习来训练该引擎进行识别,一旦完成自动数据筛选,人工分析就将接手,由流行病专家从科学角度进行检查并得出结论是否合理,然后将报告推送至政府、企业和公共卫生客户手中。
相比Goole Flu Trends2013年流感季节的预测失败,BlueDot曾在英国医学杂志《柳叶刀》中成功预测了Zika疫情在南佛罗里达州的位置。
在国内巨头中,百度推出的基于人工智能的智能外呼也不失为防控疫情中的有效手段之一,智能外呼的作用是构建智能外呼语音机器人进行批量一对一电话呼叫,支持同时并发500个电话外呼,并可进行扩容,可应用于疫情排查和通知回访。
这样一来,不用通过社区人员走访,就可以对流动人员、本地居民的身体健康状况进行排查和回访,同时还可以针对乘坐特定的航班、车次、其他交通工具的乘客致电通知,形成记录。相比简单的走访形式和媒体传播,这种方法更有针对性且最大限度的减少了再次传播的可能。
在抗疫药物研发中
在疫情发生不久后,我国就成功分离了首株新型灌装病毒毒种,随后中国疾控中心也宣布了疫苗研发的启动,并正在进行新型冠状病毒肺炎的药物筛选。不过,虽然进展较快,却也困难重重。
疫苗的研发还需要经过反复的研究、修改流程以及检测结果,在这其中存在着大量的数据分析过程,无疑又要消耗大量的时间。而利用人工智能则可以节省很多时间,并且在此前,澳大利亚弗林德斯大学、药明康德等机构都已经证实人工智能具有加速疫苗研发的能力。
不仅如此,TechEmergence报告中还提到,人工智能还可以将新药物研发成功率也进一步提高,具体可从12%提升至14%
可见,人工智能全面深入到疫情防控中去的确对疫情控制有了极大的效率提升,虽然人工智能对于此次疫情的贡献尚需证明,但已经足以见得,可将一些任务托付给人工智能来提升效率了。
写在最后
一场无硝烟的战斗牵动着全国人民的心,我们正以举国之力投入到此次战斗中去,目前我们已经取得了一些阶段性的胜利,应用于新型肺炎的药物也正在加紧研发,人工智能、5G、物联网等技术业已投入进去,在灾难面前,还需要大家上下一心,共克时艰,一起打赢这场“战役”。
编辑:陈茗

388#
 楼主| 发表于 2020-2-3 01:12:33 | 只看该作者
【案例】
在疫情新闻报道蹿红的新媒体产品
关于“新型冠状病毒肺炎疫情”的报道,今天上午有一则新闻消息持续在微信朋友圈刷屏!这条消息带来的不仅仅是单纯的疫情动态资讯消费,“消费”这条资讯之后更给大家带来了一种振奋。因为,疫情防控之战持续中,这起新闻事件意义重大,那就是武汉火神山医院正式交付。
今天与这起新闻事件相关的一种新闻产品也在微信朋友圈刷屏,那就是近年来新媒体常用的“新闻海报”(业界其实也没有确定的说法,我个人一直形容其为“新闻海报”)。
今天上午1121分,中共武汉市委机关报《长江日报》官方微信推出一则题为《致敬火神山的热血建设者!他们的心愿让人动容》的微信文章,这篇文章采取“文字+照片”的形式进行资讯传播,这条微信给人第一印象就是,突出照片的视觉传播效应,而文字极其简短,成为“配角”。
《长江日报》推送的这条微信,刊出10张人物照片,这10位新闻人物恰恰就是火神山医院的劳动者。在这里,照片已经不单单是照片,而是经过“视觉再包装”的“新闻海报”,品质感很强。
在重大新闻报道发布时推出一组这样的新媒体产品,瞬间让人观后视觉体验感分外强烈,新闻现场的现场感也十足,正所谓“一图胜千言”。
就在《长江日报》推出这组新媒体产品之后,《人民日报》官方微信于今天1339分予以转发,阅读量瞬间破“10+”,超过这组新媒体产品的原创单位《长江日报》。
在这场看不见烽火硝烟的激烈战场——新闻战线,围绕此次“新型冠状病毒肺炎疫情”的报道,很多所谓的传统媒体和新媒体机构纷纷使出浑身解数。传统媒体聚焦内容主业,不断推出独家深度硬核原创资讯,比如财新、新京报等;新媒体机构则直接撸起袖子生产全新形态的内容产品。
整体而言,过去这些天,全国很多媒体机构关于“新型冠状病毒肺炎疫情”的报道,“新媒体”形态的产品层出不穷,形态主要表现为新闻海报、动画短视频、创意短视频、数据新闻、综编类资讯产品。
“新闻海报”,人见人爱
就在我写今天这篇微信文章的时候,《人民日报》官方微信最新推送了一条微信,打开这条微信,一张“新闻海报”瞬间挤占屏幕。晃眼一看阅读量妥妥的“10+”。在“新闻海报”这类新媒体的传播效果方面,《人民日报》官方微信凭借其头部媒体刷屏效应,瞬间突破“10+”早已成为家常便饭。
“新闻海报”,已经成为《人民日报》、新华社这类官方头部新媒体惯用的资讯传播手段和视觉传播介质。
先说说远点的事儿,去年关于一些热点新闻资讯传播,《人民日报》新媒体几乎天天有“新闻海报”推出。很多关键信息附在图片上,以全新的视觉加以传播,给受众以全新的资讯产品体验,引发微信朋友圈刷屏。
还是聚焦此次疫情报道本身。拿起手机,随意往前刷屏,《人民日报》有关此次疫情的“新闻海报”非常多。我大致归纳三个方面:
一、“新闻海报”跟着新闻事件走。也就是说,一旦有重要消息发布,就同时设计制作“新闻海报”进行视觉传播;
二、“新闻海报”作为新闻评论的配图。也就是说,一旦有重磅声音发出,就以此为主题,推出相关“新闻海报”;
三、善于新闻资讯集纳。归纳相关新闻主题,集中性地设计、制作、传播一组“新闻海报”,形成更加强烈的视觉冲击力。
固然《人民日报》有很多优势资源,在资讯传播上占据很多先机。但是,《人民日报》近年来用心生产的无数“新闻海报”,策划先行、内容考究、设计精良、传播及时,这实际上就是其作为一家机构媒体的操盘手腕,光凭这几方面的用心就足以吊打很多媒体同行。
试问,有多少机构媒体的确是在时刻保持“新闻海报”的高品质传播态势?
没有这点内容拼劲儿,所以“你们”距离《人民日报》的距离只会越来越远!
《人民日报》爱生产传播“新闻海报”,其兄弟单位新华社也如此。比如今天新华社官方微信号推出的题为《众人拾柴火焰高》的微信,点击进入之后就是一张满屏的海报。设计感很强,品质感很高!(新华社围绕此次疫情实际上也密集推出了系列“新闻海报”,在此不再一一举例)
动画短视频,走心
具有品质感的独家、原创、深度、硬核的文字产品,实际上在如今逐渐成为稀缺;“新闻海报”呢,作为一种平面设计类产品,是一种无声胜有声的新闻语言。在此之外,近年来有声音、有画面的MG动画短视频也成为各家媒体竞相制作并传播的新媒体产品。
观察发现,行业内众多MG动画短视频的视觉风格都很轻松诙谐,而非一本正经,甚至会加入一些炫酷的画面。MG动画短视频的声音元素也以幽默搞笑的配音语言为主,而非字正腔圆的“播音腔”。
四川日报报业集团“川报观察”APP平台在疫情蔓延以来就介入MG动画短视频的内容生产和传播。“川报观察”APP129日推出第一期“战疫小课堂”MG动画短视频,主题聚焦“上班途中如何防护?”。截至到21日,“战疫小课堂”已经累计推出10MG动画短视频,时长多在30秒左右,长则达到50秒。
“战疫小课堂”的MG动画短视频主题聚焦比较多元,比如《进入办公楼该怎么做?》、《进入办公室该怎么做?》、《参加会议怎么办?》等,最近的一期节目主题为《后勤人员有啥注意事项?》。一系列围绕疫情防控的不同主题MG动画短视频,让大众原本对此比较陌生的公共健康知识跃然起来,通过生动的动画语言便很快掌握。
此次疫情报道,同样作为省级新媒体的“浙江新闻”APP也推出抗“疫”类MG动画短视频。
今天早晨9点,“浙江新闻”APP推出一则题为《返程的你如何保护好自己?浙视频为您准备了这份动画攻略》的MG动画短视频。生动形象地告诉大家在车上、在单位、上下班途中、回到家里等环境下如何保护自己不受病毒侵袭。
用心的产品,一定走心!
这一轮有关抗“疫”的新闻选题,部分省级官方媒体的选题策划和产品生产水平可见一斑。
创意短视频,秒火
今天一早,我打开微信,发现很多人都在转发微信公号“回形针PaperClip”的一则创意短视频——《关于新冠肺炎的一切》。大家转发之下,点击率早已突破“10+”,不得不说,这是今天微信朋友圈的爆款。
B站平台,“回形针PaperClip”这条创意短视频点击率已突破110万,在微信和B站显示的阅读数据,我确信这是真实的流量。须知,一些产品在某些平台的流量其实虚假居多,经不起推敲,你懂得。
“回形针PaperClip”的这条创意短视频策划非常及时、内容足够硬核、制作十分精良、讲述逻辑清晰、传播踩准节奏,成为爆款,水到渠成。
用心的产品,让人走心;非常用心的产品,自然分分钟成为社交媒体刷屏的爆款!
实际上,“回形针PaperClip”一直专注创意类短视频产品,资讯硬核,科普味儿十足,足以吊打很多没创意的机构媒体。
强调一点,当我这篇微信文章写到这里的时候,《人民日报》官方微信就转发“回形针PaperClip”的这条创意短视频。
今天还有一个瞬间引爆微信朋友圈的创意短视频,同样来自《人民日报》。这条名为《50万米高空看武汉,最近发生了什么》的微信于今天早晨639分经《人民日报》官方微信推送,也很快实现“10+”阅读量。
一组来自50万米高空的卫星图让受众直观了解到最近的武汉城市景观变化,暂时唱响“空城计”的武汉正在全力打赢一场抗“疫”阻击战。在该条微信末端,《人民日报》很有立场、很有态度地加了两行红色加粗的文字——“加油武汉!加油中国!”
数据新闻,瞬间看懂
当下,在信息传播方式、新闻业务逻辑和受众阅读兴趣不断变化的大趋势下,媒体融合已经步入改革深水区。放眼来看,各大媒体机构在积极“试水”一些突破传统生产方式和信息传播手段的新媒体内容产品。
“数据新闻”,正成为目前媒体融合趋势下的一大创新业务。
国外的纽约时报(New York Times)、金融时报(Financial Times)、彭博社(Bloomberg News)等知名媒体均有推出相关数据新闻产品。
中国大陆也有媒体开始涉足数据新闻业务,比如财新传媒、解放日报旗下的上观新闻、澎湃新闻、镝次元等。前年,备受全球媒体圈关注的2018年数据新闻奖(Data Journalism Awards, DJA)揭晓,这几天在武汉疫情报道中备受关注的财新传媒的财新数据新闻中心荣获“2018年度全球最佳数据新闻团队奖”,这也是中国媒体首度获得这一奖项。
实际上,国内外对数据新闻的产品形态没有一个绝对确切的说法。来自新闻业界和新闻学界的相关人士对数据新闻的定义可谓众说纷纭,但是唯一不变的理念就是致力于新闻信息的“可视化”表达,提升受众对新闻报道的阅读兴趣和新闻传播面。
这几天,国内多家新闻媒体/企业通过“数据新闻”形态实时推送“新型冠状病毒肺炎疫情”动态。全国、海外的确诊病例汇总,通过别样的制图/动图形式,让人一目了然。相较阅读文字,观看视频所获得的受众体验感,“数据新闻”更加直接,让人更加容易理解疫情进展。
这是澎湃新闻的数据新闻产品:
这是凤凰新闻客户端的数据新闻产品:
这是上观新闻的数据新闻产品:

这是一家企业(极海|GeoHey)的数据新闻产品,非常惊艳:

这是南方日报的数据新闻产品:
综编类资讯产品,一个也不能少
“综编类资讯产品”,这到底是什么形态?
回顾一下,我在昨日推送的微信文章里提到这么一段内容:这些天,战“疫”新闻满天飞,每个人的手机都在刷屏,新闻产品类型不外乎短消息、通讯、新闻图片、新闻海报、电视新闻、专题片、短视频、H5等,以及一些新媒体口径的微信文章。
“综编类资讯产品”,是我在此自己概括的一种产品形态。我是这么定义的:媒体机构基于本单位/其他媒体机构已公开报道的新闻信息,通过选题策划、信息梳理、内容汇编的形式,以图说或微信文章的方式集纳某个主题的信息,从而生成的一种新媒体产品。
还是用案例说话。近期,成都本地媒体《成都日报》官方微信于131日推出的《战“疫”·成都日记①》就属于一种“综编类资讯产品”。该产品的内容多属于集纳性,并非新鲜资讯,不过这类资讯产品让很多人很清晰地了解了成都过去几天抗“疫”的情况,信息脉络感很强。这种帮人们梳理新闻资讯的形式,非常好,让大家知道各级各部门在一些关键时间节点应对疫情的动作。
随后一天,也就是2月1日,“川报观察”APP也推出了《一图读懂丨分秒必争的四川战疫日志》的“综编类资讯产品”,采取“图说+数据”的形式进行内容呈现,让公众很快了解四川省级层面抗击疫情的系列举措。
内容硬核,才是真
纵观近期国内一些新闻媒体围绕新型冠状病毒肺炎疫情制作并传播的系列新媒体产品,有很惊艳业界的案例。 既然看了这么多案例,过去一些天、今天,以及未来一段时间都会持续刷到爆款新媒体产品,在此我有几点总结性的看法:
一、这一波疫情的报道,一些所谓的传统媒体其实在关键时刻非常硬核,一旦搞起新媒体产品,分分钟秒杀很多同行。比如,《人民日报》、新华社等。 二、其实,新媒体旧媒体的差异更多体现在外在层面,新、旧媒体的差异,主要在技术表现形式、信息获取渠道、资讯时效性上。任何时代的新闻媒体产品,内容才是最硬核的资本。所谓新媒体时代,绝对不是对过去那套优质新闻内容采集、生产、传播以及媒体品牌塑造的降维打击 三、牛逼的新媒体产品,往往非官方媒体机构制作,比如回形针PaperClip”星球研究所等。这些新媒体机构的一些全新形态的内容产品很多时候吊打一些官方媒体机构,原因何在?用心足够,不养懒人,追求卓越! 三、在媒体业态转变、行业利益调整、资讯无处不在、受众需求提升的时代,做新闻,就是做品牌。如何吸睛?这,成为各家媒体不得不考量的因素,毕竟,这已经不是一个媒体机构还在养懒人的时代。
原文链接:https://mp.weixin.qq.com/s/B_NIe9CkRaI6CcLAHATgIg
编辑:陈茗

微信图片_20200203005343.jpg (83.11 KB, 下载次数: 13)

微信图片_20200203005343.jpg
389#
 楼主| 发表于 2020-2-4 21:29:18 | 只看该作者
【案例】
工信部倡议:充分发挥人工智能赋能效用、协力抗击疫情

人工智能相关学(协)会、联盟、企事业单位:
  当前,打赢新型冠状病毒感染的肺炎疫情是最重要的使命任务。习近平总书记强调,做好疫情防控工作,直接关系人民生命安全和身体健康,直接关系经济社会大局稳定,也事关我国对外开放。在党中央国务院坚强领导下,社会各方面都在积极行动,为抗击疫情贡献力量。疫情防控急需就是动员令,就是冲锋号。在此,倡议进一步发挥人工智能赋能效用,组织科研和生产力量,把加快有效支撑疫情防控的相关产品攻关和应用作为优先工作。具体倡议如下:
  一是加大科研攻关力度,尽快利用人工智能技术补齐疫情管控技术短板,快速推动产业生产与应用服务。以需求为导向,鼓励人工智能企业和应用单位、上下游企业联合攻关,在疫情发现、预警、防治等方面积极做出应有贡献。人工智能产业创新重点任务入围揭榜企业更要将投身疫情防控技术支撑工作作为揭榜攻关的磨刀石和试金石。
  二是充分挖掘新型冠状病毒感染肺炎诊疗以及疫情防控的应用场景,攻关并批量生产一批辅助诊断、快速测试、智能化设备、精准测温与目标识别等产品,助力疫病智能诊治,降低医护人员感染风险,提高管控工作效率。
  三是着力保障疫期工作生活有序开展。开放远程办公、视频会议服务和AI教育资源,助力办公远程化、教育在线化和生产智能化,推动实施“居家能办公,停课不停学,停工不停产”。
  四是优化AI算法和算力,助力病毒基因测序、疫苗/药物研发、蛋白筛选等药物研发攻关。
  疫情当前,同心协力必能快渡难关。让我们以最大的工作热忱,以最快的响应速度,向最需要的地方研发和投放人工智能产品和解决方案,以实际行动做好这场疫情防控阻击战的技术保障工作!
  如有相关工作举措与建议,请及时与我们联系。
  联系电话:  68205234/5239/5249,  13581563677  邮箱:[email protected]
工业和信息化部科技司2020年2月4日




编辑:董莉

390#
 楼主| 发表于 2020-2-6 18:38:52 | 只看该作者
【案例】
2019年全球人工智能治理报告:从科技中心主义到科技人文协作

作者 | 曹建峰 腾讯研究院高级研究员

目录

(一)AI伦理和治理成基本共识,各界探索落地机制
1.中美欧采取不同的AI路径,创新与伦理平衡是AI治理关键
2.国际社会探索建立广泛认可的AI伦理原则,推进敏捷灵活的AI治理
3.科技行业日益重视AI伦理,但落地机制仍需探索行业共识

(二)细分领域监管持续推进,立法需合理平衡风险防范与发展诉求
1.欧盟探索AI算法分类分级监管机制,避免过度规制商业领域应用
2.深度伪造和合成内容引监管关注,立法防范风险同时留出发展空间
3.人脸识别引发法律和伦理争议,政策选项在于规范而非禁止
4.立法助推自动驾驶汽车落地,“城市空中出行”呼吁监管革新
5.人工智能赋能医疗健康产业发展,应用落地离不开监管革新

(三)展望:构建多层次的新技术治理体系,实现安全可信、负责任AI
1.构建多层次的治理体系,采取敏捷灵活的治理方式
2.立法和监管需充分考虑国际竞争、技术的经济社会价值等视角,推动先行先试
3.推动人工智能治理的跨学科参与和国际合作



作为有望引领第四次工业革命、重塑经济社会发展形态的新兴技术,人工智能(AI)已经成为了全球科技竞争的焦点。2017年以来,全球30多个国家(如美、中、日、德、英等)和地区(如欧盟)已出台了AI战略,抢占技术、应用和产业高地。[1]在此背景下,人工智能作为底层技术(如深度学习、强化学习)、功能性应用(如人脸识别、语音识别)和应用领域(如安防、交通、医疗)组成的产业生态系统,正从互联网领域加速扩张渗透到实体经济等诸多领域和各行各业,并与大数据、云计算、IoT等深度融合,推动经济社会数字化、智能化发展,并塑造新的经济和社会形态。我国作为全球最大的互联网市场,为人工智能的发展提供了肥沃的土壤,在数字世界与物理世界融合、人工智能与实体经济融合、从数字化到智能化转型等背景下,人工智能新技术给我国经济社会的高质量、可持续发展提供了前所未有的机遇,需要适宜的制度土壤来孕育面向未来的产业格局和国家竞争力。
但在另一方面,人工智能的广泛应用,也引发了社会各界对于人工智能的法律、伦理和社会影响的持续关注和激烈讨论,呼吁重视AI伦理,加强AI治理,践行科技向善,发展安全可信、负责任的人工智能。回顾2019年,AI伦理原则和AI伦理审查,以及AI算法决策、深度伪造和合成内容、人脸识别、自动驾驶汽车和“城市空中出行”(UAM)、AI医疗等细分领域监管,是全球人工智能治理的焦点话题,表明国内外对人工智能治理的持续高度重视。总结各国经验,对于人工智能需要采取多方主体共同参与的多元多层次治理模式,构筑适宜技术创新和产业发展的制度土壤来打造面向未来的科技引擎。

(一)AI伦理和治理成基本共识,各界探索落地机制
1.中美欧采取不同的AI路径,创新与伦理平衡是AI治理关键
全球来看,中美欧是AI领域的主要“玩家”,代表着不同的发展路径。互联网等数字技术发展薄弱、在数字经济领域显著落后于美国的欧盟,采取了更加侧重立法和监管的路径,其AI战略的三大支柱之一即是“建立与人工智能发展和应用相适应的法律和伦理框架”。[2]GDPR影响着全球个人信息保护立法,欧盟希望在AI立法和监管上也成为全球领导者。2019年欧盟不仅提出了系统性的伦理框架,而且开始酝酿人工智能相关立法,以2019年4月发布的《可信AI伦理指南》和《关于构筑对以人为本的人工智能的信任的通讯》等政策文件为代表。[3]但欧盟对立法和监管的过度强调,能否最终转化为其在AI技术、产业上的国际竞争力,是值得深入探讨的。另一方面,就像通过GDPR、数字税、互联网反垄断调查等一系列举措来限制美国大型互联网企业一样,欧盟希望通过AI政策提升其自身竞争力的意图也是不言而喻的。
相反,美国作为AI领域的领头羊,采取了轻监管、促创新的路径,以政策不阻碍AI技术和产业发展、降低创新的门槛和成本为优先考虑,并在发展过程中采取渐进式监管而非激进的监管,来应对新出现的问题。目前美国已在积极废除或修订交通、医疗等重点应用领域内限制、阻碍AI技术发展应用的既有监管规则。2019年2月,美国正式出台了AI战略,其中提出制定AI监管指南并设定AI治理标准。而且美国已提出了联邦政府参与、主导AI标准的系统性计划。[4]美国的国家人工智能战略虽然姗姗来迟,但表明了美国在人工智能领域维持并巩固其全球领导地位的决心,预计将采取一系列措施和行动。例如,为了推动实施美国AI战略,2020年1月美国联邦政府发布了《人工智能应用的监管指南》,要求联邦政府在针对人工智能技术和相关产业采取监管和非监管措施时,要以减少AI技术应用的障碍、促进技术创新为宗旨,《指南》同时提出了管理人工智能应用的十大原则,并呼吁更多采取行业细分的政策指南或框架、试点项目和实验(如为AI应用提供安全港)、自愿性的行业标准等非监管的措施。[5]因此可以预见,相比草率地推行强硬的立法和监管,未来美国的AI政策会更加侧重标准、指南等敏捷灵活的方式。
就我国而言,除了密集出台促进人工智能发展的产业政策之外,我国也已开始加强AI伦理、标准等方面的建设,《新一代人工智能治理原则——发展负责任的人工智能》回应了国际社会对我国不重视AI伦理和治理的质疑,国务院副总理刘鹤在2019年的重庆智博会上提出了发展智能技术需要坚持的四个原则并呼吁“科技向善”。未来在AI治理上,我国需要结合自身产业发展实际,遵循促创新、促发展的路径,同时采取多元化的方式防范技术的伦理风险,避免偏向欧盟的强监管模式,给技术创新和产业发展形成掣肘。

2.国际社会探索建立广泛认可的AI伦理原则,推进敏捷灵活的AI治理
国际层面,AI领域的竞争已从技术和产业应用扩张到了国际规则的制定,尤其是AI伦理和治理规则的制定。2019年5月,OECD成员国批准了全球首个由各国政府签署的AI原则——“负责任地管理可信AI的原则”, 包括包容性增长、可持续发展和福祉原则,以人为本的价值观和公平原则,透明性和可解释性原则,稳健性和安全可靠原则,以及责任原则。[6]这些原则已被G20采纳,今后有望成为AI领域的国际准则。
整体而言,从联合国的“AI向善国际峰会”(AI for Good Global Summit)和推动建立“AI伦理国际对话”的努力到OECD和G20人工智能原则,国际层面的AI治理已进入实质性阶段,初步确立了以人为本、安全可信、创新发展、包容普惠等基调,以及敏捷灵活的治理理念。
此外,根据WIPO的报告,科学知识和创新呈现出越来越全球化的趋势。[7]在此背景下,为了实现可持续发展目标,AI领域的国际合作尤其重要。所以需要包容性的、全球化的路径。我国需要积极参与、主导AI领域的国际治理和国际规则制定,输出AI伦理和治理理念,增强话语权。

3.科技行业日益重视AI伦理,但落地机制仍需探索行业共识
行业层面,互联网、人工智能等数字技术的影响日益广泛、纵深和复杂,对“科技向善”的呼吁已经成为行业共识。在此背景下,微软、谷歌、腾讯等国内外主流科技公司纷纷提出了各自的AI伦理原则,积极防范AI滥用风险并缓解AI应用可能引发的负面问题。例如,腾讯在国内率先提出“科技向善”理念,将其与“用户为本”一道作为新的使命愿景,并提出其人工智能研究与应用需要遵循的“四可”(可用、可靠、可知、可控)原则。[8]
但对于以什么样的方式和标准来落地AI伦理原则和要求,行业缺乏共识。伦理审查委员会作为科技行业开始探索的一种机制,目前存在较大争议。2019年3月,谷歌成立了外部顾问性质的AI伦理委员会,但由于引发了较大争议,不久之后便予以解散。2019年谷歌子公司DeepMind也遣散了其AI医疗部门的伦理审查委员会。微软则成立了内部的AI伦理委员会,旨在制定内部政策,确保其AI业务和AI平台符合其核心价值和原则并造福社会。在我国已在组建国家科技伦理委员会的大背景下,科技行业在制定AI伦理原则之外,还需要探索更具体的举措,让伦理原则真正落地到AI研究与应用活动中,对技术和产业发展形成正向引导和规范。

(二)细分领域监管持续推进,立法需合理平衡风险防范与发展诉求
1.欧盟探索AI算法分类分级监管机制,避免过度规制商业领域应用
AI算法自动化决策系统在数字内容分发、在线广告、电子商务、金融等领域的广泛应用,可以提高决策的效率、准确性或者避免人类决策者自身可能怀抱的偏见,但也引发了社会各界对歧视、隐私、安全等问题的关注。我国和欧盟、加拿大等已在通过立法对这些问题予以回应。
我国的《数据安全管理办法》《个人信息安全规范》《网络信息内容生态治理规定》等立法,针对定向推送、算法推荐、个性化展示、信息系统自动决策提出了要求,规范算法系统的应用。[9]例如,对于定向推送或个性化展示,要求标明“定推”字样或通过不同的栏目、版块、页面分别展示,并提供退出选项和信息删除;开展定向推送活动禁止歧视、欺诈等;对于满足条件的信息系统自动决策,建立个人信息安全影响评估和用户投诉机制;个性化算法推荐体现主流价值导向,建立人工干预机制。
欧盟的《通用数据保护条例》(GDPR),从个人信息保护的角度,针对不存在人为干预的完全自动化决策(包括画像)作出了规定,但其赋予个人的拒绝权仅限于产生法律效果或类似重大效果的应用场景,而非针对所有的应用场景,因此并不约束新闻、广告等数字内容的算法推荐。其后,欧盟进一步调整监管思路,2019年4月发布的《算法责任与透明治理框架》提出建立分类分级监管机制,且不要求对算法进行公开或解释。[10]具体而言,在算法监管方面,分类即针对政府和公共部门使用的算法系统和商业领域的算法系统建立不同的监管,前者需要建立“算法影响评估”(algorithmic impact assessment)机制;分级即对于一般的商业算法系统采取事后追究法律责任的方式,但对于具有与政府和公共部门的算法系统应用类似的重大影响的商业算法系统可考虑建立“算法影响评估”机制。这种做法能避免给企业带来不成比例的成本和管理负担,有助于人工智能发展应用。
在算法透明方面,欧盟立法者认为,技术透明不等于“对算法的每一个步骤、算法的技术原理和实现细节进行解释”,简单公开算法系统的源代码也不能提供有效的透明度,反倒可能威胁数据隐私或影响技术安全应用。考虑到AI的技术特征,理解AI系统整体是异常困难的,对理解AI作出的某个特定决策也收效甚微。因此,对于现代AI系统,通过解释某个结果如何得出而实现透明,将面临巨大的技术挑战,也会极大限制AI的应用;相反,在AI系统的行为和决策上实现有效透明,会更可取,也能提供显著的效益。因此,考虑到人工智能的技术特征,GDPR并没有要求对特定自动化决策进行解释,而仅要求提供关于内在逻辑的有意义的信息,并解释自动化决策的重要性和预想的后果。除了监管之外,欧盟立法者认为,还应通过教育、新闻报道、揭秘等方式提高公众的算法素养。[11]
全球来看,“算法影响评估”机制得到了越来越多的讨论。除了欧盟以外,加拿大、美国等也在探索相关措施。例如,2019年2月5日加拿大出台的《自动化决策指令》(Directive on Automated Decision-making),将算法监管的重心放在了政府部门,《指令》针对政府部门在作出行政行为的过程中使用自动化决策系统(automated decision system),提出了算法影响评估、透明度(例如决策前通知、决策后提供解释、软件准入许可、公布源代码等)、质量保证(如测试和监测结果、数据质量、同行审查、员工培训、意外事故处置、安全、合规、人类干预等)、救济、报告等要求。[12]2019年4月美国国会议员提出的《算法责任法案》则要求针对符合条件的主体的高风险自动化决策系统,建立自动化决策系统影响评估机制(automated decision system impact assessment),评估自动化决策系统及其开发过程(包括系统的设计和训练数据),以评估其在准确性、公平、偏见、歧视、隐私、安全等方面的影响。[13]然而在现阶段,这一新倡议的“算法影响评估”机制在全球范围内存在巨大争议,仍有很多落地问题悬而未决,需要理性对待。

2.深度伪造和合成内容引监管关注,立法防范风险同时留出发展空间
深度伪造(Deepfake)和合成内容随着生成对抗网络(GAN)等机器学习技术的发展而出现,其最常见的方式是AI换脸,例如deepfake、face2face等技术,此外还包括语音模拟、人脸合成、视频生成等,这些技术统称为深度伪造。深度伪造及相关的AI技术在文娱、教育、医疗等诸多领域具有积极应用价值,如实现虚拟主播、替身演出、虚拟歌手、戏仿和自我表达(如AI换脸应用“ZAO”让普通人实现明星梦)、医疗数据生成等。但也给网络平台治理提出了新的挑战,主要表现为利用深度学习等AI技术制作高度逼真且真假难辨的图片、音频、视频等深度伪造内容来从事各种欺骗和欺诈活动,将网络攻击场景和信息安全问题带到一个全新的层面,如色情报复、敲诈勒索、假冒身份、散布虚假信息等,给个人和企业利益以及公共安全带来威胁。[14]而且深度伪造生成方法开源软件(如deepfake、face2face等)的增多,极大地降低了操纵、伪造音视频的门槛。报告显示,网上的深度伪造视频的总数比2018年12月翻了一番,达到近15000个,其中伪造的色情视频占比高达96%。[15]
美国最早对深度伪造进行规制,今年以来,美国尤其担心深度伪造对2020年大选和国家安全的影响,开始探索立法应对措施,防范潜在滥用风险。2019年6月,美国国会先后提出了《深度伪造责任法案》[16]和《2019年深度伪造报告法案》[17]。此外,美国的加州、德州、马萨诸塞州、弗吉尼亚州等也陆续推出了相关立法。这些立法提出的主要措施包括:
第一,划定应用边界,禁止政治干扰、色情报复、假冒身份等非法目的的深度伪造,否则可能构成刑事犯罪。例如,美国加州的法律草案规定,禁止在投票选举前60日内传播明知是伪造或合成的候选人视频,除非包含视频属于伪造的免责声明。美国得克萨斯州2019年9月1日生效的一项法案将在选举前30日内制作、散布深度伪造视频意图伤害候选人或影响选举结果的行为,认定为刑事犯罪。此外,美国弗吉尼亚州2019年7月1日生效的反色情复仇修正法案,将“制作、传播虚假的裸体或性视频、图像”意图胁迫、骚扰或恐吓他人的行为,认定为刑事犯罪。《深度伪造责任法案》规定,利用深度伪造技术实施数字冒名顶替行为也应视为假冒身份行为。
第二,设置披露义务,要求制作者、上传者以适当方式披露、标记合成内容,例如采取嵌入数字水印、文字、语音标识等方式。《深度伪造责任法案》规定,利用深度伪造技术合成虚假内容放置于网络上传播的,制作者应当采用嵌入数字水印、文字、语音标识等方式披露合成信息。违反披露义务的制作者或者恶意删除披露信息的行为人需承担民事责任,行为恶劣、造成严重后果的还会面临罚金、人身监禁等刑事处罚。
第三,加强技术攻防,呼吁开发检测识别技术和反制技术。《深度伪造责任法案》要求成立深度伪造特别小组,其职责包括研究开发针对包括深度伪造在内的图像、音视频操纵技术的检测识别和反制技术、为研究此类技术的其他政府部门提供行政和科学支持、与私营企业或学术机构合作开发检测识别工具等。此外,《2019年深度伪造报告法案》要求美国国土安全部(DHS)定期发布关于深度伪造技术的评估报告。
我国相关立法也开始关注深度伪造问题,制定中的《民法典人格权编》《数据安全管理办法》以及已出台的《网络音视频信息服务管理规定》《网络信息内容生态治理规定》等都作出了相应规定,侧重人格侵权和内容安全。[18]具体包括:禁止利用信息技术手段伪造的方式侵犯他人的肖像权和声音;针对自动合成的信息内容标明“合成”字样;禁止利用深度伪造等新技术从事禁止性活动。
从国外监管趋势来看,规范深度伪造和合成内容的应用,需要政府、企业、公众、用户等多方主体共同参与,在分类分场景监管之外,还可采取制定行业公约和技术标准、研发视频鉴伪和溯源技术、提高公众的警惕防范意识和数字素养等多元化的方式,同时鼓励行业探索更多有益运用场景,引导技术向善发展,提振产业发展信心。未来需要加强源头治理,构建以制作者的标注、标记义务为核心的治理机制,同时鼓励发展应用鉴别对抗技术。
在源头治理方面,如前所述,当前美国的做法主要是要求制作者、上传者对深度伪造内容进行标注,从而从源头上对深度伪造进行规范。这一源头治理的做法具有合理性,因为没有标注的深度伪造内容一旦传播出去之后,第三方就很难鉴别,检测技术的开发、成熟也面临着诸多困难,而且难以跟上深度伪造技术进化的步伐,所以开发溯源技术并进行源头标记是最有效的措施。此外,考虑到行业内当前还没有通用的、高准确率的视频鉴伪网络,相应的鉴伪技术也都尚在初步阶段、还有很长一段路要走,所以美国并未强制要求平台对用户上传的或第三方的视频是否属于“深度伪造”或“自动合成”进行检测识别,并以此为由要求平台承担责任,因为这将给企业带来不成比例的管理负担和成本。
在技术对抗方面,当前谷歌、Facebook、腾讯等国内外主流科技公司都开始通过多种举措,发展甄别深度伪造和合成内容、对抗深度伪造技术滥用的方法和工具,包括:构建并开放深度伪造数据集,为研究、开发检测识别技术提供基准;支持、发起深度伪造检测挑战赛,与行业携手推动检测技术的研究与开发;开发深度伪造检测识别和标注工具;培训专门的合成内容审查人员,加强对视频内容的真实性审核。可见,面对人工智能等新技术的潜在风险,行业内越来越重视自律性质的风险管理措施。

3.人脸识别引发法律和伦理争议,政策选项在于规范而非禁止
2019年,人脸识别技术广泛应用,从设备解锁、刷脸核身、刷脸支付到安检、安防、犯罪侦查等,在带来效率、便利并增进社会福祉的同时,也不断引发歧视偏见、隐私保护、个人自由、伦理边界等诸多争议。例如,Facebook因使用照片自动标记功能而招致的潜在赔偿额高达350亿美元的人脸识别集体诉讼,可能改写美国隐私诉讼要求有形损害的规则,无形损害也可作为提取隐私诉讼的理由。据悉,Facebook已同意和解该案,将向原告支付5.5亿美元和解费。此外,2019年8月瑞典数据保护机构针对当地一所高中利用人脸识别记录学生出勤的行为,开出了GDPR生效以来的第一张人脸识别罚单,认为学校的数据收集行为违反必要性原则且缺乏正当性依据。我国也出现了相关诉讼,郭兵诉杭州野生动物世界被认为是国内人脸识别第一案。
随着相关争议的不断发酵,美欧开始推进人脸识别立法,尝试为政府部门使用人脸识别技术建立较高的法律门槛。2019年以来,美国已有多个城市(如旧金山、萨默维尔以及奥克兰)禁止政府部门使用人脸识别技术;美国国会提出了《商业人脸识别隐私法案》,要求使用人脸识别技术前须获得终端用户的“明确同意”(affirmative consent)。[19]然而,美国个别城市的“保守”的态度引发了美国 商会(CTEC)的担忧,CTEC认为过早禁止人脸识别技术将阻碍技术的利用和创新,并会冲击相关产品市场。[20]为此,2019年12月CTEC起草了《面部识别政策原则》(Facial Recognition Policy Principles),期望协助政策制定者在平衡技术与隐私的前提下制定监管提案,建议国会在减少面部识别技术相关风险的基础上,确保人脸识别技术能得到安全开发和有效监管。
英国对人脸识别技术的态度较为理性,在R (Bridges) v The Chief Constable of South Wales一案中,英国高等法院判决认为警方对实时人脸识别技术(LFR)的使用是合法的;英国信息专员公署(ICO)发布的《关于执法部门在公共场所使用实时人脸识别技术的建议》则呼吁政府针对实时人脸识别技术的部署和使用,建立强行性的规则和较高的法律门槛,充分平衡各方利益,即执法部门必须提供充分的证据来证明在每一个特定的场景下使用人脸识别技术是严格必需的、有效的且符合利益平衡原则和比例原则的。[21]此外,欧盟也在推进制定人脸识别技术的特殊监管规则,例如2020年1月被媒体泄露出来的欧盟人工智能监管政策白皮书中已针对人脸识别技术提出了潜在监管方案,其中一项即为“在评估人脸识别技术影响的方法和风险管理措施被开发出来之前,可能会暂时(3-5年)禁止在公共场所使用该项技术”。[22]
在国内,AI换脸应用“ZAO”收集人脸信息、人脸识别技术进课堂、北京地铁拟利用人脸识别技术对乘客进行分类安检等争议性事件引发社会各界激烈讨论。从实时人脸识别到分析步态、预测情绪的AI系统,技术快速进化,给监管提出更多挑战。结合国外监管趋势来看,科学理性的政策选择在于规范而非禁止,明确合法性依据和合规要求是应有之意。政策制定者应当看到人脸识别的积极价值,在权衡利弊的基础上对其进行适度监管和规范,在人脸识别技术的发展上寻求科技创新与隐私保护的“最大公约数”,而非一刀切地予以禁止或者放任不管。更进一步而言,鉴于人脸作为个人生物识别信息的敏感性,人脸识别技术的妥善应用需要明确技术应用的法律和伦理边界,建立法规标准。一方面需要针对不同的应用场景配置不同的监管要求,明确人脸识别技术应用的合法性依据和利益平衡、比例原则等问题;另一方面需要消除算法系统中的歧视和偏见,以合理平衡个人权利保护、公共利益和产业发展。就我国而言,行业的健康有序发展离不开标准和规范的支持,我国目前已在制定人脸识别国家标准,确保人脸识别系统功能、性能及安全要求,保障算法与应用的准确率,引导技术健康发展。

4.立法助推自动驾驶汽车落地,“城市空中出行”呼吁监管革新
当前,全球多国已将发展自动驾驶汽车技术上升为国家战略,通过立法、标准、技术指南、伦理准则等全方位举措加速推进其应用落地。[23]2019年是自动驾驶汽车从测试逐步走向商业化应用的一年,谷歌旗下自动驾驶技术公司Waymo等行业领头羊开始推出自动驾驶出租汽车服务,立法和监管政策也在加速这一发展趋势。例如,美国加州已于2018年允许自动驾驶汽车客运服务试点项目。2019年6月,美国佛罗里达州制定的自动驾驶立法,不仅将在道路上操作自动驾驶汽车合法化,而且提出了“自动驾驶汽车共享网络”这一全新的客运交通服务,为自动驾驶汽车的应用普及奠定了坚实的法律基础。在美国国家层面,在去年未能最终通过自动驾驶汽车法案之后,2019年美国国会继续推动相关立法,以期通过法律和监管创新来加速自动驾驶汽车的商业化发展。2020年1月美国交通部发布的《自动驾驶汽车政策4.0:确保美国在自动驾驶汽车技术上的领导地位》(Ensuring AmericanLeadership in Automated Vehicle Technologies: Automated Vehicles 4.0)在过去发布的三版自动驾驶汽车政策指南的基础上,系统提出了美国政府对于自动驾驶汽车技术的监管原则,表明了美国大力推动自动驾驶汽车技术发展落地、抢占国际制高点的决心。[24]
就我国而言,在2018年出台的《智能网联汽车道路测试管理规范(试行)》允许路测之后,各地已在出台推动智能网联汽车应用落地的政策。2019年9月,《上海市智能网联汽车道路测试和示范应用管理办法(试行)》的出台,使得上海成为了国内首个为企业颁发智能网联汽车示范应用牌照的城市,并推动测试牌照区域互认。北京、广州、长沙、武汉等城市已允许载人、载物、编队行驶等测试情形,例如2019年12月13日北京出台《北京市自动驾驶车辆道路测试管理实施细则(试行)》,允许载人及载物测试、编队行驶测试等。智能网联汽车向商业化和市场化迈进了一步。长远来看,我国自动驾驶汽车技术和产业的发展普及需要在安全标准、道路测试、商业试点、高精地图、责任保险等多方面配套推进政策措施,并积极废除或修改阻碍自动驾驶汽车发展应用的既有法规和标准,才能确保在制造业与ICT融合的自动驾驶汽车领域抢占全球高地。
此外,以电动垂直起降航空器(eVTOL)为核心的未来“城市空中出行”(UAM)也呼吁监管革新。未来交通领域的变革不限于自动驾驶汽车,商用的电动垂直起降航空器(eVTOL),即所谓的“飞行汽车”,也已成为美欧的重点布局。目前Uber Elevate、Airbus、Lilium、Volocopter等航空制造商已在尝试推出“空中出租车”服务。城市交通未来将有更大的想象空间,到2030年城市空中出行行业的市场价值有望达到79亿美元。美欧已在从无到有地建立城市空中出行监管,需要解决很多监管挑战,如设备设计认证、适航管理等。2019年7月,欧洲航空安全局(EASA)出台了针对小型VTOL航空器操作的特殊规定,针对这类新的飞行设备建立了基本的监管框架。美国FAA也在推进制定合适的安全立法,并已于2019年4月就无人机送货服务向谷歌子公司Wing颁发了第一个适航认证。eVTOL作为新生事物,在我国存在诸多监管障碍和法律空白。长远来看,为了应对eVTOL带来的监管挑战并推动其应用普及,需要加快建立eVTOL设计和操作的监管框架,并可考虑建立一套以UAM为核心的新体系,兼顾安全、公共利益和行业发展诉求。

5.人工智能赋能医疗健康产业发展,应用落地离不开监管革新
在医疗健康领域,人工智能正被广泛应用于医学影像、辅助诊疗、疾病预测、药物研发、健康管理等,有望变革医疗健康行业。全球医疗市场对“AI医疗”的需求巨大,据IDC统计,到2025年人工智能应用市场规模将达到1270亿美元,其中医疗健康行业将占市场规模的五分之一。
但AI医疗的发展面临着AI医疗设备准入和审批、医疗数据库建设与共享、责任承担、隐私保护等诸多问题。美国、日本、印度、新加坡等已在探索制定促进AI医疗服务应用落地的法律和监管规则。例如,由于AI技术可不断利用新获取的数据来精进算法,AI模型的自主性、适应性和持续迭代成了监管难点,给传统的医疗设备监管框架提出了挑战,因此美国FDA已为AI医疗设备提出了新的监管框架,从而允许AI医疗设备在获得审批、投入市场之后不断迭代改进。[25]
就我国而言,2019年6月发布的《深度学习辅助决策医疗器械软件的审评要点及相关说明》进一步明确了AI医疗设备的审批标准。可以预见,AI医疗领域的市场准入、数据共享与数据安全、责任承担等问题将极大影响产业走向,呼吁监管革新。一方面,AI医疗分级监管与审批已成为国际趋势,在行业发展探索阶段,对部分风险较小的细分领域加快审批速度,优先发展,有利于提供更多实践经验。另一方面,我国丰富的医疗数据资源亟待整合,加快数据平台建设实现医疗数据的结构化与标准化,构建医疗数据分享与利用机制,可能成为我国下一阶段AI医疗发展的重要优势。

(三)展望:构建多层次的新技术治理体系,实现安全可信、负责任AI
人工智能的健康可持续发展离不开良好治理,良好治理旨在实现安全可信、负责任的人工智能。未来AI技术可能变得更加强大,出现所谓的强人工智能和超人工智能。我们需要管理好比我们自身更大甚至更强(例如现阶段的人工智能在某些领域已经超过了人类)的AI技术,最大程度地释放AI技术在社会、经济、环境等各方面的巨大价值,并将其风险和危害控制在最低限度。未来对AI技术的良好治理需要着重考虑以下三点。

1.构建多层次的治理体系,采取敏捷灵活的治理方式
多层次的治理体系比单一维度的立法和监管更能适应人工智能所具有的快速发展迭代、日益复杂化等特征。顶层的法律规范可以划定技术应用的边界。在基本理念上,立法需要避免统一的、一刀切式的、激进的监管方式,而应以领域细分和风险防范管理为导向,遵循包容审慎、敏捷灵活、鼓励创新等监管理念,同时考虑不同应用场景的不同影响、监管对技术和产业的影响、技术和商业可行性、企业负担等因素,采取分类分级、分阶段的方式进行适度监管。
此外,由于技术及商业模式快速发展迭代,草率的立法不可能期待会产生正面的效果,而且成文或专门的立法恐难跟上技术步伐,故应避免过于严格和过于细致的法律要求,而是可以采取事后监管、事后追责等轻监管的方式。中层的行业和企业自律也将发挥重要作用,需要鼓励践行科技向善、负责任创新与研究等理念,支持行业自律。具体而言,可以采取行业标准、自律公约、最佳实践做法、技术指南、伦理框架等敏捷灵活的治理方式来规范、引导人工智能的发展应用,实现科技向善。[26]底层的教育和意识培养同样不可或缺,一方面需要提升社会公众的数字素养、算法素养等技术素养;另一方面需要针对技术人员和从业者开展伦理教育,使其做到自律。

2.立法和监管需充分考虑国际竞争、技术的经济社会价值等视角,推动先行先试
在当前激烈的国际竞争背景下,我国针对人工智能等新技术的立法和监管需要着重考虑国际竞争视角,避免产生阻碍、延缓技术发展应用的不利效果,削弱我国的科技和产业竞争实力。因为在全球竞争重心日益转向人工智能等新技术的大背景下,过早或过度的监管都可能削弱一国在AI领域的竞争力。与此同时,立法和监管还应充分考虑技术的经济社会价值,保证技术红利在经济社会发展中的最大释放,避免因偶发性的负面问题而“过度反应”或“因噎废食”,从而采取应激、激进的监管措施。
此外,我国正在密集推动人工智能创新发展试验区建设,自动驾驶、5G、大数据等领域也在涌现发展示范区,人工智能与实体经济融合也已成国家重要布局;这些前沿科技领域的发展和应用落地往往需要突破既有的法律和监管壁垒。因此有必要在这些领域出台更包容新技术的政策和立法,探索制定前瞻性规则,移除法律和监管障碍,推动先行先试,给予适度宽松的发展空间,给AI应用提供安全港(safe harbor),通过试验、测试、试点等方式加速AI从研发到商业落地的转变,同时审查、调整政策、监管框架和评估机制以鼓励创新和竞争。

3.推动人工智能治理的跨学科参与和国际合作
面向未来,AI等新技术的健康发展离不开技术、社科、人文等不同背景的人员的通力协作。科技行业需要从当前的技术中心主义模式转向技术人文协作模式,AI研究与发展需要广泛吸纳不同种族、性别、文化和社会经济阶层以及不同领域(如经济、法律、哲学、社会学、人类学、心理学等等)的人员的思考和顾虑。监管也需要采取多利益相关方共同参与的模式,广泛听取行业主体、专家和公众的意见,避免决策者与从业者脱节。此外,在当前的全球化背景下,一个可持续发展的地球也需要各国在AI技术、产业、伦理、治理等各方面加强合作,从而让人工智能实现以人为本的、包容普惠的、安全可持续的发展。


原文链接:https://mp.weixin.qq.com/s/lgB1-gcArjoZwObuf6hW1g



编辑:董莉

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表