传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
401#
 楼主| 发表于 2020-3-2 20:51:18 | 只看该作者
【案例】人机融合智能指控系统的瓶颈——休谟之问

原文作者:白驹  
原文来源:人机与认知实验室

【编者按:人机融合智能中的机并不创造事物,它只能执行我们本身了解如何去做的事情,属于现实性的Being;而其中的人则是创造事物之源,Ta不但能够明辨是非把握方向还可以想象未知探索不确定性,属于可能性的Should。同时,智能指挥控制系统的基本机理也与此有关:如何从大量客观事实数据/信息中提炼出需要的价值来呢?今天,让我们了解一下这些应用的根源——休谟之问的来龙去脉吧!】

一、休谟问题的由来

    以前的一些哲学家认为,道德可以像几何学或代数学那样论证其确定性,但是,休谟指出,对于道德问题,科学是无能为力的,科学只能回答“是什么”的问题,而不能告诉我们“应该怎样”的问题。他在《人性论》中写道:“在我所遇到的每一个道德学体系中,我一向注意到,作者在一个时期是照平常的推理方式进行的,……可是突然之间,我却大吃一惊地发现,我所遇到的不再是命题中经常的‘是’与‘不是’等连系词,而是没有一个命题不是由一个‘应该’或一个不‘应该’联系起来的。这个变化虽是不知不觉的,却是有极其重大的关系的。因为这个应该或不应该既然表示一种新的关系或肯定,所以就必需加以论述和说明;同时对于这种似乎完全不可思议的事情,即这个新关系如何能由完全不同的另外一些关系推出来的,也应当举出理由加以说明。不过作者们通常既然不是这样谨慎从事,所以我倒想向读者们建议要留神提防;而且我相信,这样一点点的注意就会推翻一切通俗的道德学体系……”。尽管休谟自己没有明确回答自己提出的问题,但它的意思却是否定的,即从“是”中不能推出“应该”。
     严格说来,休谟问题并非指事实与价值的关系问题,而是指事实命题与价值命题的关系问题,由于事实命题一般以“is”为系词,而价值命题一般以“should”为系词,所以休谟问题又称“实然与应然问题”,人机融合智能指控系统的本质也是这个实应然分类的问题。

二、“是”如何推导出“应该”

    由“是”推导出“应该”,必须分两步来完成:

1、由事实关系的“是”可以推导出价值关系的“是”。事实关系的“是”反映了“客观事物”的状态、特性及其规律性;价值关系的“是”反映了“客观事物对于人的价值”的状态、特性及其规律性。显然,“客观事物对于人的价值”本身就是一种“客观事物”,只是前者比后者更为复杂多样、更为变幻莫测,因为“客观事物对于人的价值”不仅取决于客观事物的品质特性,而且还取决于主体的品质特性和介体的品质特性等众多因素。也就是说,“客观事物对于人的价值”是由众多简单的“客观事物”按照一定的组合规则(即是否有利于人的生存与发展)有机地组合而成的复合事物。由此可见,价值关系的“是”是由众多事实关系的“是”按照一定的组合规则(即是否有利于人的生存与发展)复合而成,或者说,价值关系是事实关系的“函数”。实际上,价值就是直接或间接的有序化能量,就是按照主体的生存与发展的需要有机地、有序地组合起来的能量,即价值是能量的“函数”。对人而言,价值就是事物或事实的重要状态,而机反映的常常是(数据等的)事实状态,人机初级融合智能就是联系“事实”态与“价值”态的关系。

2、由价值关系的“是”可以推导出价值关系的“应该”。 当事物的状态与特征只是单一性的、确定性的和清晰的时,对于该事物的状态与特征就可以用“是”来描述;当事物的状态与特征是多值性的、概率性的、模糊性的时,对于该事物可以运用多值函数、概率论和模糊数学等方法,取其中具有最先(易)出现的、最大概率的、最相似的状态与特征确定为“应该”来描述,即“应该”是具有最先(易)出现的、最大概率的、最相似的“是”。人的一切行为和思想都是为了追求可持续的利益最大化或可持续的价值最大化,价值关系的“应该”是指所有价值关系中具有最大价值率的那一种价值关系,即价值关系的“应该”是从众多价值关系的“是”之中选取具有最大价值率的那一种价值关系的“是”。总之,“应该”是由众多“是”所组成的函数并取其极大值或最大值,对人机融合智能指控系统而言就是(要把握)最重要“价值态”的发展趋势——“价值势”。

三 、“事实命题”如何推导出“价值命题”

     由事实命题推导出价值命题,必须分两步来完成:

1、由事实命题可以推导出价值概念。事实命题是关于事实关系的描述方式,事实关系就是指客观事物之间客观存在的、不以人的意志为转移的相互联系与相互作用;在所有事实关系中,存在一种特殊的事实关系,它体现了人类主体与客观事物之间的的相互作用,它就是能够维持和促进人类主体的有序化进程的动力源—广义有序化能量(即价值),对于这种特殊的事实关系最基本的描述方式就是价值概念。也就是说,价值概念是由众多事实命题按照主体的有序化进程为规则所组成的“函数”。对于人机融合智能而言,一个价值概念可以有两个坐标轴判定,一个是事实轴,涉及时、空、属性、物理、逻辑等客观现实方面,另一个价值轴,涉及心理、艺术、关系、伦理、非逻辑等主观可能方面。其内涵外延常常在这两个坐标轴决定的坐标系中千变万化,从而构成了璀璨多彩的智能世界和眼花缭乱的指控情境。

2、由价值概念可以推导出价值命题。以人机工效学意义的价值概念为基础,可以推演出一个最重要的、最基础的、最普遍的价值命题:人机融合的一切行为和思想都是为了追求可持续的利益最大化或可持续的价值率最大化,再根据这一命题可以推演出所有人机环境系统工程领域的价值命题,因此由价值概念可以推导出所有价值命题。也就是说,价值命题是由价值概念按照不同的事实命题的要求取其极大值或最大值,人机融合智能指控系统就是要通过价值命题的实现来达到目标任务的。

     总之,人机融合智能指控系统的价值命题是由众多事实命题按照主体的有序化进程为规则所组成的函数并取其极大值或最大值。


休谟问题问题讨论

综上所述,可以得出两个结论:

1、“应该”为系动词的复杂命题是由众多“是”为系动词的简单命题按照一定的逻辑规则(是否有利于主体的生存与发展)有机地组合起来的函数或复合函数,并取其中的极大值或最大值的“是”作为“应该”,即“应该”是一种特殊的“是”,由“是”完全可以推导出“应该”。

2、“价值命题”是由众多“事实命题”按照一定的逻辑规则(是否有利于主体的生存与发展)组合起来的函数或复合函数,并取其中的极大值或最大值的事实命题,即“价值命题”是一种特殊的“事实命题”,由“事实命题”完全可以推导出“价值命题”。

       由此,休谟问题似乎可以解决。但是以上的论证者忽视了一个非常重要的问题——那就是价值的多重性、相对性以及随机性。

     首先,说说价值的多重性。事实上,正如函数往往有多个最大值一样,“有价值”的结果往往也不止一个。很多时候,我们并不能证明谁更有价值,就像我们无法证明,玫瑰花和月季花谁更有价值。有些事实是截然相反的,但他们的价值却是一样多。很多时候,我们只能做出一个选择,但我们并不能判断哪个选择更好。事实上我们无法回答“应该是什么?”的问题。就好比说,假如你现在有一块钱,你是应该用它来买包子,还是应该买油条呢?

     其次,再来说说价值的相对性。众所周知,每个人心目中的价值函数并不相同。同一件事物,对不同的人,其带来的效用并不相同。例如雨天,有利于农民,却不利于赶路的人。那么下雨这件事情,到底是应该发生,还是不应该发生呢?既然对于每个人,效用函数都各不相同,那这个所谓的“最大值”又该如何求得呢?有人可能要说,“应该把所有人的价值函数加总之后,求一个最大值。”但是,这种简单相加的笨办法,其实根本是没有任何道理的。如果一件事情能给一个人带来500块钱,而使另外九个人每人损失1元钱,总价值增加了,但这种事情是“应该做”的么?显然很荒唐!实际上,伦理学道义中的“义”就是“应该”的意思。

     再次,我们再来说说价值函数中的随机性。了解数理统计的人都知道,任何模型,都需要在其模型中设置一个随机误差项,用于表示这个模型中的随机变量。我们往往假定这一项是同方差和正态分布的,但事实上并非如此。随机误差项的异方差性和非正态性,会严重影响函数的估计的效果,使得因变量的值不再是一个无偏差估值。那么,由此函数估计的“最大值”的结果,又有多少可信度呢?所以,这个所谓的“最大值”,其实根本算不出来。

     由此可见,由于人机融合智能指控系统价值函数自身的多重性和相对性,休谟问题其实还是无法得到解决!

休谟问题重要意义

    不难发现,休谟问题(即“是”与“应该”的关系问题)实际上集中反映了事实与价值的关系问题,集中反映了自然规律与社会规律的关系问题,也集中反映了自然科学与社会科学的关系问题,因此彻底解决休莫问题将会对自然科学与社会科学的发展产生十分巨大的影响。

1、为社会科学全面走向自然科学铺平了道路。价值问题是社会科学所要解决的核心问题,价值理论是整个社会科学的基础理论,休莫问题的解决可以帮助人们从“事实”角度看“价值”,从能量角度定义价值,有利于实现价值理论的统一化、数学化和自然科学化,最终实现社会科学的同一化、数学化和自然科学化,从而为最终消除社会科学中普遍存在的主观性、歧义性和模糊性奠定基础。

2、把唯物主义彻底贯彻到了精神领域(特别是情感领域)。长期以来,休谟问题把自然科学与“精神科学”彻底隔离开来,使唯心主义思想长期占据精神科学领域,学术界普遍认为:精神科学(如道德科学)与自然科学完全独立,价值判断只是一种主观意识、根本无法被科学确证;自然科学受普遍而必然的永恒自然规律制约,而精神科学的规则总是约定俗成的;自然科学的历史发展是不以人的意志为转移的,而精神科学可以为人类所规划;自然科学强调的是一种说明,而精神科学主要强调理解,前者强调的是一种因果关系的揭示,后者则讲究一种体验。休谟问题的解决可以帮助人们认识到,人类社会是自然界的物质运动形式,社会规律是自然规律的复杂表现形式,精神科学是自然科学的复杂表现形式,完全可以从自然科学的基本公理中推导出来,这就为唯物主义彻底贯彻到精神科学领域扫除了障碍。但是,需要注意的是,休谟问题至今尚未真正得到解决,人机融合智能指控系统研究同样也举步维艰,很难被突破攻克。

    正因为“价值”是相对的,因人而异的,所以这一问题也永远不可能真正得到解决,这一点已经在上面作出了论述。机械唯物主义者虽然想把唯物主义贯彻到精神领域,但这是永远也不可能做到的。因为精神和物质,在本质上是完全不同的东西,一个是主观,一个是客观。就如同怀疑论者经常使用的“桶中脑实验”(英国哲学家普南(Putnam)提出,有的版本也翻译为“缸中脑”)描述的那样。我们对于这个世界的认识,其实完全只是一种主客观的混合判断,这种判断和真实的“客观世界”是否一致,我们永远也不可能知道。(虽然某些机械唯物主义者总喜欢用“无数次的实践”来证明主观与客观理论上最终能达到这种一致性,但实际上,“无数次的实践”是不可能做到的。)

后记

     为什么美军人机融合智能指控系统“深绿系统”不好用?并常常被指挥员们所诟病,其关键在于它只试图用数据Being解决事实问题,而忽略了用意识Should 解决价值问题。若进一步问“人、机、环境系统是怎样失调的?”、“为什么会失调呢?”……就会涉及到休谟之问这种更深层次的机制机理问题……

人工智能并不创造事物,它只能执行我们本身了解如何去做的事情……
编辑:吴悠

402#
 楼主| 发表于 2020-4-9 16:48:09 | 只看该作者
【案例】
不用开口,AI将大脑活动转化为文本,单句错词仅3
继喉咙皮肤震动就能读出想说的话之后,阅读大脑思想再往前进一步,即使不用说话,AI系统就能将大脑活动转化成文本内容。
目前,该系统已经可以检测到有人大声说话时的神经模式,离最终目标的实现还有很长一段距离,但是专家表示,最终成型的系统可以帮助无法说话或打字的患者,例如患有一些症状的患者,进行交流。
加州大学旧金山分校Joseph Makin博士及其他研究者在《自然神经科学》杂志上发表了研究,文章揭示了他们如何通过招募四名将电极阵列植入其大脑中以监测癫痫发作的参与者开发这一系统的。Joseph Makin表示:“这可能是‘语言假肢’的基础。”
实验参与者被要求多次朗读50个固定句子,比如“蒂娜·特纳是流行歌手”和“那些小偷偷走了30件珠宝”,研究者们跟踪了他们讲话时的神经活动。这些数据随后被输入到机器学习算法中,系统能将每个口述句子的大脑活动数据转换为数字字符串。
为了确保数字仅与语音方面有关,系统将根据大脑活动数据的小块预测的声音与实际记录的音频进行了比较,然后将数字字符串输入用来转换为单词序列的系统的第二部分。
万事开头难,开始时系统会显示不少废话,但当系统将单词的每个序列与实际朗读的句子进行比较时,通过不断改善,从而了解了数字串与单词之间的关系以及哪些单词趋于彼此相连。团队接下来对系统进行了测试,仅从语音过程中的大脑活动生成书面文本。
系统并不完美,“那些音乐家很合拍”被解释为“菠菜是著名的歌手”,而“一卷电线躺在墙上”变成“威尔宾会戴黄色百合花”。但是,新系统的准确性远远高于以前的方法, 尽管准确度因人而异,但对于一名参与者,平均每个句子仅需要纠正3%的单词,高于专业人类笔录者5%的单词错误率。但是,团队担心该算法仅能处理少量句子。
Makin说:“如果使用50个句子之外的单词,解码会变得很糟糕。”他补充说,系统可能依赖于学习特定句子,从大脑活动中识别单词以及识别英语一般模式的组合 。
研究小组还发现,根据一个参与者的数据对算法进行训练意味着最终用户需要的训练数据更少,这可以减少对患者的繁琐训练。
马斯特里赫特大学的专家Christian Herff博士没有参加这项研究,他认为这项研究很有意思,因为系统只为每个参与者使用不到40分钟的训练数据,并且句子的收集数量有限,而不是需要几个小时的数百万数据。“这让他们达到了迄今为止尚未达到的准确性水平。”
但是该系统尚不能用于许多严重残疾的患者,因为该系统依赖于大声说出句子的人记录的大脑活动。他说:“当然,这是一项了不起的研究,但是那些人也可以使用'OK Google就好了',这不是思想的翻译,而是言语中涉及的大脑活动。”
Herff说,人们现在还不必担心别人会读懂他们的想法,这必须要植入大脑电极,而想象中的语音与内在的声音大不相同。
谢菲尔德大学脑机接口专家Mahnaz Arvaneh博士认为,现在考虑道德问题很重要。她说:“我们距离机器能够读懂我们的思想的距离仍然非常非常遥远。但这并不意味着我们不应该考虑它,我们也不应该计划它。”
相关报道:
来源:微信公众号大数据文摘
链接:https://mp.weixin.qq.com/s/A1zKwAo6-FNbo7XAV9_qYw
编辑:宋婷
403#
 楼主| 发表于 2020-4-9 19:07:37 | 只看该作者
【案例】
前沿综述丨人工智能——使能技术、赋能社会
●人工智能专题●
Engineering2020年第3期“人工智能”专题发表了13篇关于人工智能研究方面的论文。
人工智能(AI)是一门研究难以通过传统方法去解决实际问题的学问之道。一般而言,人工智能的基本目标是使机器具有人类或其他智慧生物才能拥有的能力,包括感知(如语音识别、自然语言理解、计算机视觉)、问题求解/决策能力(如搜索和规划)、行动(如机器人)以及支持任务完成的体系架构(如智能体和多智能体)。
AI具有增强任何领域的技术的潜力,是类似于内燃机或电力的一种“使能”技术。人工智能这一种使能技术被广泛应用于其他众多领域。此外,人工智能可以为农业、制造、运输和医疗保健领域的特定技术提供支持。
未来几年,人工智能对人类生活各方面将产生难以想象的巨大影响。人工智能可以为人类社会提供帮助并赋能社会。实际上,当人工智能被用于帮助我们积极改变社会时,它的影响将是最大的。
本专题从理论研究、算法模型、实践方法论和伦理道德等多方面报道了近年来对AI的再思考成果。
潘云鹤院士提出了人工智能多重知识表达机制,它由知识图、视觉知识和深层神经网络组成,这一表达方法有利于可解释、可进化和可迁移模型的知识表示和推理。
李发伸教授等介绍了如何解释机器知识。他们通过对物理学和人工智能领域的一些研究方法的分析,提出了用于解释机器知识的原理和模型。
为了达到使人工智能造福人类社会的长远目标,政府、研究机构和企业公布了人工智能的伦理准则和原则。吴文峻教授等对这些内容进行了调研,并重点介绍了中国取得的初步成果。
脑科学为深度学习等人工智能领域带来了突破性进展,但人工智能与人类智能之间仍存在着不可逾越的鸿沟。戴琼海院士团队提出了缩小这一差距的思路,并讨论了将脑科学用于人工智能所存在的机遇和挑战。
陈怡然教授等总结了深神经网络(DNN)加速器设计的最新进展,并讨论了支持DNN执行的各种架构。
雷娜和顾险峰教授等提出了对深度学习的几何理解,并介绍了生成对抗网络(GAN)的最佳传输(OT)视图。OT理论可以帮助发现GAN中生成器与判别器之间的内在协作而非竞争关系,以及发生模式崩溃的根本原因。
自然语言处理(NLP)是人工智能的一个子领域,致力于使计算机能够理解和处理人类语言。周明研究员和沈向洋博士等从建模、学习和推理三个角度回顾了基于神经网络的NLP框架(neural NLP)的最新进展,并简要概述了神经NLP的未来发展方向。
随着人工智能和深度学习技术的飞速发展,确保实际部署算法的安全性和鲁棒性变得至关重要。任奎教授等介绍了对抗攻击技术理论、算法和应用等内容以及防御技术方面的若干研究成果。
荣国光博士等总结了人工智能在生物医学中的最新应用,包括疾病诊断、生活辅助、生物医学信息处理和生物医学研究。
深度学习的最新进展主要基于“大数据、小任务”这一数据驱动范式,朱松纯教授等提出了“小数据、大任务”的范式,仅用较少训练数据去解决多种任务。他们提出了最新突破的常识模型,来阐明“小数据、大任务”这种新范式的潜在力量。
卢策吾研究员等讨论了通用智能代理的概念:一种可以像人类一样适应各种不同任务的系统,其架构受到通用计算机的启发。他们还针对这一架构提出了基本流模型和操作基元,用以描述并有效地模拟人类的操作技能和行为。
为了在人工智能研究中引入因果推理,况琨博士等学者从不同侧面介绍了因果推理的模型和方法。
目前,新一代人工智能(AI 2.0)正在蓬勃发展,大数据智能、群体智能、跨媒体智能、人机混合增强智能和智能自主系统在其中扮演了重要角色。人工智能这一使能技术的下一步突破将来自多学科交叉内禀,本专题也是对新一代人工智能(AI 2.0)发展的有益深入思考。
在此,笔者要感谢各位审稿人及时、专业的评论。最重要的是,笔者要感谢所有向本专题投稿的作者。有了他们的支持,本专题才得以成功。笔者也非常感谢吴飞教授、杨强教授、韩亚洪教授和况琨博士以及编辑部的大力支持。同时,也感谢中国工程院信息与电子工程领域颠覆性技术战略研究课题组提供的热情支持。
本期“人工智能”专题的文章有:
(可扫描二维码查看文章相关内容,且本刊网站提供文章中/英文全文PDF下载)
AI的多重知识表达
Multiple Knowledge Representation of Artificial Intelligence
潘云鹤
全文阅读二维码(如下)
如何解读机器知识
How to Interpret Machine Knowledge
李发伸,李廉,殷建平,张勇,周庆国,况琨
全文阅读二维码(如下)
通用智能本体
The General-Purpose Intelligent Agent
卢策吾,王世全
全文阅读二维码(如下)
人工智能的下一步突破——多学科交叉内禀
The Next Breakthroughs of Artificial Intelligence: The Interdisciplinary Nature of AI
庄越挺,蔡铭,李学龙,罗先刚,杨强,吴飞
全文阅读二维码(如下)
从脑科学到人工智能
From Brain Science to Artificial Intelligence
范静涛,方璐,吴嘉敏,郭雨晨,戴琼海
全文阅读二维码(如下)
因果推理
Causal Inference
况琨,李廉,耿直,徐雷,张坤,廖备水,黄华新,丁鹏,苗旺,蒋智超
全文阅读二维码(如下)
深度神经网络加速器体系结构概述
A Survey of Accelerator Architectures for Deep Neural Networks
陈怡然,谢源,宋凌皓,陈凡,唐天琪
全文阅读二维码(如下)
神经自然语言处理最新进展——模型、训练和推理
Progress in Neural NLP: Modeling, Learning, and Reasoning
周明,段楠,刘树杰,沈向洋
全文阅读二维码(如下)
医疗保健中的人工智能——综述与预测性案例研究
Artificial Intelligence in Healthcare: Review and Prediction Case Studies
荣国光,Arnaldo MendezElie Bou Assi,赵博,Mohamad Sawan
全文阅读二维码(如下)
中国的人工智能伦理原则和治理技术发展
Ethical Principles and Governance Technology Development of AI in China
吴文峻,黄铁军,龚克
全文阅读二维码(如下)
“暗”,不止于“深”——迈向认知智能与类人常识的范式转换
Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike Common Sense
朱毅鑫,高涛,范丽凤,黄思远,Mark Edmonds
全文阅读二维码(如下)
深度学习中的对抗性攻击和防御
Adversarial Attacks and Defenses in Deep Learning
任奎,Tianhang Zheng,秦湛,Xue Liu
全文阅读二维码(如下)
深度学习的几何学解释
A Geometric Understanding of Deep Learning
雷娜,安东生,郭洋,苏科华,刘世霞,罗钟铉,丘成桐,顾险峰
全文阅读二维码(如下)
改编原文:
Yue-Guang Lyu. Artificial Intelligence: Enabling Technology to Empower Society [J]. Engineering,2020,6(3).
作者介绍
吕跃广,电子信息技术专家,中国工程院院士。现任中央军委科学技术委员会常任委员,国家人工智能科技重大专项战略咨询委员会委员。
长期从事光电信息处理和电磁信号测量等方面的研究工作,主持完成了我国多型科学实验卫星系统的研制和多项国家重大科研项目攻关,有力推进了我国空间对地观测、电磁频谱控制等相关领域的发展进步。
作者:吕跃广
来源:中国工程院院刊
链接:https://mp.weixin.qq.com/s/DJkGR4vT9_kL_4NZq9yyBA
编辑:宋婷
404#
 楼主| 发表于 2020-4-9 21:54:22 | 只看该作者
【案例】
郭锐|人工智能伦理风险管理依然是世纪难题|AI抗疫的乐观与理性
郭锐|中国人民大学法学院副教授,未来法治研究院研究员,社会责任和治理研究中心主任,研究包括公司法、金融法、人权法、人工智能伦理与治理等,担任全国信息技术标准化技术委员会人工智能分技术委员会委员、全国标准化委员会人工智能总体组社会伦理研究负责人,参与了中国第一个以人工智能标准化为主题的白皮书(《人工智能标准化白皮书(2018)》)的写作并撰写“安全、隐私和伦理”部分,并主持撰写了国家标准委人工智能总体组《人工智能伦理风险研究》报告 (20195月发布)
自新冠肺炎疫情发生以来,国内数家人工智能企业将最先进的技术应用于抗疫,多人体温快速检测、智能健康问答、肺部图像分析、基于人工智能的防疫方案等技术解决方案纷纷涌现。
其中,公众对人工智能驱动的健康登记最有体会。在杭州等城市,居民持有经过健康登记的二维码出入小区、公共场所,健康状态根据个人行动轨迹、接触人群自动更新。
在国际上,不少国家也将最新的人工智能技术用于疫情防控。韩国政府抗疫的经验是大规模检测、追踪和隔离冠状病毒患者,其中追踪患者所依赖的就是通过人工智能系统对监控录像、智能手机的位置数据和信用卡消费记录的数据处理找出患者的活动地点并确立病毒传播链。意大利伦巴第当局则通过人工智能系统分析市民手机传送的位置数据和他们每天通常行走的距离来确定有多少人遵守政府的封锁令。以色列政府基于人工智能系统使用手机位置数据的缓存来精确寻找可能的冠状病毒患者。
在为新技术助力防控疫情感到欣喜的同时,我们必须关注人工智能可能的伦理风险。这里所说的伦理风险,不限于因技术尚不完善导致的负面后果,而是与技术本身的特征和它可能产生的深远影响相关。[1] 人们常见的担心是,政府在防控疫情的名义之下使用了人工智能系统来阻止病毒传播,可能会带来隐私信息泄漏、更多的政府滥权等结果。
但是,对人工智能伦理的反思不限于直接的风险。如果是技术尚不完善,其负面后果还可以通过完善技术加以解决;如果是因人工智能技术本身的特征带来的伦理问题,则需要更深入的探讨。
人工智能的伦理风险管理是世纪难题
China Sustainability Tribune
相比以往的技术,人工智能技术的独特之处就在于它的自主性。这种自主性或来自技术本身,或来自应用的过程中社会赋予它的角色。换言之,人工智能可能超越传统意义上的工具属性,也可能“参与”人的决策。此处说的参与“决策”,并不限于让人工智能直接进行决策,也包括它的应用对人们的观念、行为与相应的社会关系的改变。
20世纪重要的思想家之一、法国哲学家米歇尔·福柯(MichelFoucault)认为,技术不仅仅是工具,或者不仅仅是达到目的的手段。福柯强调了作为“工具”的技术和参与“决策”的技术之间的区分。“全景敞视监狱”(或称圆形监狱)的设计,不仅仅是提供了一种监视方式而已,而是深刻地改变了监视者和被监视者的心理认知,故此也改变了社会关系。
在另一位法国哲学家雅克•埃吕尔(Jacques Ellul)的眼中,技术参与人的决策最直接的表现是它对效率的追求。埃吕尔提出在当代技术已经成为一个系统:技术不再是工具或机械而已,在15世纪到19世纪的工业、政治、科学、科技革命之后,技术已经弥漫在现代思想、生活的每个层面,让一切都能被测量、提升和商品化。[2]
上述分析思路,在人工智能技术的语境下尤其值得借鉴。实际上,这也是人工智能的伦理风险得到全球各国关注的缘由。2019年,全球各国达成一项基本共识,就是将人工智能的负面影响视为伦理风险。中国在2019年发布了《人工智能伦理风险分析报告》,在这一国际讨论中做出了贡献。
从伦理风险的角度来应对人工智能给社会带来的挑战,使人工智能产生的负面后果可以在严格的风险管理系统中进行识别、预防和管理。这意味着在人工智能系统的研发和应用生态中各个主体,包括研究机构、行业领域的科技企业和科技工作者都承担相应的风险管理角色并且各负其责、共同协作。对社会而言,当可能的负面后果能够防控,社会才能对人工智能产生信任。人工智能的伦理风险管理,毫不夸张地说,已是一个亟待求解的世纪难题。
人类对风险认知的非理性和局限性
China Sustainability Tribune
应当看到,风险管理的提出固然为控制人工智能的负面后果指明了方向,我们还必须注意潜在于其中的某种乐观的、进化论式的科学主义的认知局限。现代社会较之前传统社会面临的风险大大增加了,一定程度上源自于科学主义倾向。以贝克、吉登斯、拉什为代表的风险社会理论家看到,现代社会的风险有别于传统社会局部性、个体性、自然性的外部风险,呈现出全球性、社会性、人为性等结构性特征。高度的现代化往往带来高度的风险性。
文化人类学家玛丽•道格拉斯警告,应对风险等主流方法的内在局限也在于其科学主义倾向:风险被看作是客观的、可计算、进而可预防的,而文化因素被排斥在风险研究之外。应当看到,在当代社会某些风险被人们广泛认知和重视,而其他的风险却被忽略。当现代社会以科学、理性的名义对风险进行选择与排序时,上述基本事实并未改变。
换言之,现代社会的风险的认知有其强烈的、未被承认的主观性。这种主观性体现在行为经济学家所看到的社会对风险认知的非理性,如美国孙斯坦教授在《风险与理性》中所批评的。[3] 但更深层次的主观性,则是我们的“理性”的局限:无论作为个体还是社会,人的偏见无处不在、无法避免,这必然导致对人们赖以评估风险的所谓理性体系的质疑。
如华东师范大学社会发展学院人类学研究所黄剑波教授所言:“限于观察力、感情动机或者信息不透明,人们不可能洞察所有风险,更加不可能将所有备选决策和结果一一列出。因此,没有人能够认识所有的风险,人们仅仅能够根据所知的基础来选择风险和安全,对风险的认识几乎将必然落入片面狭小的空间中。”[4]
对风险的主观性的承认,并非风险管理的“阿喀琉斯之踵”。恰恰相反,这种承认可以帮助我们深化对技术产生的风险的认知。玛丽•道格拉斯的洞见是,风险根植于人的观念世界中,表达的是社会对危险的集体信念与价值。当一种风险产生,我们可以去追溯的除了技术、经济等缘由,更应当深入到它所反映的伦理秩序的危机中。         
人类恐惧的是人工智能对创造秩序的颠覆
China Sustainability Tribune
对人工智能而言,这种危机或许可以称为“创造秩序危机”。大部分人对探讨人工智能伦理的必要性的认知,来自对机器智能这一未知事物的恐惧。
在艺术史上,反映这一恐惧最著名的形象是“弗兰肯斯坦”(英国作家玛丽·雪莱长篇小说主角)——一个在雷电中诞生的人和机器结合的怪物。对这些强大却并不良善的力量,社会本能地感到恐惧,因为我们害怕我们所创造的最终带给我们毁灭。人工智能会不会和“弗兰肯斯坦”一样危及作为技术创造者的人类?改变这一创造秩序,将完全颠覆人所能想象的社会秩序,这是人们感知到风险的根本缘由。
站在一场技术革命的入口处,人类所恐惧的是秩序的颠覆:伊甸园中的亚当和夏娃被魔鬼描述的分辨善恶树的果子所诱惑,上帝的创造秩序因此被颠覆。如果说人类对人工智能的恐惧不是因为机器做出某个不利于人的决策,而是机器代替人决策这件事情本身,那么我们也许可以看到人工智能伦理最深层的问题是对创造秩序的颠覆:人类面对被自己创造的技术反噬的可能性。
换言之,人们将人工智能的负面后果看作是风险,本身体现了我们对世界的应然性的想象可能遭遇的挫败。
面对一个被自己创造的技术颠覆的可能性,人类不得不重新面对一系列的问题。当我们思考对人工智能伦理风险的治理,必须谨慎对待技术对个人自我认知、人际关系、政治秩序的改变。我们要特别关注人工智能技术在应用中潜藏的“简单化”的进路。
有了人工智能技术,商业和公共决策者似乎可以将社会以一种更为清晰的方式呈现在眼前:人们的偏好可以用大数据描述,众人的选择可以越来越精准地预测。但这种清晰化的预测往往难以避开算法设计中的错误、疏忽和歪曲以及数据记录、统计中不同程度的不准确和缺失。当大数据为公共决策提供了广阔的样本依托时,社会生活中的人也逐渐被简化为统计学意义上的“人”,其主体性在无限的样本容量下被不断削弱,这为某些算法的滥用、算法歧视的产生铺平了道路。
人工智能不是一个可预测的、完美的理性机器,它会拥有人类可能拥有的道德缺陷,受制于人们使用的目标和评估体系。对人工智能的使用故此少不了对人性和社会本身的审视——谁在使用,为了什么而使用,在我们的世界中扮演着怎样的角色?数据是谁给的,训练的目标是谁定的?我们期望中的人工智能决策会与我们自己的善恶选择一致吗?
人工智能抗疫须警惕伦理风险
China Sustainability Tribune
抗疫事关重大,应用于其中的人工智能技术固然并不完美,但我国民众对此表现出巨大的宽容。媒体报道多起居民遇到健康码出问题的事件,其中受影响的居民总是耐心地等待和配合。在新加坡、韩国、以色列和欧美一些国家,在抗疫期间对隐私信息的获取总体上也得到了民众的支持。
但是,应当看到,人工智能技术本身带来的伦理风险仍在。这其中既有直观的短期风险,如隐私信息的保护问题、算法存在安全隐患、算法偏见导致歧视性政策等,也有相对间接的长期风险,如人工智能对个人隐私、产权、竞争、就业甚至社会结构的影响。尽管短期风险更具体可感,但长期风险所带来的社会影响更为广泛而深远,同样应予重视。[5]
在抗疫紧急状态结束之后,人类仍然必须面对这一世纪难题。
- END -
参考文献:
[1] 关于人工智能伦理风险的相关内容,参见《人工智能伦理风险报告》(国家标准委人工智能总体组,20195月), 中国电子技术标准化研究院网站,http://www.cesi.cn/201904/5036.html
[2] Ellul, Jacques. The Technological Society. New York: Knopf,1967.
[3] 孙斯坦:《风险与理性》,中国政法大学出版社,2005年。
[4] 黄剑波、熊畅:《玛丽·道格拉斯的风险研究及其理论脉络》,《思想战线》2019年第4期。
[5] 更多的讨论,见《人工智能伦理风险报告》,前注1
来源:人大未来法治研究院
作者郭锐
链接:https://mp.weixin.qq.com/s/L7xXtcH95TCTNZfYeaL8Iw
编辑:宋婷
405#
 楼主| 发表于 2020-4-17 00:29:48 | 只看该作者
【案例】
微软“爱写作”公众号上线:英文写作的AI私教
“听说读写”是英语学习的四大核心要素,而“写”可谓是英语学习中最考验学习者综合语言运用能力的一项。对很多学生来说,除了写作技巧,行文中的语法问题常常不自知,更不要提灵活使用“高级”词汇和句式了。很多时候学生们即使想多做练习,却奈何没有一个随时随地可以帮忙指导、批改的专业人士,而私教则需要支付昂贵的费用。对英语老师来说,日常工作中最大的工作量就是批改作文,每篇文章即使逐字阅读、改错和点评,也很难做到一对一的详细指导。尤其在网上提交作业时,学生们五花八门的手写文章照片,更是加重了老师们的工作量…
由微软亚洲研究院开发的个性化英语学习助手微软小英,致力于用 AI 技术帮助用户解决“听”和“说”的难题。对于“写”的问题,微软亚洲研究院在2018年将“作文打分”功能嵌入了微软小英,并在去年年底对该功能全面升级,推出了微软“爱写作”网页版。
近日,微软“爱写作”公众号正式上线,基于微软亚洲研究院在自然语言处理、OCR(光学字符识别)等领域的多项最新研究成果,以及微软小英多年的技术积累,“爱写作”打造了四大亮点:语法检查、词语替换、分类作文打分和手写图片识别,不仅是学生学习的好帮手,也是老师的“智能助教”。它可根据不同年级的作文标准,从语法到用词、文章结构,全面且便捷地帮助小初高学生、成人培训学习者,以及四六级、雅思、托福、考研的备考者提升英文写作水平。
关注“爱写作”公众号(微信号:aimwriting)或者扫描文章下方二维码,添加微软“爱写作”公众号。“爱写作”网页版也同步升级各项功能。
网址:https://aka.ms/zuowen
语法检查:知其然,知其所以然
语法检查是作文批改中最基本的核心功能。在日常学习中,不少学生经常面对艰深的语法难题堕云雾中。对此,“爱写作”在快速完成全文语法检查的同时,会将提交作文中的语法问题用红色下划线标记出来。学生只需点击红线,就能获得有针对性的语法讲解,并且还可以看到修改后的正确表达,作为参考,让学生们不仅知错就改,而且知道如何去改。
尽管语法检查是一项基本功能,但其背后的技术支撑却并不简单。“爱写作”的语法检查功能采用了微软亚洲研究院此前提出的全新的学习和推断机制Fluency Boost Learning and Inference(流畅度提升学习与推断),帮助用户“找茬”。通过 Fluency Boost Learning(流畅度提升学习)生成的大量纠错数据,结合seq2seq 预训练技术(相关论文:https://arxiv.org/abs/1909.06002),“爱写作”的语法纠错模型在CoNLL-2014 JFLEG 两个权威语法纠错数据集上都率先超越了人类参考水平,并且持续保持着业界领先的技术水准。
词语替换:“高级”词汇信手拈来
有过英语学习经验的人大概都有过这样的体会,老师经常会说“还有没有更高级的词可以用在这里?”“什么词更高级?”确实,在英文写作中替换一个单词或短语,可以马上起到点睛的作用。然而在初学时,很多学生背了不少单词,却仍然不能根据不同语境灵活使用“高级”的词汇。
针对这一问题,“爱写作”的词语替换功能可以根据上下文筛选出多个高级词汇供用户选择使用。针对某个特定的词或短语,“爱写作”可以自动关联三个同义词作为备选,让用户不再只会用“good”、“nice”这样的简单词汇,而是能够看到更多的如“impressive”、“admirable”这样更复杂的词汇,来进行替换。
在词语替换功能中,微软亚洲研究院的研发人员提出了基于预训练语言模型的词替换方法(相关论文:https://www.aclweb.org/anthology/P19-1328.pdf),并结合微软原创的预训练语言模型——UniLMhttps://github.com/microsoft/unilm)作为词替换的解决方案。该方法通过半遮盖(partialmasking)等策略让预训练语言模型能够同时考虑原目标词词义以及上下文语境,从而选出合适的替换词。
分类作文打分:个性化评分,覆盖8大考试类型
作文打分是很多学生都十分关心的环节,分数固然重要,但分数背后的信息更重要。基于此前微软小英“作文打分”功能和“爱写作”网页版积累的丰富经验,升级后的“爱写作”作文打分功能更加强大,不仅可以对所有文章进行一般性评分,还可以测试同一篇作文在不同考试类型中的得分状况。因为不同的考试在词汇、语法、文章结构、连贯性、切题程度等维度上对作文有不同的考量标准,所以“爱写作”在给出分数的同时,还可以有针对性地评价一篇作文在上述这些维度上的表现,并给出反馈建议,以便学生更好地进行自我提升。目前,“爱写作”支持小学、中考、高考、四级、六级、考研、托福、雅思共八大英语考试类型。
其实,作文打分本是一种主观行为,要转化为机器打分,则需要大量有标注的数据才能准确打分,而且还需要将作文精确对应到10分还是20分,亦或是15分。“爱写作”使用了微软亚洲研究院研发的序数回归模型(Ordinal Regression),大大减少了对标注数据量的依赖。该技术把“文章与具体分数的匹配”问题,变成了一个有序的比较大小的问题,在训练过程中,将已有的标注数据两两配对进行对比,进而形成新的文章与评分,再将此数据加入到标注数据集中,使得可用于训练的标注数据量呈指数级增加,从而整体提高了评分的准确性。
作文打分的方向和维度
手写图片识别:分分钟将手写文章转化成电子文档
不少学生在日常的英文写作练习和学习中,都会将作文写在作业本、卷子、练习册上。那么如何让 AI 批改这些手写的作文呢?
这也难不倒“爱写作”。只需用手机给作文拍照并上传,“爱写作”就能分分钟将其转换成可用智能终端进行编辑的文字,语法检查、作文打分、词语替换等等作文批改功能全部轻松实现。而且,老师们也可以借助此功能,轻松识别学生们各不相同的手写字体,方便完成作文批改工作。
微软亚洲研究院研发的微软新一代 OCR 引擎为“爱写作”中的手写识别功能提供了强大的技术支撑。微软新一代 OCR 引擎像“鹰眼”一样,可以有效地检测出图像中的各类文字,还可以同时支持打印体和手写体的复杂文字场景识别。
除了上述四大亮点,“爱写作”还支持中英文双向的查词功能和逻辑连接词的查找功能,用户再也不需要退出应用到专门的词典里进行查询了,使用更加简便、高效。
他山之石可以攻玉:形成研发闭环
在“爱写作”开发期间,微软亚洲研究院的研发人员在与老师、学生、教育机构等用户和合作伙伴的互动过程中获得了相当多的灵感。所谓他山之石可以攻玉,用户一个小小的需求就可以给研发人员带来无限灵感。而这样的互动与反馈也同样体现在产品开发与科研工作之间。关于序数回归模型的学术论文(论文地址:https://ieeexplore.ieee.org/abstract/document/8682187),就是因为近距离地感知到了用户的需求和痛点,基于在微软小英产品开发过程中遇到的问题所撰写而成的,现在该技术又应用到了“爱写作”中,形成了技术应用与科学研究相互促进的完美闭环。这不仅让“爱写作”这样的产品始终能够采用最新的 AI 技术,也让研究更加贴近用户。
未来,语法自动检查及纠正这一自然语言处理领域的经典任务将在英语写作之外的更多应用场景(如电子邮件、PPT 演示文稿、翻译文件等文档撰写)中大显身手,更智能地帮助人们在写作中规范语言使用,并与其他自然语言处理技术以及更多人工智能领域的技术一起为辅助人们进行内容创作带来更多便利。为了实现“爱写作”致力于帮助用户写出更好的英文文章的目标,微软亚洲研究院的研发人员也将在多个方向上进一步提升,把更多前沿的 AI 技术融入“爱写作”,为用户提供更加个性化、便捷的英文写作辅助服务。
作者:微软亚洲研究院
来源:微信公众号:微软研究院AI头条
编辑:冯梦玉

406#
 楼主| 发表于 2020-4-17 20:37:27 | 只看该作者
【案例】
全国首例机器人自动撰文侵权案 AI写稿也有著作权
  近日,记者从深圳市南山区人民法院获悉,该院审结了全国首例人工智能生成文章侵权案件,为腾讯公司诉网贷之家网站转载机器人自动撰写的文章作品涉嫌侵犯著作权案。法院判决网贷之家网站赔偿腾讯公司1500元人民币。
  腾讯开发了一款名叫Dreamwriter计算机软件,可以自动写稿,生成文章,每年大约写稿30万篇。一家名为网贷之家的网站,转载了腾讯证券网站上人工智能自动生成的文章,被腾讯公司以侵权为由,告上法庭。这篇文章发表于2018820日,标题为《午评:沪指小幅上涨0.11%2671.93 通信运营、石油开采等板块领涨》,末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。
  “这篇文章主要经历数据服务、触发和写作、智能校验和智能分发四个环节生成,著作权归本公司所有,被告的行为侵犯了原告的信息网络传播权并构成不正当竞争。”腾讯公司称。
  “关键在于涉案文章是否具有独创性。”南山区法院认为,首先,是否独立创作及外在表现上是否与已有作品存在一定程度的差异;其次,生成过程是否体现了创作者的个性化选择、判断及技巧等因素,是否属于著作权法意义上的创作行为应当考虑该行为是否属于一种智力活动,以及该行为与作品的特定表现形式之间是否具有直接的联系。
  法院表示,文章对相关股市信息、数据的选择、分析、判断,文章结构合理、表达逻辑清晰。Dreamwriter软件在技术上“生成”的文章,均满足著作权法对文字作品的保护条件,是原告主持创作的法人作品。
  因此,法院认为被告侵害了原告享有的信息网络传播权,应承担相应的民事责任。因被告已删除文章,法院判决被告赔偿原告经济损失及合理的维权费用人民币1500元,目前该案一审判决已生效。
  “自人工智能技术开始应用在新闻撰写、绘画、诗歌写作等领域后,有关人工智能生成物的著作权问题一直争议颇多。”南山区法院相关负责人表示,这一案件明确了人工智能生成物的独创性判断步骤,并在如何看待人工智能生成物的创作过程以及相关人工智能使用人员的行为能否被认定为法律意义上的创作行为的问题上做出了探索,是全国首例认定人工智能生成的文章构成作品的生效案件,对于今后同类型案件的审理有一定的借鉴意义。
该负责人表示,将文学、艺术和科学领域内具备独创性的人工智能生成物认定为作品并进行著作权保护,符合著作权法激励创作的立法宗旨,有利于激励人们主动利用人工智能来进行创作,也有益于人工智能产业的良性发展。
作者:陈熊海
来源:南方日报
编辑:冯梦玉

407#
 楼主| 发表于 2020-4-19 20:58:16 | 只看该作者
【案例】

微软提出新AI框架MWSS,假新闻识别率优于最先进基准




如果该 AI 框架的准确率果真如研究人员所声称的那样,一旦投入生产,它将有助于阻断虚假和误导性信息的传播。
不久前,微软和亚利桑那州立大学的研究人员在预印本平台 arxiv.org 上发表了一项 研究论文,他们提出了一种人工智能框架:Multiple sources ofWeak Social SupervisionMWSS),利用参与度和社交媒体信号来检测假新闻。他们声称,经过在真实数据集上训练和测试,该模型在假新闻早期检测方面的表现优于一些最先进的基准。
如果该系统的正确率真的如作者声称的那样,一旦投入生产,它将有助于阻断虚假和误导性信息的传播,这些信息涉及美国总统候选人和其他有争议的话题。布鲁金斯学会(Brookings Institute)在 2018 年进行的一项 调查 发现,57% 的美国成年人在 2018 年大选期间曾遇到假新闻,19% 的人认为假新闻影响了他们的投票决定。
该论文的共同作者解释说,学术文献中的许多假新闻分类器依赖的信号需要很长时间才能聚合,这使得它们不适用于假新闻的早期检测。此外,有些分类器仅仅依赖于信号,而这些信号容易受到有偏见或不真实的用户反馈的影响。
相比之下,他们的新系统从多个来源进行监督,包括用户和他们各自的社交活动。具体来说,它利用少量手动标签的数据和大量弱标签的数据(即带有大量噪声的数据),用于元学习人工智能框架中的联合训练。
一个名为 Label Weighting NetworkLWN)的模块,对调节假新闻分类学习过程的弱标签的权重进行建模,将研究人员所指的内容作为一个实例——例如 (新闻片段)以及标签作为“输入”。它为“表示对”输出一个代表重要性权重的值,该值决定了该实例在训练假新闻分类器时的影响。为了在不同的弱信号之间共享信息,共享特征提取器与 LWN 一起工作,来学习共同的表示方法,并使用函数将特征映射到不同的弱标签源。

微软人工智能框架与各种基准模型的性能对比图。

微软研究人员利用开源的 FakeNewsNet 数据集对他们的系统进行了基准测试,该数据集包含新闻内容(包括正文等元属性),并带有来自事实核查网站 GossipCop PolitiFact 的专家注释的标签,同时还包含了社交背景信息,如有关该新闻文章的推文。他们使用 13 个来源的语料库对系统进行增强,其中包括英国主流新闻媒体,如英国广播公司(BBC)和天空新闻(Sky News),以及俄罗斯新闻媒体的英文版,如 RT Sputnik,内容大多与政治有关。
为了生成弱标签,研究人员测量了分享新闻的用户的情感评分,然后确定这些得分之间的差异,这样,情绪差异很大的文章就会被注释为假新闻。他们还生成了一组具有已知公众偏见的人群的数据,并根据用户的兴趣与这些人群的匹配程度来计算得分,其背后的理论是,有偏见的用户分享的新闻更有可能是假新闻。最后,他们根据社交媒体上的元信息对用户进行聚类,以此来衡量用户的可信度。这样一来,那些形成大型聚类的用户(这可能表明是僵尸网络或恶意活动)的用户就被认为可信度较低。
在测试中,研究人员表示,性能最好的模型结合了 Facebook RoBERTA 自然语言处理算法,并针对干净和弱数据的组合进行了训练,在 GossipCop PolitiFact 中检测出假新闻的正确率分别为 80% 82%
该团队计划在未来的工作中探索其他技术,如获得高质量的弱标签的标签校正方法。他们还希望对这个框架进行扩展,以考虑来自社交网络的其他类型的弱监督信号,利用参与的时间戳。
当然,这些研究人员并非唯一试图利用人工智能来阻断假新闻传播的人。
在最近的一项研究中,麻省理工学院计算机科学与人工智能实验室开发 了一种人工智能系统,可以识别误导性的新闻文章。去年年底,Jigsaw 发布了 Assembler,这是一款为媒体机构提供的人工智能假新闻识别工具套件。AdVerif.ai 是一个软件即服务的平台,去年推出了 Beta 测试版,它分析文章中的错误信息、成人内容、恶意软件和其他有问题的内容,并交叉引用一个定期更新的数据库,其中包含数千条假新闻和合法新闻。就 Facebook 而言,它已经 试验 了部署人工智能工具来“识别账户和假新闻”。


作者: Kyle Wiggers
译者: Sambodhi
来源:微信公众号:AI前线

编辑:冯梦玉

408#
 楼主| 发表于 2020-4-24 16:32:41 | 只看该作者
案例
首发译文 | 美国加州《人脸识别法》草案中译本全网首发 | DataLaws

编者按:
人脸识别技术的合法性边界已经成为了全球法律界关注的重点,事实上,各国都已纷纷启动相关立法,中国也非常有必要启动人脸识别的专门立法。
2018年加州消费者隐私法》(CCPA)授予消费者对企业收集或出售(如定义)的、与其有关的个人信息(如定义)的各种权利,包括要求企业删除指定的消费者个人信息的权利。加州《人脸识别法》要求提供人脸识别服务的处理者,包括提供应用程序编程接口或处理者,选择的其他技术能力,使控制者或第三方能够对该等人脸识别服务进行合法、独立及合理的测试,以确定不同亚群之间面部识别的准确性和不公平的性能差异(如定义)。本法案还将要求控制者(如定义),在公众场合部署人脸识别服务时,应提供醒目、内容得当的通知,包括人脸识别服务部署的目的等具体要素。本法案要求控制者在获得当事人的同意后,才能在公众场合使用的人脸识别服务中登记个人肖像或面部模板,除非控制者登记的个人肖像或面部模板是出于安保或安全目的。加州《人脸识别法》授予个人关于控制者在公众场合使用的人脸识别服务中登记个人肖像或面部模板的确认权、删除权(出于上述安全和安保目的的情况除外)、撤回权以及纠正或质疑出于安保或安全目的登记的权利。加州《人脸识别法》要求成立州或地方公共实体机构,该机构正使用或拟开发、采购人脸识别服务,或者通过人脸识别服务生成有关使用该服务的报告,包括该系统的责任报告。本法案要求机构投入人脸识别服务使用前至少90天向公众明确传达最终通过的问责报告,发布在机构的公共网站上并提交目前尚未明确的机构。该机构应在其公共网站上公布提交的每份问责报告。。本法案要求上述报告中包含特定要素,包括人脸识别服务的名称、供应商和版本,以及对其一般功能和限制的描述。加州《人脸识别法》要求,除其他事项外,使用人脸识别服务的机构如作出对个人产生法律效力或对个人产生类似重大影响的决定(如定义),应确保该等决定遵守有意义的人工审查要求,且定期培训所有运营人脸识别服务或处理该类个人数据的人员。本法案禁止任何机构使用人脸识别服务进行持续的追踪监视,除非与严重刑事犯罪(如定义)执法调查有关的特定情况。加州《人脸识别法》对违反其规定的行为施以强制令处罚,并对每次违法行为处以不超过二千五百美元(2,500$)的民事处罚,或对每次故意违法行为处以七千五百美元(7,500$)的民事处罚,该等罚款仅可在总检察长提出的诉讼中收回(如定义)。基于此,DataLaws成立本译组,专门对加州《人脸识别法》草案进行全文翻译,期待为数据法实务界及理论界的各位同仁提供参考。
借此机会向所有译校者的无私奉献致敬,他们分别是:组长:李烨茗;译校成员:李舒戈、刘玲麟、李烨茗等数据法同仁。感谢他们的无私奉献!
以下是美国加州《人脸识别法》中译本全文:

file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps25.png



file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps28.png
来源:微信公众号 数据法盟
编辑:贾梦琪
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps38.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps39.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps40.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps41.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps42.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps43.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps44.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps45.png
file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml11888/wps46.png
409#
 楼主| 发表于 2020-4-25 16:23:36 | 只看该作者
案例

看似毫不相干,哲学与机器学习竟有如此大的交集?
自从 AI 搭乘 AlphaGo 出道以来,关于感知智能需要向认知智能进化的讨论被提上日程,因为虽然 AlphaGo 战胜了李世石,但是为什么 AI 会赢,其中的因果关系没人知道。认知智能的理想发展路线,是从认知心理学、脑科学及人类社会历史中学习,并结合领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,让 AI 能够回答为什么的问题,实现从感知智能到认知智能的关键突破。

这其中的关键方法,就有我们今天要讨论的主题——因果关系。

file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml16056/wps14.png
什么是因果关系?

18 世纪,苏格兰不可知论哲学家大卫·休谟提出“因果关系是人类的错觉”(即人们所谓的因果,实质上是对“相关关系”的归纳推理,而相关性无法保证因果性),用怀疑论毁掉了因果律,否认了理性分析的作用,引发哲学危机。从此,科学家就未停下过对因果关系的争论。


file:///C:/Users/Krystal/AppData/Local/Temp/ksohtml16056/wps16.png
爱丁堡的大卫·休谟雕像


那么,什么是因果关系?因果关系有多重要?

从定义上来说,人们对因果关系最常见的误解,是会将其与相关关系混淆。《爱上统计学》一书举例说明了两者之间的区别:在美国中西部的一个小镇,地方警察局局长发现冰淇淋消费量越多,犯罪率就越高。这个例子中,冰淇淋消费量和犯罪率是正相关的,但并不意味着冰淇凌消费的增多导致了犯罪率的上升,更不可能通过减少冰淇凌的销售来降低犯罪率。

事实上,存在某个变量同时和冰淇淋消费量、犯罪率相关,这个变量就是室外温度。当室外气温变暖,如在夏天,就会有更多犯罪(白天更长,人们多开窗口等)。而因为天气变暖,人们更享受吃冰淇凌的乐趣。相对地,在又长又黑暗的寒冬,冰淇凌的消费就减少,同时犯罪也越少。

这里,冰淇淋消费量与犯罪率只是相关关系,虽然表面上存在着一定程度上的诡异关系,但是却非因果关系。

因果关系的抽象定义是这样的——如果保持系统中其他变量都不变,只改变其中的一个变量(比如通过人工降雨来下雨),然后发现有另一个变量也随之改变(比如我们发现地上由干变湿了),那么我们就说前面一个变量(是否下雨)是后一个变量(地上是否湿)的一个原因。一个典型的因果模型可以通过直观的图模型来描述,或者通过从因到果的数学函数来刻画。

此后数百年来,自然科学和社会科学中有很多科学家在尝试针对因果关系的检测方法,比如2002 年,加州大学伯克利分校教授亨利·布雷迪撰文整理了因果推断的各种经典理论,并根据不同假设,将其分为新休谟理论、反事实理论、操控实验理论、机制理论 4 大类,而从计算视角,近年来还兴起了基于统计独立性、分布变化性、因果过程复杂度和“压缩感知”的新方法。新的方法不断出现,但万变不离其宗,并且与哲学的紧密关系不减反增,其中包括卡内基梅隆大学哲学系(并在机器学习系兼职)副教授张坤在做的事。


一个用因果思维做机器学习的科研人

在张坤看来,哲学与机器学习看似两个毫不相关的领域,但其实有着很多交集,他本人就是一个跨越两个学科的科研人。在卡内基梅隆大学,张坤是哲学系教授,同时指导机器学习系博士生,并且是德国马克思普朗克智能系统研究所高级研究员。他的主要研究方向是机器学习和人工智能,特别专注于因果发现和因果机器学习的研究。在机器学习顶级会议和期刊上,他的团队每年展示十余篇论文, 他并担任 NeurIPS、ICML、UAI 等多个顶级会议的领域主席。

为什么说两个学科之间有交集?张坤的团队希望有更好的认识论和更恰当的方式来定义和解决实际问题。哲学思维方式能让他们更在意问题如何定义以及问题本身意义何在,而机器学习的背景和思维方式让他们脚踏实地从数据出发发现新的信息并进而更新其传统认识。张坤认为,哲学与机器学习两者之间类似于思和学的关系——学而不思则罔,思而不学则殆。

张坤在中国科学技术大学读完本科,在香港中文大学计算机系获得博士学位。在读博期间,他对如何从机器学习的角度看因果关系产生了很大兴趣,于是便从机器学习领域中逐渐缩小关注范围。最终将主要研究领域聚焦于因果发现和因果思维方式的机器学习,虽然当时在机器学习领域几乎还没什么人关注因果性。

在读博期间,张坤第一次接触到机器学习相关的研究课题,当时的目的是做更好的独立成分分析的方法。做那个课题的过程中,他深刻地感觉到,做研究要么着眼于重要的待解决问题而不受领域的限制,要么着眼于重要的还未被公认完善的方法而不被应用限制。如果两者都不是,可能需要想一想自己的研究到底要做什么样的贡献。

因果关系,就是一个重要的待解决的问题,也是具有重要意义的还未有完善方法的方向。在 CMU,张坤的主要研究方向就是在各种场景下如何找出真正的因果关系,以及如果解决一系列具有数据异质性的机器学习问题。他所在的小组在这两个方向并驾齐驱,这几年在研究上取得了一系列进展,比如他们可以从观测数据中自动找出背后有相互因果关系的隐变量。在他看来,这是一次不小的进步。

在在此之前,张坤有不少因果关系相关的研究成果出来,其中最为重要的成果包括他提出的自动因果关系发现方法以及用因果的思维方式解决迁移学习等问题。总体来说,前者将就是通过机器学习的方式,分析各种各样的观测数据,以找到背后的因果关系。张坤说到,在一些假设条件下,因果关系发现其实就是机器学习问题,问题是我们需要合适的或者很弱的假设,这是因果关系和数据之间的桥梁。上世纪 90 年代初,该方向的研究曾获得很大进展,因果发现问题得到部分的解决。而在过去十几年间,机器学习的思维方式的介入更是促进了因果关系突飞猛进的变化。而用因果的思维方式解决迁移学习问题,可以帮助我们判断系统的那些信息可被迁移,以及如何迁移。

张坤介绍到,近年来,因果发现有了不少新的理论和算法,大致是围绕如何利用异构数据以及如何自动构建隐藏的因果变量,而张坤团队最近的自动构建隐变量及其之间因果关系的方法,已经被应用到一系列心理学问题上。用他的话说,“得到了全新且有意义的结果,直接帮助他们重构、理解和干预心理上事实存在的各个维度。”张坤还提到,在这类问题上,华南工业大学的蔡瑞初老师团队也做出了令人兴奋的结果。


因果关系落地难点

具体来说,因果关系下大概分两个研究领域,其一是因果发现,它可以回答“为什么”的问题;其二是有了定性因果关系后,如何确定一个变量对另一个变量的因果影响,比如,它可以帮我们确定不同治疗方式对 COVID-19 的疗效。张坤认为,因果关系的研究领域现在还应该再增加一个,就是因果智能机器学习,它可以帮我们实现更鲁棒、更具适应性、更通用的机器学习系统。

关于因果关系的基础研究范围在不断拓扎和完善,大家关心的更多的还有其在实际场景中落地有哪些进展与难度。

张坤提到,因果关系在实际场景落地的最大困难,是需要掌握和使用要解决问题的特定性质,以及熟悉哪些问题一定需要用因果的思维方式才能解决,如此才能精确、高效的找到背后的因果关系并加以适当应用。“举例来说,现实中我们测量出来的变量往往有很大噪声,甚至并不是我们真正想找的变量,系统有观测噪声这样的信息都可以帮助我们大大降低搜索空间,从而提高搜索效率并改善最终结果,”张坤表示。


因果关系研究并不完善,亟待更多人才

实际上,张坤告诉 CSDN,因果关系相关的基础研究并不完善,因为这还是一个较新的领域,很多实际问题还未得到好的解决,甚至还没有被很好地刻画出来。他认为,用非参数的方式自动构建因果隐变量会是很未来重要的方向,无论是对于单纯的因果研究领域还是机器学习领域。

Judea Pearl


有着巨大挖掘和进步空间的因果关系领域,还需要更多人才的加入。对于那些对因果关系研究感兴趣的同学,张坤推荐了一些入门书籍和资料,包括 Judea Pearl 的 Causality: Models, Reasoning, and InferencePeter Spirtes, Clark Glymour and Richard Scheines 的 Causation,Prediction,and Search,前者注重在概念和因果影响辨识问题(假设定性的因果影响已知),后者着眼于如何从数据发现因果关系。

此外,张坤提到 Clark Glymour 和他本人正在写一本关于因果发现的书,目前还未完工,希望完成之后能为大家提供比较及时、系统的因果发现以及如何使用因果关系的素材,大家可以关注一下。

另外一个问题大家可能也会关心——学习因果关系方向需要掌握扎实的数理知识基础吗?对学生入门学习,专家有哪些建议?

对此,张坤表示入门因果关系确实需要扎实的数理知识基础,他的建议就是别怕那些概念——毕竟因果关系不仅仅是对观测数据的现象描述,它需要一个新的描述体系。把那些概念吃透,变成自己思维方式的一部分。同时多考虑一些看起来宽泛的问题,比如人为什么在意因果关系以及人如何学习因果关系。在不同阶段,我们对这类问题的回答会有不同,更好的答案会直接催生更好的学习方法,而对更好的回答的追求也会给我们源源不断的动力。


来源:微信公众号 CSDN

编辑:贾梦琪

410#
 楼主| 发表于 2020-4-27 20:04:45 | 只看该作者
【案例】

中国传媒大学新媒体研究院&新浪AI媒体研究院:中国智能媒体发展报告(2019-2020)

原标题:中国传媒大学新媒体研究院&新浪AI媒体研究院:中国智能媒体发展报告(2019-2020)

中国传媒大学新媒体研究院、新浪AI媒体研究院联合发布《中国智能媒体发展报告(2019-2020)》,对全球智能媒体产业的生态图景进行了深入洞察。

立足于人工智能时代的政策红利、经济增益和技术前景,报告聚焦全球媒体智能化发展的细分赛道,全面展现国内外知名媒体与互联网公司扎根于“算据+算法+算力+网络”的基础底座,不断加速人工智能技术在媒体全链路全环节融合应用的成熟探索。同时,通过挖掘国内代表性智媒平台的优秀案例和战“疫”创新服务,共同见证中国智媒的力量和潜能。

《中国智能媒体发展报告(2019-2020)》不容错过的精华看点:

全球视野下智能媒体的差异化发展与共性聚焦

看点1:全球人工智能“军备竞赛”已经启动,中、美、日、英、欧盟等国家及地区纷纷制定顶层设计、战略布局和关键政策保障人工智能发展,中国人工智能发展迎来政策红利和投资热潮,顶级科技公司逐鹿人工智能赛道。

看点2:华盛顿邮报、纽约时报、美联社、彭博社、BBC、GiveMeSport等外媒在智能采集与智能生产环节优势突出;Facebook、Google、Amazon等科技平台智媒体化趋势显著。平台智媒化和智媒平台化发展加速汇流。

看点3:全球智能媒体产业生态在基础层、技术层与人工智能产业的架构支撑保持一致,应用层则形成了更适配媒体行业应用场景或需求的软硬件产品及解决方案。

中国智能媒体发展现状与未来趋势研判

看点4:当前,人工智能贯通信息采集、内容生产、内容分发、媒资管理、内容风控、效果检测、媒体经营、舆情检测、版权保护九大环节,驱动中国媒体的智能化迭变。

看点5:对国内主要通讯社、报纸、广播、电视、媒体网站、新媒体智媒转型的专项调研结果显示:多数国内媒体机构高度重视智能化战略,但整体仍处于起步阶段,技术基础薄弱、专业人才缺乏和资金投入不足是目前智媒转型面临的三大挑战。

看点6:中国智能媒体发展势不可挡。在主流价值导向引领下,以计算机视觉、强化学习、知识图谱、情感计算等关键技术领域加速突破,推动媒体认知智能升级,全链智媒应用得以纵深发展,智媒商业化得以实质性突破。新型主流媒体与头部商业平台将成为智媒生态两大中坚力量,而先进技术、创新管理和内容建设协同发展将持续激活媒体AI能力。同时,伦理标准、职业规范的建设成为行业关注焦点,为智媒行业健康高速发展保驾护航。

优秀案例直播中国智媒转型进行时

看点7:国内智能媒体发展百花齐放,领先智能媒体路线践行者为行业发展带来了宝贵经验,本报告将详解CCTV微视AI in TV模式、封面新闻智能泛内容生态、广州日报智能化融媒体方阵、闪电新闻“AI+广电”融媒体资讯平台、新华社智能化编辑部、新浪新闻智能化媒体平台、央视网“人工智能编辑部”七大年度案例。

看点8:新冠疫情期间,人工智能助力疫情防控、集结战“疫”舆论宣传工作,人工智能在疫情信息采集、疫情报道内容生产和新闻播报、舆情分析、内容分发、鉴谣辟谣及信息治理等方面形成了多个优秀应用案例,成为战胜信息疫情的“特种智能部队”。

报告全文:
https://news.sina.cn/gn/2020-04-26/detail-iircuyvh9962198.d.html?from=timeline

编辑:张凉



发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表