传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
191#
 楼主| 发表于 2019-8-31 23:04:40 | 只看该作者
【案例】
李萌:立足当前弱人工智能阶段和发展水平 大力开展治理研究与实践
科技部副部长李萌
          
尊敬的傅莹主任、沙海林副主任,各位来宾,女士们、先生们:
下午好!
今天的治理论坛是今年上海世界人工智能大会的一个亮点,我谨代表科技部对论坛的召开表示祝贺!向出席论坛的各位来宾和国内外朋友表示热烈欢迎!
当前,人工智能正加速向经济社会各领域深度渗透,对经济发展、公共安全、社会治理、国际关系带来深刻影响,引起广泛关注。许多国家、国际组织和知名企业正在研究制定人工智能发展准则,人工智能从业者也在积极探索行为自律规范。
中国高度重视人工智能的社会治理问题,国家《新一代人工智能发展规划》明确提出“把握技术属性和社会属性的双重特点”,并作为规划的一条基本原则。为此,新一代人工智能规划推进办公室专门成立了治理专业委员会,旨在进一步加强人工智能相关法律、伦理和社会问题研究。617日,委员会发布了《新一代人工智能治理原则》,突出了发展负责任的人工智能这一主题,提出了和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理等八条原则,表明了基本态度。
同时,我们也要冷静观察和理性对待。技术是中性的,既可以造福人类,也可以损害人类,没有好技术和坏技术之分,只有好人和坏人之分。智能技术能带来各种精准化优点和优势,也可能带来各种精准化错误和缺陷。目前对于人工智能的社会风险、伦理风险、法律风险,有一些是基于理性推演的预判,也有一些是基于设定观点的臆想。
我们要大力开展人工智能治理研究与实践,立足当前的弱人工智能阶段和发展水平,同时着眼中长期加强前瞻研判,但不要把还很遥远的强人工智能乃至超级人工智能时代的能力和场景作为研究治理问题的现实背景。要针对人工智能双重属性的特点,进行应对和规制,对算法歧视、智能滥用、深度造假、隐私泄露等问题要持续跟踪研究,加大打击和遏制力度,防止人工智能被滥用。要坚持以积极的态度推动人工智能的发展规制与科技探索和应用拓展的协调,防止陷入“伦理陷阱”而阻碍前沿技术的研究与应用。在这些方面,我们需要与国际同行加强交流,共同引领人工智能健康发展。
上海是我国人工智能创新发展的高地,集聚了大批专家学者、领军企业,应用场景丰富,具有开展人工智能治理的重要基础。今年5月,科技部与上海市共同启动了上海国家新一代人工智能创新发展试验区建设,人工智能的治理与规制和人工智能技术研发、产业赋能、应用场景拓展一样,都是试验区建设的重要内容。希望上海发挥优势,加强政产学研用联动,深入研究人工智能治理中的深层次问题,探索各类主体协同治理的长效机制,加强国际交流与合作,持续优化人工智能发展的创新生态,为中国和世界人工智能发展贡献智慧,积累经验。
预祝论坛取得圆满成功。谢谢!
原文链接:https://mp.weixin.qq.com/s/KjCFa45RWGfjegRyzFwGdw
编辑:陈茗

192#
 楼主| 发表于 2019-8-31 23:12:11 | 只看该作者
【案例】
意识是脑中涌现的吗?一场关于人脑、智能和意识的深入对话
物理学能统领万物吗?心理学可以还原成脑科学吗?笔者认为,各层面的理论自有其独特价值,不可以互相完全替代,因为一个特定的现象往往只能在某个层次上讨论。一个常见的误区是,许多人认为某个层次比其它层次更基本甚至更真实,而其它层次只不过是建筑在其上的近似描述,因此原则上可以都“还原”到这个基本层。笔者之所以不同意很多人坚信的“意识是从脑中涌现出来的”,因为这隐含着“神经层描述是基本的(或真实的),而意识层描述是导出的(或虚构的)”的预设。
提示:本文是一篇严肃的书评。阅读本文发表您的感想至留言区,并点击“在看”,截至97日中午12点,我们会选出5条留言,每人送一本《脑与人工智能》。
撰文 | 王培(美国天普大学计算机与信息科学系)
顾凡及和卡尔·施拉根霍夫(注:考虑到中西方不同的习惯,我下面分别称二位为顾先生和卡尔,而不考虑二者不属于同一个称谓体系这一问题)合著的《脑与人工智能:一位德国工程师与一位中国科学家之间的对话》[1](以下简称《对话》)从许多方面来说都是独特的。即使不提其中英文对照的形式,两位专业和文化背景都迥然不同的资深专家通了几年的电邮来讨论共同关心的问题,这本身就是很罕见的。像各国的脑模型计划、深度学习在围棋等领域的成功这类话题,近年来已经成媒体新宠,各路专家也都登台亮相过了,但不同观点的深入交锋并不多见,还不要说这种交锋还是在惺惺相惜的气氛下进行的了。
我觉得《对话》首先可以被看成科学讨论的范本,尤其是青年科技工作者们可以从中学到如何既保持开放心态又不沦为随声附和,既不放弃自己的原则又尊重对方的观点等等基本对话礼仪。这种对话本应是科学研究的重要形式,但又是在媒体中和教科书中看不到的。二位作者在各自的领域中都已是功成名就了,但仍能愿意认真地考虑不同意见,并不耻于承认自己的缺失和疏漏之处,这是难能可贵的。能够保持赤子之心和君子风度,这只有在对话目的纯粹是满足求知欲和推动科学发展(而非眼前的功利或证明自己的高明)时才能做到。《对话》的另一个特点是话题的广度。围绕脑科学和人工智能这两个核心领域,书中以通信文本和背景专栏两种方式介绍了大量相关知识,并不时将讨论提升到科学哲学、科学政策的层面,而又紧扣当前的问题,绝无卖弄学识之嫌。这不仅将有关思考置于更大的背景之上,也增加了阅读体验的生动和愉悦。比如说卡尔在荣升外祖父之际开始意识到祖父母在系统化、汇总和筛选知识以及教授相关知识和技能方面做了大部分工作,生动地表现出一个思想者时时处处都不忘理论抽象的特质,令人忍俊不禁。由于《对话》中谈到了大量话题,在这篇短文中无法逐个加以评论。下面我仅选几点加以讨论。对脑模型计划的质疑
《对话》的源头是顾先生对欧盟人脑计划HBP,用计算机模拟整个人脑)的质疑(可参阅《欧盟人脑项目:有钱有大计划,就能做出基础科学突破性成果吗?》),而卡尔也恰有同感,故二人相互补充,对这个当时炙手可热的计划进行了剖析,而其主要预测已被后面的历史发展所证实。我个人在这个问题上的观点和二位作者高度一致,即认为
1. 我们对脑的认识尚不足以支持全脑范围的计算机仿真,
2. 智能计算机未必要在细节上复制人脑。
这两个论断都是关于人脑和计算机的功能等价性的,只是关注的方向恰好相反。
从计算机被发明出来那天起,其和人脑的等价性就是个被反复探讨的问题。由于计算机就是被造出来完成人脑的某些任务的,功能与人脑自然有重合。而在另一方面,由于计算机是个机电设备而人脑是个生物组织,这二者显然又有根本差别。因此,计算机和人脑的关系不是相似还是不似的问题,而是在哪些方面相似,相似到什么程度的问题。这听上去像是常识,但在讨论中人们往往会注重于这个关系的一个方面,而有意无意地忽略了相反的证据。从原则上讲,任何对象或过程都可以在计算机中被模拟或仿真,而结果的逼真程度会随着计算机模拟技术的发展和对模拟对象的认识加深而不断提高。对于人脑这个对象及其内部过程当然也不例外,因此我并不怀疑脑模型研究的理论和实用潜力。这里需要注意的是,除了当前计算技术的限制之外,脑模拟主要受限于模型本身的精确程度,因此囿于当前脑科学的水平。一个不正确的模型对脑科学的价值就相当有限了,不管它工程上如何宏大。卡尔反复强调模型理论的差别,顾先生指出不能把人脑当作人造物件,理由都在这里。这不是靠砸钱就能解决的,而大科学的运作方式在此类情形下反而会阻碍科学进步,包括集中资源时对其它研究思路的抑制和失败后的殃及池鱼。即使脑模型尚不能准确模拟人脑,它能否为智能机器的设计提供思路呢?原则上这当然是可能的。像我在《当你谈论人工智能时,到底在谈论什么?》中所分析的,从广义上说所有人工智能的研究路线都是对人类智能的某种模仿,其差别只是在抽象程度和覆盖范围上。目前的类脑智能把智能看作脑的产物,进而在神经元水平上模拟脑结构,这自然不无道理,但认为这是实现通用智能的唯一途径就未免至少是想象力不足了。近期关于类脑智能新突破的报导都忽略了所谓的新功能在人工智能历史上大多已经被其它技术用更简单的办法做到了,当然那些技术有别的弱点,因此现在不常被提起了。比如说所谓灾难性遗忘就是人工神经元网络独有的问题,因此这里的进展是不能被用来证明这条技术路线的优点的。二位作者在《对话》里提出了相当充分的论据,来说明智能机器不一定是越类脑越好,而且除了脑结构之外,身体的作用和社会环境对智能系统也是不能忽略的,所以即使有理由走这条路,现在考虑到的因素也远远不够。我完全同意顾先生的下述结论:探索脑功能机制和开发智能机器是两个不同的任务,虽然它们是相互关联的,但不应该混淆两者。各种脑模型的支持者常常声称这种研究有一石二鸟之效,但很少为这个结论提供超出直觉之外的论据。而一旦分别讨论这两个目标,评价标准就不一样了。如果脑模型主要服务于脑科学,则其主要标准就是它在多大程度上相似于大脑;如果是作为实现智能的手段,那就要在功能和效率等方面论证其优于其它手段之处,而不能只靠类脑来说事。主观性和私密性
《对话》后期的核心议题是意识,包括它如何在人脑中出现和能否在计算机中出现。顾先生和其他一些学者一样,认为这个现象的根本特征是主观性和私密性,因而和科学研究所要求的客观性和公共性不相容。即使我们可以(从第三人称的角度)透彻地描述一个认知过程,但这和(从第一人称的角度)直接感受它毕竟不同,因此讨论人工意识的问题还为时尚早。卡尔认为人工智能在未来可能会有意识,但承认这是个非常困难的问题,目前还看不出如何解决。
这个问题大概是我和《对话》作者们观点差异最大之处了。我同意意识的主观性和私密性,但不认为这为对意识的科学研究和计算机实现设置了不可逾越的障碍。在直接讨论意识之前,让我们先看看精神活动的主观性、私密性和对这种活动的科学研究之间的关系。首先,主观性和私密性不限于(狭义的)意识,而是普遍存在于各种精神、心理活动之中。以感觉为例,正像卡尔说的:我们永远都不能确定你所看到的红色究竟是否就是我看到的红色,这不仅因为感觉的结果只直接呈现于感官属于的认知主体之中,也因为感官的微小差异也会造成感觉能力和结果上的差异。比如说某人也许对某种颜色(或味道)比其他人更敏感。当讨论范围从感知移至认知,私密性依旧,而主观性更甚。像我在《意思是什么意思?》中所说的:由于概念和语词的意义均由相关的经验决定,而不同的系统总是有不同的经验,所以意义从根本上说是私人的和主观的。我们的观念取决于我们的躯体、和环境相互作用的历史、从语言和经验中习得的概念体系,等等,因此我们之间的观念差异既不是任意的,也不简单地总有个谁对谁错。这就好像我们都是带着一副有色眼镜看世界,而每个人的眼镜又不完全一样。请注意这里不存在摘下眼镜看世界的本来面目的可能性。尽管我们仍然可以说世界独立于所有认知主体而存在,但对世界的任何描述必须依赖于一个概念体系,而不同的体系用不同的方式分割世界,使我们得以聚焦于具体事物。比如说《对话》中讨论到的翻译问题。严格地说,完全精确的翻译是不可能的,因为不同的人类语言自带不同的概念体系,因此对应于一副特定的眼镜。这也就是有些语言学家主张不同的语言对应不同的世界观的根据。和很多人想象的相反,并不存在一种上帝的语言可以描述世界的本来面目。所谓裸眼其实也是一种眼镜,否则如果连聚焦功能都没有,怎么看到事物?如果是这样,科学理论的客观性又如何可能呢?在这里客观性实际上是指公共性而非无主体。我在《意思是什么意思?》中解释过,意义的客观性成分主要是通讯和社会化的产物,因为这些过程为不同系统提供了相似的言语经验和社会经验,并促使它们按照约定和习俗使用语词,而躯体、自然环境、社会环境的相似性越高,这种约定和习俗也就越容易建立和保持。在书中,卡尔也提到了通讯共情在消除主观性上的作用。就此说来,即使某个心理现象具有主观性和私密性,这也不妨碍我们建立相关的科学理论和计算机实现。比如说关于大脑是如何辨认色彩的,我们已经有相当好的理论(尽管不是十全十美),而且可以在计算机上实现同样的功能(尽管细节上与人脑不同)。当然,计算机仍然不能享受到卡尔看到他喜爱的那种蓝色时的感觉,但我们其他人也不能呀。这里科学技术所需要的并不是卡尔的那一副不可分享的私用眼镜,而是大家都可以用的共用眼镜,尽管用这种眼镜看不到某些用私用眼镜才能看到的东西。描述层次
把理论当作眼镜这个比喻还可以进一步展开。即使都是共用眼镜,也仍可以有度数(放大倍数)之差,而度数不同的眼镜会使我们看到不同的景象。对应到科学领域中,不同的学科使用不同的概念体系,以此确定了其中的理论的描述层次。一个低层理论就像高度数的眼镜(或者说显微镜、望远镜),可以看清更多的微观细节;一个高层理论则提供了更大的视野,适合于描述系统的整体或宏观特征。
在多种描述层次共存的情况下,各层上的理论自有其独特价值,是不可以互相完全替代的,因为一个特定的现象往往只能在某个层次上讨论。比如在某个观察距离上能看到的一条山谷,在离得太近或太远时就看不到。只见树木不见森林也是说的这个理。这些层次之间当然有关系。推进镜头(至下一个层次)往往可以更好地了解某个成分的内部结构和过程;拉开镜头(至上一个层次)往往可以更好地了解某个成分的外部功能和联系。说不同的学科(物理、化学、生物等等)对应用不同的描述层次,这可以算是常识,但相关讨论中有两个常见的误区。一是认为某个层次比其它层更基本甚至更真实,而其它层次只不过是建筑在其上的近似描述,因此原则上可以都还原到这个基本层。这种观点的极端形式就是物理主义,即认为唯有物理学有可能提供一个万物理论。在和本文直接相关的讨论中,这种还原论对应于心理学可以还原成脑科学的假设,同时也是只有类脑计算才能完全实现人工智能的信心来源。在科学哲学中关于还原论的讨论已经有很多,《对话》中也有涉及,我这里只补充两个不常被提到的分析角度。其一是以往讨论的重点常常是哪种理论准确地描述了对象,因此低层理论会以其细节的丰富而胜出。这里被忽略的是理论的使用者在信息加工能力上的限制和要说明的现象。包括过多无关细节的理论常常是不好用甚至没法用的,而这正是上升到更高的描述层次的主因之一。另一个因素就是同一个高层过程常常与多个低层过程相对应,而对很多目的而言,区分这些低层过程毫无必要。举例来说,一栋建筑物当然是由原子组成的,但我们不会在原子水平上进行建筑结构设计。为什么?不是因为不可能,而是没必要和太麻烦。在讨论理论层次关系时常犯的另一个错误就是认为不同层次上的描述之间有因果关系,比如说某个心理层面上的事件A是由某个神经层面上的事件B“造成的,而实际上AB是在用两组不同的语汇描述同一个过程,所以不存在因果关系。比如说我们可以用大量分子碰撞来解释热运动,而不能说前者是后者的原因。不管怎么定义因果关系,说的总是不同事件之间的关系,所以如果AB根本上是被不同的语汇所描述的同一个过程,那么在二者之间是无因果可言的。直面意识问题
基于上述分析,我不同意《对话》作者们(以及很多其他科学家)意识是从脑中涌现出来的的说法,因为这隐含着神经层描述是基本的(或真实的),而意识层描述是导出的(或虚构的)的预设。我认为神经层描述(甚至物理层描述)仍然是使用特定概念完成的,因此和意识层描述并无本质不同,都是一个观察者以一种特定的观察方式得到的。和很多重要概念一样,意识并没有一个公认的定义。但尽管如此,其核心含义仍是关于一个认知主体的自我认识,因此这种内向的自我感知和外向的环境感知有很多共同点。其差别我认为主要在两点:1. 内部环境是独享的,而外部环境是共享的,这就强化了意识的主观性和私密性。但如前面分析的,外向的感知也不是完全没有主观性和私密性,所以这个差别是相对的程度之差,而不是绝对的本质之差。尽管我们无法直接体验他人的内心感受,共情、推理等机制还是使我们有一定的设身处地推己及人的能力。
2. 我们对自身认知活动的感知是直接实现在概念层上的。比如说如果我问你你刚才在想什么?你对这个问题的答案当然在你脑海中对应着相关神经元的活动,但你直接感到的是念头。这和视觉、听觉等从物理信号开始的多层抽象有根本不同。我们的内心感受器直接感受到意义,而不像其它感官那样只提供信号,将对其意义的获取留给后面的知觉、识别、理解等过程。其结果就是我们描述内心感受与活动的心理语言和描述外部感知的物理语言(广义的,也包括化学、生物等层面的词汇)使用不同的概念语汇。即使我们有办法借助某种设备精确地在神经元层面观察一个过程,从中得到的第三人称描述也和当事人的第一人称描述不同。可以说我们观照内心时所用的眼镜和观察世界时所用的不是同一副,它们产生的结果甚至都不在同一个描述层次上,因此不可以精确互译。
由于上述原因,当我们由于想法A采取了行动B,然后看到外显后果C的时候,A是用心理语言描述的,C是用物理语言描述的,而它们之间的关系被描述为“AC的原因。这往往被看成精神变物质,而外界事件引发的心理活动则成了物质变精神。但这种跨层次的因果关系所造成的解释鸿沟可以更自然地被归因于两种不可直接互译的语言被分别用来描述这两个被联系的事件。上述的情景完全可能在人工智能系统中出现。在[2]中,我们描述了一个具有简单自我感知和自我控制能力的智能推理系统,其中的自我概念的基本内容是我在什么条件下可以采取何种行动来导致何种后果,即上述的“ABC”关系。虽然目前还非常简单,这一机制已经具有产生上述意识现象的能力,即系统本身有内部心理经验(某种意识流),并可以根据过去的经验和当前目标选择行动。这就是说某种人工智能系统完全可能有意识,尽管和人类的意识内容不会一样。当然,这并不是说现在所有自称人工智能的系统都会有意识,因为它们的行为基本与经验无关,更不必提内部经验了。一个可以预料的反对意见是说这仍仅仅解决了查默斯所谓的简单问题,而没有解决困难问题,后者是说明主观感受如何能从神经元活动中产生出来(《对话》中对这个区分有详细介绍)。我认为这里有两个要点。一是在人工智能系统中只要是由感官直接提供给系统的信号构成的输入流就是系统的主观经验。这种经验的私密性就在于即使我们可以将其复制或解释成我们可以理解的形式,对于我们这些外界观察者而言这也不再是第一人称的主观经验,而是第三人称的客观经验,但这不能作为系统自身没有主观经验的理由(子非鱼,安知鱼之乐?)。另一个要点就是主观感受本来就不是从神经元活动中产生出来的,而是系统自身的直接观察结果,而其中所用的感官是根本看不到神经元(或电子线路)的。我们对相应神经元活动(或电信号活动)的描述只是在另一个层次上从另一个视角对同一个过程的描述,因此二者之间并无生成关系可言。这就是说查默斯的困难问题本来就不是个正确的问题。我在这个问题上的看法与顾先生在《对话》中表达的看法不同,虽然我完全同意他对意识的主观性和私密性的强调,以及意识活动不能被还原成脑活动的结论。尽管有这些不同意见,我仍然确信在近年出版的大量关于人脑和人工智能的书籍中,《对话》应该算是最深刻的之一。读者们一定可以从中受益,并被激发出更深入的思考与研究。

参考文献
1. 顾凡及,卡尔·施拉根霍夫.《脑与人工智能:一位德国工程师与一位中国科学家之间的对话》(含三册: 《脑研究的新大陆》《意识之谜和心智上传的迷思》《人工智能的第三个春天》)[M]. 上海教育出版社,2019
2. PeiWang, Xiang Li, and Patrick Hammer.  Self in NARS, an AGI System,Frontiers in Robotics and AI, Volume 5, Article 20, 2018


注:本文所提到之作者其他文章,可进入公众号底部菜单精品专栏-AI那厮查阅。点击https://cis.temple.edu/~wangp/Chinese.html,可查阅作者所有科普文章和科普视频。
原文链接:https://mp.weixin.qq.com/s/S-Lf1CHD0ZzlsgwkkpaWKA
编辑:陈茗

193#
 楼主| 发表于 2019-8-31 23:37:06 | 只看该作者
【案例】
傅莹:人工智能的治理与国际合作
外交部前副部长、清华大学战略与安全研究中心主任傅莹
2019829日,傅莹女士在2019世界人工智能大会治理论坛作主旨演讲,全文如下。
          
关于人工智能治理面临的挑战
进入21世纪的第二个十年,人工智能技术的应用进入快速发展的阶段,随着AlphaGo为代表的深度学习算法的成熟,人工智能技术出现大面积应用的趋势。我最近访问了一些企业,昨天在上海还看了三家企业,可以明显地感受到我国人工智能产业所呈现出来的蓬勃发展态势。可以期待,未来人类的生产和生活方式将发生更大的变化,生活将变得更加舒适和便利。
今年7月,我们在清华大学的世界和平论坛期间举办了三场论坛,邀请70多位国内外专家学者和企业家围绕人工智能的风险和治理进行研讨。大家比较一致的看法是,人工智能技术是一把“双刃剑”,一方面带来科技革命和产业升级的重要机会,另一方面,也带来新的安全风险,在治理上人类将面临与以往完全不同的难题。
例如,在立法上需要有新的思维。传统的法律是要以社会基本共识为基础的,因此往往要滞后于社会实践。但是在人工智能技术上,我们恐怕没有这样奢侈的时间条件,因为这项技术的应用影响之快、之大,远不同于传统技术,治理的需求与技术的应用几乎同步出现。
再比如,传统立法者关注的是人与人之间的关系。而人工智能作为“非人行为体”,未来会越来越广泛地参与人类活动,那么,在人机共存,甚至人机冲突的情况下,如何面对和处置人类与机器的矛盾呢?“机器代替人”做决策的情况已经不是想象中的事,波音737-MAX的空难就是一个重要的警示。
人工智能的到来对就业模式的快速冲击也是前所未有的。清华大学战略与安全研究中心人工智能项目组的于洋老师牵头做的《中国青年视角下的人工智能技术(AI)风险和治理》调查项目中,超过50%青年人表达的头等关切是失业风险。如同以往的技术革命,人工智能将取代大量程式化的工作岗位,同时也会创造出新型岗位和就业机会。挑战在于,如何才能让人才结构的调整跑赢技术的更新迭代和产业结构的跃升?
不能忽视的还有在伦理规范方面的新问题。例如国际上讨论比较多的人群歧视和对个人隐私的尊重和保护等问题。有外国人对我说,中国人不需要隐私保护,我认为这是偏见。我国立法高度重视对个人权利的维护。在本月全国人大常委会审议的民法典人格权编草案稿中,针对收集、处理自然人个人信息有明确规定,要求必须“征得该自然人或者其监护人同意”等,而且把个人生物识别信息也纳入保护的范围。
我国在创新制度和手段、推进人工智能治理方面加快部署
习近平总书记明确要求,“要加强人工智能发展的潜在风险研判和防范”,“要确保人工智能安全、可靠、可控”,“要整合多学科力量,加强人工智能相关法律、伦理、社会问题研究,建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德。”
总书记的要求是我们推进人工智能治理的重要指导方针。党中央和国务院对人工智能的部署采取的是发展和治理同步推进的方针。今年2月科技部牵头组建了中国国家新一代人工智能治理专业委员会,6月该委员会发布了新一代人工智能治理8条原则,强调发展负责任的人工智能。工信部在2017年就颁布了《促进新一代人工智能健康发展三年行动计划(2018-2020)》,其中也对治理提出要求。现在的重要任务是如何让这些规则和要求落地,形成有利于我国人工智能健康成长的良性环境。上海在人工智能的研发和应用方面走在全国的前列,积极探索治理路径,重视推进国际合作。在科技部和工信部的支持下,上海推动建立了国家人工智能创新应用先导区和国家新一代人工智能创新发展试验区。可以期待,上海在人工智能治理的规则与制度的创新、开展国际合作方面也将走在全国的前列。
考虑到这个新兴领域自身独特的性质,我们一方面要加快对立规和立法的研究,另一方面也要依靠科学界和企业界采取负责任的态度和行为。如果科学家在每一项新技术的研发中都能思考其负面风险,如果制造商在每一个新技术的应用中同步构建风险管理的解决办法,那么,对这方面的挑战就不难找到应对办法,其立法和规范也就不难走出新的路径。
目前很多人工智能企业希望有法律责任和范围的清晰界定,认为这样更有利于企业的发展,他们在采取一些自律措施的同时,也期待国内整体规则环境和基础条件更快得到完善。
人工智能治理的全球视野和国际合作
人工智能技术的研发和应用是在全球平台上实现的,因此,其治理也不是某个国家或区域的问题,而是涉及到全人类的福祉。因此,我们需要有全球视野,拓展全球合作。在这方面,国际社会有过一些经验。例如核军控和气候变化等难题,都是先在学界、企业界和社会组织中被广泛讨论和推动,最终达成国际共识,形成有效的治理原则和制度。
目前,国际上围绕人工智能带来的挑战正在进行广泛和热烈的讨论,不少国家和机构出台了相应的法律法规和原则主张。但各国间仍缺乏大家共同接受的人工智能治理原则和在价值观和理念上的共识。
中国对人工智能的国际合作和治理采取的是积极参与的开放态度,也主动搭建了不少平台,上海世界人工智能大会就吸引了国际和国内的不少关注。天津的世界智能大会、重庆的国际智能产业博览会等,也都是向世界开放的交流平台。
中美关系的前景也关系到人工智能治理的国际合作。有人会说,美国挑起贸易战,破坏全球贸易体系,是对国际秩序更大的挑战。我觉得确实如此,这是一个主观的破坏性行为,中美关系的动荡为人工智能国际治理的探索也带来一定阻碍。
而现实中,中美学者在人工智能领域的关系是相当紧密的。根据科睿唯安提供的人工智能领域科技文献数据,从2013年到2017年,全球参与评估的167个国家/地区在“计算机、人工智能”发文排名中,中国大陆位居第一,发文量达到59573 篇,占25.02% ;其次是美国,发文量是32527篇,占13.66%。中美两国国际合作论文数量增长最快,过去五年中国大陆开展国际合作最多的对象是美国,美方开展国际合作最多的国家是中国大陆,双方合作论文有四千多篇。
在人工智能技术的快速发展中,中美各有优势。数据显示,在涉及人工智能基础层的算力、数据和算法三大关键要素中,美国在算力和算法上有优势,巨头公司基本掌握着开源算法平台和场景丰富的算法能力,而中国正在积累越来越多的应用和数据资源。从两国的实践看,如果中美无法有效合作形成共同标准的数据和算法,双方的产业和未来发展都将受到很大影响。
习近平总书记在2018年致上海世界人工智能大会的贺信中指出,“新一代人工智能正在全球范围内蓬勃兴起”,“要把握好这一发展机遇,处理好人工智能在法律、安全、就业、道德伦理和政府治理等方面提出的新课题,需要各国深化合作、共同探讨。中国愿在人工智能领域与各国共推发展、共护安全、共享成果。”
因此,我们需要从相互依存、命运与共的“共同体”意识出发,主动参与和推动国际交流与合作,同时也要认真履行自己的责任。历史上每一次科技革命都推动了新的国际议程的设置,相信人工智能技术也能成为各国合作的新平台,为全球化增添新的动力。中国人应该也能够为此做出贡献。
对人工智能的国际治理的三点建议
一是保持开放性。人工智能的技术发展与产业应用是全球高度协作的成果,其未来的发展也依赖世界各国优势互补,合作共享。因此,在人工智能的治理上也需要保持开放性,集合各国智慧与经验,实现有效的全球治理。
二是合作性。人工智能被认为是一项综合性的“原力技术”,其治理也需要多学科、多领域和多部门乃至多国的共同参与。各国在探讨和构建治理机制的过程中,应积极开展国际合作,取长补短,才有可能实现有效的治理。
三是客观性。人工智能作为革命性的新技术,难免引发很多误解和怀疑,没有人能准确预测技术的未来结果。国际治理应该秉承中立客观的立场,保护科学家和企业家的创新积极性,尊重人的权利与尊严。
最后,我祝愿上海世界人工智能大会能在推进人工智能国际合作、包容制度创新方面取得好的成果。也祝愿与会代表们,能够利用上海市搭建的这一平台,深入沟通、凝聚共识,为未来描绘美好的蓝图,为我们的后代留下更多的可能性。
原文链接:https://mp.weixin.qq.com/s/949hr8P14vkl2C5EcwtQqA
编辑:陈茗

194#
 楼主| 发表于 2019-9-2 22:54:58 | 只看该作者
【案例】
AI主播与主持传播中的人格进化

导  读
  对于主持传播而言,技术发展可以算得上既是催化剂、试金石,又是照妖镜。
随着AI主播的上岗,真正的播音员、主持人会不会下岗,AI主播是否真的会替代现实主播再次成为学界、业界热议的话题。人们为什么会喜“爱”AI主播?AI主播受到关注和欢迎是否意味着以人格化、平民化为特质的主持传播的根基会动摇?要回答这些问题恐怕还得从主持传播的本质入手。
人格化是主持传播的本质与关键

主持传播,即以播音员、主持人等人格化传播者作为传播主体而实施传播的一种传播样态,实际上是一种在传播中实现传播主体人格化,并在传播过程中体现出人际性特点的传播方式,其中的人格化、人际性是构成主持传播的关键,亦是主持传播的特点和优势所在。①从人类传播的历史来看,在传播中实现和突出传播主体的人格化,或者说主持传播的诞生要远晚于其他类型的大众传播。只有当印刷机等现代化机械被广泛运用于大众传播媒介(报纸)之后,人类才进入了真正的大众传播时代,而只有当传播技术发展到可以将传播者的“音容笑貌”再次“还原”到受传者的耳畔和眼前,营造出“面对面”交流的场景时,传播主体才能在一定程度上以“拟人际化”的方式呈现在传播当中,而这也正是主持传播得以存在的基础。②

“传播是各种各样技能中最富人性的。”③而主持人的传播活动无疑是大众传播活动中最富人性的。在大众传播活动中,由于其“拟态”人际传播的特点,传播者和受众在地位和人格上都具有了平等的、人际传播的色彩,在传播过程中的传受双方可以实现一定程度的面对面交流,这使得主持人和受众之间的关系在某种程度上成了人际传播的扩大化。对于主持传播的主体来说,在传播活动中不断放大其“主体人”的定位,在传播实践中采取平民视角,以真实、自然的传者主体人格出现就成了其存在基础,也是其成功的关键。只有主持传播主体以真实的人格出现,才能真正在传播中与受众建立起“人与人”“面对面”的交往关系,才能拉近传者和受众之间的距离,也才能真正提升其传播效果。正所谓“主持人节目由于人格化传播而具有很强的感染力和引导作用”④。

AI技术使主持传播的虚拟人格得以实现

就在学界、业界对主持传播中传播主体人格的真实性和实在性的认识基本达成一致之时,虚拟主持人与AI主播这些在真实世界里并无实体人格的传播者又走入了主持传播的实践领地。起初,虚拟主持人只是存在于二维的互联网里,依托动画形象和对真实传播主体的模拟来进行播音和主持。随着大数据、云计算、物联网等技术的急速发展与应用,人工智能已经渗透到社会的各个领域。随着AR、VR以及三维虚拟影像技术的发展,具有虚拟人格的人工智能主持人更是开始走到台前。相比于人类,人工智能主持人拥有更强的储存和计算能力,在某些相对简单、程式化的主持环节中,人工智能已经开始崭露头角,甚至大有取代人类主持人之势。

如果说以安娜诺娃等为代表的早期虚拟主持人离真正的人格化尚相距甚远,还停留在依照既定程度从事简单信息播报工作的话,由人工智能技术合成的AI主播则越来越接近于人的形象,甚至具备了与受众进行交流的互动能力,具备了某些人际性的传播特征,媒介技术则凭着先进的手段创造出了现实生活中并不存在的人格主体,为主持传播创造出了新的虚拟人格。

以已在多个节目和场景中大显身手的机器人小冰为例,在云计算、大数据、深度神经网络等技术的支持下,小冰目前在全球已拥有超过1亿用户,而且已经更新到了第六代。第六代微软“小冰”的最大特点是:已经从一个聊天机器人转化成一个完整的情感计算框架,再从情感计算框架转化成各种各样的产品形态,通过各个垂直领域进入人类社会生活的方方面面⑤,成了与真正的主持传播主体越来越接近的虚拟人格传播主体。

AI主播虚拟人格的受众接受心理

不管是有着超1亿全球用户的机器人小冰,抑或是粉丝过千万的虚拟动画人物初音未来,依靠技术手段产生、在现实中并不存在的虚拟人格何以产生如此大的影响?其在传播中产生的效果能否视为主持传播存在基础的反证?虚拟人格是否已对主持传播的真实人格构成了威胁?要回答这个问题则要从受众对主持传播主体的接受心理入手。

由美国心理学家罗森塔尔和雅格布森通过小学教学予以验证提出的皮格马利翁效应(Pygmalion Effect)理论认为,积极的期待会产生积极的效果,而且是奇迹般的效果。⑥心理学家们据此提出,人的情感和观念会不同程度地受到个人下意识的影响。人们会不自觉地接受自己喜欢、钦佩、信任和崇拜的人的影响和暗示。由此可以推出,受众在接触人工智能等虚拟主持人时心中会充满好奇和期待,当看到人工智能主播科学高效的工作时自然会对其表示出喜爱。通常而言,受众会努力向着优于一般表现的方向发展,这是一个双向互动的过程,而这恰恰也可以从心理学上关于情感投射、情感替代和情感补偿的理论方面得到解释和验证。

按照弗洛伊德的理论,投射就是把自己内心中存在的不为社会接受的欲望和行为归咎于他人。人们对于现实中并不存在的虚拟人格之所以表现出喜爱和崇拜,实际上折射出的是人们长时期被压抑、处在知觉意识下层、不能表现出来的思想、记忆和愿望。人们将自己内心的愿望、欲求、理想和情感向外投射和放大,通过社会许可方式表现出来,其本质实际上是一种深层自我的现实化、人格化和理想化。通过相应技术手段为虚拟角色赋予“拟人”特质,将他们塑造成了有血有肉的“人”,自然也会赢得受众的喜爱。因此,人们对主持传播虚拟人格的接受和喜爱在某种程度上不过是在寻求一种对现实交往缺憾的补偿。以小冰为例,现实生活中,很多人可能会因复杂的人际关系愁眉不展,但同微软小冰交流则不会觉得复杂和有压力。由于有大数据技术对海量语料库的分析,小冰不仅可以让受众感觉与之聊天更真实、有趣,而且绝不会出现现实当中无话可聊的尴尬。

虚拟人格是对主持传播人格的超越与补偿

受众喜爱虚拟主持人并不单纯是对其虚拟形象和人格存有好奇,而是虚拟主持人人格中有着人们对交往对象理想人格的期许和渴望。理想人格一般是指一定社会或阶级所倡导的道德上的完美典型,是人们普遍认为的完美人格形象,是如马克思所提出的全面发展的人。⑦利用技术手段对虚拟主持人进行外形、语言等类人化创造,再为其赋予符合社会主流价值观的近乎完美的理想人格特质,这必然会在短时间内激起受众对AI主播虚拟人格的兴趣和喜爱。而这恰好从侧面证明因技术实现的虚拟人格并不能颠覆和否定主持传播的存在基础和传播优势。相反,虚拟人格受欢迎也再次证明:被替代的恰恰是主持传播中非人格化的东西,有温度、有灵魂、充满人文关怀的人性化传播依然是主持传播的核心。

因此,主持传播中的虚拟人格不等于人格的虚拟或虚无,而是更契合受众期待的人格,更能体现受众理想的人格主张,也不存在对传统主持传播主体真实、平民化、无角色扮演理论的颠覆。从近年来深受观众喜爱的虚拟主持人的人格特征亦能发现,虽然这些虚拟人格在形态和风格上存在差异,但其通过节目外显或力图塑造的“人设”,不管是洛天依的“可爱、乖巧、情感丰富、有些冒失、天然呆、比较内向”;还是小冰的“可爱、自夸、多才多艺、傲娇、容易嫉妒”,恰恰是现实中真实主持人所缺少或没能充分展现出的“理想化”人格。

由此可见,主持传播的拟人格化与主持传播人格化的内涵,即主持人真实的平民化定位并不矛盾。追求理想、完美人格的拟人格化实际上是主持传播人格化在否定之否定进程中的人格进化。

技术推动与主持传播中的人格进化

有学者在研究领导人的形象塑造时借助心理学和人际交往心理学的相关理论,将民众对领导人的人格期待概括为四个方面,即崇高预期、个性预期、才资预期和平民预期。⑧从主持传播的人际性特征及其效果实现的传播机理来看,这四种人格期待同样存在于一般受众之于主持传播主体的人格期待当中,也可以在虚拟或人工智能主持人的“身”上得到验证。

虚拟或人工智能机器主持人之所以受到关注和欢迎,实际上恰是因为它们折射出了现实主持人在人格上的缺憾和不足。受众心目中比较理想的主持传播人格既要有普通人一般的平民气质,又要有高于普通受众的高尚品格;既要有鲜明的独特个性,又要有精湛的专业水准。正是现实中的主持传播者人格特质的缺少或不均衡,才使得受众将其对主持人理想人格的期盼移情到了虚拟主持人身上。受众虽然明知AI主播、小冰等虚拟主持人的人格并不真实,却因为它们身上体现出的某些人格特征恰好契合了他们的期待、符合他们的理想而成了他们乐于交往和信赖的对象。

因此,对于主持传播而言,技术发展可以算得上既是催化剂、试金石,又是照妖镜。在主持传播从“真人秀”到“机器人秀”的发展历程中,技术始终扮演着重要的角色,它不仅作为主持传播人格化的基础和保障而存在,而且通过不断检验和淘汰(替代)人格化特质的方式,促使主持传播人格向着更加人性、更加完善的方向进化。

【本文受到中国人民大学马克思主义新闻观研究中心科研项目(项目号:RMXY2016C014)支持】

原文链接:https://mp.weixin.qq.com/s/9thc5RasNSDmL2VBQHXk9Q



编辑:董莉




195#
 楼主| 发表于 2019-9-3 21:37:04 | 只看该作者
【案例】
全球首个 “数字人类” 曝光!意识在云端永生


编译 / 新智元(ID: AI_era)
编辑 / 肖琴
来源 / washingtonpost

“Hey Siri,让我跟逝去的父亲谈谈吧。”利用对话AI技术和数字助理设备,78岁的美国作家安德鲁•卡普兰即将成为首个“数字人类”,在云上永生。未来,通过语音设备与逝去亲人对话将成为可能,你会这样做吗?

“死亡不是真的逝去,遗忘才是永恒的消亡。”

当安德鲁•卡普兰(Andrew Kaplan)回忆起他一生的故事,这些引人入胜的故事给人的印象是,他是一个有着多重记忆的单一存在:20多岁时他是一名战地记者,作为以色列军的成员参加过六日战争(第三次中东战争),后来成为一名成功的企业家,再后来,成为一名多产的间谍小说家、好莱坞剧本作者。

如今,当这位78岁的银发老人和结婚39年的妻子在加州棕榈泉郊外的一片郊区绿洲中休闲的时候,他意识到,他希望自己所爱的人能够接触到这些故事,即使他已经不在人世。

卡普兰同意成为“AndyBot”,一个数字人,他将在云上永生数百年,甚至数千年。

Andrew Kaplan

如果一切按照计划进行,未来几代人将能够使用移动设备或亚马逊的Alexa等语音计算平台与他“互动”,向他提问,听他讲述故事;即使在他的肉身去世很久之后,仍能得到他一生经验的宝贵建议。

78岁美国作家当“小白鼠”,首个数字人类即将诞生。

对于成为“AndyBot”这件事,卡普兰开玩笑地称自己为“小白鼠”——他可能会作为世界上第一个“数字人类”而被人们记住。

几十年来,硅谷的未来学家一直寻求将人类从物质生命周期中解放出来,他们把死亡视为另一个需要“改变生命”解决方案的转型问题。随着数字文化的兴起,“人体冷冻运动”(将身体冷冻起来,以备将来复苏)已愈加活跃。今天,新一代的公司正在兜售某种近似于“虚拟不朽”的东西——在网上永久保存个人遗产的机会。

Eternime是这类公司之一。在其网站上,Eternime声称已经有超过44000人注册参加这个“大型的、惊险的、大胆的目标”——将“数十亿人的记忆、想法、创作和故事”转变成他们智慧的数字化化身,并无限期地活下去。


Eternime

Nectome是另一家这样的公司,专门从事记忆保存的研究,它希望其“高科技脑防腐处理”终有一天能让我们的大脑以计算机模拟的形式复活。

HereAfter,是卡普兰欣然接受的一家初创公司,其名称包含了对未来以及永恒的暗示。卡普兰渴望成为世界首批虚拟人类之一,部分原因是他认为,这是一种将亲密的家庭纽带延续几代人的方式。该公司的座右铭——“永远不要失去你所爱的人”——回应了卡普兰的想法。


HereAfter

“我的父母已经去世几十年了,但我发现自己仍会想,’哎呀,我真的很想向爸爸妈妈寻求一些建议,或者只是为了得到一些安慰,’”他说。“我认为这种冲动永远不会消失。”

“我有一个30多岁的儿子,我希望有一天这对他和他的孩子会有一些价值,”他补充道。


Andrew Kaplan同意成为第一个“数字人类”

关于逝去亲人的仪式可能因文化而不同,但几十年来,人们对所爱之人离世后的怀念是类似的:我们会翻阅老旧的家庭相册,观看不怎么清晰的家庭录像,在T恤上印上亲人的脸——甚至纪念他们的Facebook页面,在线保存他们的数字记忆。

但未来学家表示,这些可能即将改写。专家们说,如果科技成功地创造出高情商的数字人类,它可能会永远改变人类与电脑交互的方式,以及处理失去亲人创伤的方式。“AndyBot”可能成为世界上第一个有意义的例子,它提出了关于不朽的本质和存在本身目的的复杂哲学问题。

HereAfter 由Sonia Talati和James Vlahos共同创办,Talati自称是一名个人遗产顾问,James Vlahos是一名加州记者,也是一位对话AI的设计师。

两年前,Vlahos因创建了一个名为“Dadbot”的软件程序而闻名。当时,Vlahos得知他的父亲即将死于癌症,“Dadbot”的想法在他脑海里萌生,他想利用AI,让父亲“永生”。Vlahos在父亲生命的最后三个月,将与父亲就各种话题的谈话、讲述用摄像机录下,最后,他记录了 91970 个单词,训练出一个对话AI“Dadbot”。通过“Dadbot”,他可以与逝去父亲的计算机化身他交换文本和音频信息,谈论他的生活、听歌、闲聊和说笑。

自从Dadbot在社交媒体上广为传播之后,Vlahos收到了许多为他人创建纪念亲人的AI的请求,他决定开辟一个尚未开发的“数字人”市场。

“我妈妈花了两年时间才把我爸爸的语音留言从家里的电话里删除。”Vlahos说。“她不想让他的声音消失,这是我从其他人那里听到的。很遗憾的是,我们仍然依靠这种原始的方法来听到逝去亲人的声音。”

Vlahos正在构建一个更复杂、更人性化的虚拟模型,不仅是听录音,而是鼓励与逝去亲人的“虚拟形象”进行互动。这最初是一个应用程序,通过提示问题记录某人的口述个人历史。例如,当你的祖母回答了一系列关于她的童年、婚姻和重大生活事件的问题后,她的声音将被转换成一个语音机器人,可以通过智能手机或虚拟助手访问。

由于虚拟助理设备越来越普及,使用率也在不断上升,Vlahos认为,它们能让自己与已故亲人进行许多人渴望的那种随意的互动。

Vlahos的公司采用订阅模式,允许用户每月付费与“数字亲人”互动。经过适当的知情协议,非亲属也可以购买“数字人”订阅。Vlahos说,他认为这项服务是一种“互动回忆录”,并预计它将特别吸引年龄在30至50岁之间的用户,这些用户希望在为时已晚之前保存父母的记忆和精神。该公司正在为客户开发虚拟配置文件,并预计在明年将推出公共应用程序。

Hey Siri,让我跟逝去的父亲谈谈。

Vlahos说:“你用硬盘来记录音频往往很糟糕,在日常生活中,你真的有时间坐下来观看83年圣诞节的8小时的视频记录吗?”

他说:“现在想象一下,你可以站在厨房里,大声呼唤已故的母亲,然后立刻得到她的回答。”“能听到我们所爱之人的声音是一种美好的感觉。”


安德鲁•卡普兰正在参与“HereAfter”公司的项目

正在创造虚拟数字人的Fable公司的首席执行官Edward Saatchi表示,与数字人类互动不仅是不可避免的,而且是人类与技术互动的下一个飞跃。

他说:“想象一下,在未来,Alexa或Siri是一个有脸、有生命、有声音的角色,你可以和他们面对面地互动。”他认为,数字人最终将取代安卓和iOS。“你可以和数字人一起玩游戏、点餐、消磨时间或学习一门语言——或者做任何你通常和朋友一起做的事情。”

然而,要想让数字人变得完美,他们将不得不着手解决一个困扰计算机科学家数十年的问题:实现人与机器之间的“多回合对话”。不像点披萨——简单、简短、有特定目标的对话——多回合的对话是自由流动和自发的,在不相关的话题之间自由流动,使用几乎无穷无尽的自然语言,就像人们之间的对话一样。

Vlahos说,他的产品与用户的沟通越流畅,就越能吸收被沟通对象的音调和节拍,就越能传达出真实的亲密感。

与此同时,他知道,计算机要像人类一样处理多回合对话,即使不是几十年,也需要数年时间。他的目标是实现一个更现实的短期目标,让数字人能够分享关于他的一生的故事。

即将出版的新书《寻找意义:悲伤的第六阶段》(Finding Meaning: the Sixth Stage of Grief)的作者David Kessler说,亲密关系可能会让一些人从失去亲人的悲痛中振作起来,但也可能给其他人带来严重的问题。

Kessler说,对于悲痛的用户,他们的目标是以更多的爱,而不是痛苦地纪念逝者。他们的目标不一定是放弃悲伤,而是以健康的方式将痛苦融入生活中。一个逝去的亲人,在Google Home里和你聊天,能帮助实现这个目标吗?

“我认为能,”他说。“悲伤就像我们的指纹一样,每个人都是不同的。有些人会觉得这个工具很好,但有些人永远不会使用它,因为对他们来说,数字人怎么不像是他们所爱之人。”

他唯一关心的是,确保弱势群体明白,他们面对的是“以AI的形式纪念父亲,而不是认为与父亲的实际联系仍在延续。”

在步入暮年之际,卡普兰回顾了他完整的一生。卡普兰说,他并不追求永生。然而,他确实看到了成为一个数字人的另一个好处——他多年来一直在写作引人入胜的小说。

“最终,每个故事都是关于试图帮助我们找到我们是谁,我们来自哪里,这也不例外,”他说。“对我来说,这是关于我的历史,一种有限的永生,为我未来的亲人创造了一种亲密的个人体验,他们会想知道自己来自哪里。”
你会选择成为“数字人”吗?

《华盛顿邮报》发表这篇报道之后,如两年前的“Dadbot”一样,引起了读者大量讨论。

有人说:“这让我想起了19世纪的唯心论热潮——同样是渴望与逝去的亲人直接交流。我有许多已故父亲写给他父母的信。但是我发现我无法下决心去读最后一封,因为一旦我读了,我的父亲就再也没有什么新的东西可以告诉我了。只要那封信还没有读完,我们的谈话就永远不会结束。”

有人表示担心:“万一遭到勒索软件怎么办?‘给我100万比特币,否则你奶奶会遭殃!每耽搁一天,我就删除一兆字节的数据。你不想让她再死一次吧?’此外,有人可能由于陷入困境、无法再负担订阅费用而再次失去所爱之人,这不是很残忍吗?”

有人说:“这对哀悼亲人毫无帮助。我认为,最终会有更多的人生活在幻想的泡泡里,因为没有什么能保证这不是一张死者的Instagram。这一切听起来都很有趣,也很奇怪,特别是订阅那部分。一旦你停止支付,你就得再次经历亲人的死亡。也许,我们应该做一个亲人的毛绒公仔,放在沙发上,当你捏他们的手时,他们喉咙里的小录音机会说‘我爱你’或‘快去打扫房间’”。

读者朋友,你认为将逝去亲人变成“数字人”永生的想法怎么样?如果可以,你会这样做吗?




编辑:董莉





196#
 楼主| 发表于 2019-9-3 22:34:09 | 只看该作者
【案例】
AI时代,编校人员会下岗吗?

导读

当前市场上计算机校对软件种类繁多,既有文字处理软件自带的简单校对模块,也有功能更为强大的专业校对软件。目前的校对软件,是以主要由人工维护的字词库或语法库为依托,通过软件进行比对识别,查找错误并给出修正建议。

那么AI时代,编校人员会下岗吗?


当前校对软件存在的不足

虽然主流校对软件在产品宣传中都宣称应用了人工智能技术,但笔者实际使用过程中的效果感受并不明显,例如字、词校对结果中并没有将一些常见的误报滤去,整句校对能力依然十分薄弱,数据库的更新仍主要依赖于人工维护而使时效性显得不足。现阶段校对软件普遍存在的不足之处主要有以上五点:
(1)整体报错率高。由于校对软件对错误的检查主要是基于自身数据库对待校文稿内容的比对实现,对发现的不一致之处缺乏进一步核验机制,误报的情况比较普遍。随着软件自身数据库规模的不断升级,误报率往往随之上升。有人根据经验评估,初次使用“黑马校对”时报红(软件认为肯定存在错误的)准确率在50%上下,报粉(软件认为疑似存在错误的)准确率在15%上下;经过手工添加针对性的专业字库并添加常用词维护后,报红准确率在70%上下,报粉准确率在20%上下。[1]鉴于此,大多数出版社在实际工作中都是人工校对后辅以软件校对。
(2)对整句的纠错能力较差。软件一般只能简单地比对字词库,在语义层面并不能具体问题具体分析。比如在一篇关于资产减值方面的文章中,作者用五笔打字连续输入时,某一处“计提的差值准备不低于监管标准”,其中的“差值”应为“减值”,但校对软件无法根据上下文提示这一错误。又如,对于用拼音输入法输入的“曹操亲统大军与六倍的军队交锋”,“六倍”为“刘备”之误,校对软件同样没有任何错误提示。而类似的输入法错误在稿件中会经常遇到。
(3)对古籍的校对能力不足。由于古籍中文言文用字较少、语法结构复杂,且涉及通假字等情况,目前的校对软件基本无法有效识别文稿中存在的错误。
(4)对科技名词(即专业术语)的纠错能力弱。科技名词是汉语词汇中比较特殊的、专业性很强的一部分词汇,由于一般由西文翻译而来, 经常出现同一概念在同一书稿中有不同叫法的情况。“黑马校对”对科技名词几乎无能为力;“方寸”有一定的术语识别能力,但仍十分薄弱。
(5)对图表、公式及版式的校对能力弱。目前校对软件对图表、公式等的校对仅停留在文本层面,而对于其他常见问题诸如图文不符、图(表)序错误、图表设计不合理,以及图表或各级标题的版式等方面基本上只能依赖人工校对。


“人工智能+校对”的能与不能

人工智能(artificial intelligence,AI)的应用领域十分广泛。在新闻出版领域,人工智能在写作、组稿等方面已有所尝试,如腾讯的Dreamwriter、华盛顿邮报的Heliograf等[2]。校对是新闻出版领域中的一项基础性工作,本身具有相对客观化、规范化的特点,较之写作或组稿等工作更易于人工智能技术的实施。
1. 人工智能有望实现的功能
(1)提高字、词校对的准确性。字、词校对是校对软件的基本能力,但目前其突出问题是错误识别率高的同时问题报错率也高,因而校对的结果仍需人工进行大量复核确认工作,使用价值大打折扣。校对软件有望借助人工智能技术对已出版的规范文献或图书内容进行训练学习,以及对校样文本进行语义识别,自主对校样进行审核和纠错,将报错率降至可接受的水平。
(2)提高整句校对质量。目前的校对软件在文稿的整句校对层面较为薄弱,人工智能在语言处理方面的积累和进步有望在这一方面提升校对质量。借助人工智能,可通过对文稿内容的解析以及对已出版的规范文献或图书内容的对比,评估待校语句可能存在的语义错误并给出可靠提示。
(3)提高校对结果的时效性。以“黑马校对”单机版软件为例,其内含79个专业词库、8 000万条海量词汇。人工智能技术介入后,有望在数据库更新时实现批量读取和分析,及时淘汰过期或错误的数据库内容,这对于一些时效性较强的政策语、流行语、新科技术语等的校对工作非常有帮助。
(4)提高科技名词的校对能力。通过将全国科学技术名词审定委员会公布的科技名词实时纳入数据库,并通过语义分析评判文稿中名词使用的合理性,从而给出准确的校对结果。
(5)具备古籍校对能力。人工智能有望发挥其在大数据训练方面的优势,通过对大量规范化处理后的古代文献的解析,在语义层面更好地理解文言文的语法结构和表达方式,弥补当前软件在古籍校对方面的短板。
2.人工智能短期内无法实现的功能
(1)无法校对图表、公式等非文本内容。一些专业图书或文献中会出现较多的图表、公式,这些内容由于格式没有统一的标准,也缺乏足够数量的可比较样本,无论是传统的校对软件还是人工智能软件对此都无能为力,即使是可见的将来也仍然需要靠人工进行有效的校对。
(2)无法校对常识。文稿中涉及的诸多常识,如历史朝代、国家毗邻关系、人物生平等,在我们看起来非常简单,但机器处理起来却异常困难。目前的基于深度学习的人工智能技术,对此并无良策。
(3)无法校对逻辑性错误。目前的人工智能技术在跨领域推理和抽象能力方面还不成熟,对于文稿中可能存在的如叙事先后、因果、并列不当等逻辑关系的错误,基本上无法识别。
面对人工智能,编校人员怎么做?

在当前人工智能的技术条件下,充分利用机器在基础工作中的高效率和人工在创造性领域的独有优势,走人机协作道路,是兼顾编校工作效率和质量的现实选择。
在人机协作趋势下,编校人员应注意从以下几方面提高自身职业能力:
(1)熟悉机器的特点,做到扬长避短。就传统的校对软件而言,字、词的校对是强项,整句、语义的校对是弱项;就未来的校对软件而言,在字、词的校对上功能可能会更加强大,对整句、语义的校对也有可能取得突破,但对于常识、逻辑关系等的校对依然会是弱项。编校人员在使用软件的过程中,可以结合具体的文稿,摸清机器校对的长处和短处,合理安排工作重点和软件使用的时机,以人机互补的方式提高工作效率和工作质量。
(2)关注前沿科技,更新自身知识结构。科学技术的更新迭代,可能让人类引以为傲的传统工作能力瞬间失去市场价值,例如计算器取代算盘,自动驾驶未来极有可能取代驾驶员等。在校对领域,新技术的出现也会使得一些过去积累的经验或技能失去价值。编校人员在平时的工作中可以适当关注科技热点,通过使用最新版本的校对软件等方式了解新技术的特点,及时淘汰过时的工作方式,更新自身知识结构,以此来适应新环境下的工作要求。
(3)增强自身工作创造性,积累有价值的工作经验。就目前的人工智能技术而言,它的能力边界不是无限的。在可见的未来,人类的创造性工作仍然是机器无法取代的。编校人员在日常的工作实践及学习中积累的特定领域的常识、文本规范、语言逻辑等方面的知识,是机器难以掌握和取代的,也是编校人员价值的最有力体现。编校人员可以在日常工作中注重对此类创造性工作能力的培养和提升,打造专属于人类自身的价值。

原文链接:https://mp.weixin.qq.com/s/RDD5Gd7U28L5a73gSfDrgw


编辑:董莉


197#
 楼主| 发表于 2019-9-6 23:14:25 | 只看该作者
【案例】
少有人深知的虚拟文娱内容

1 号 按

「虚拟文娱」,正在入侵「现实文娱」,甚至即将发动传媒史上一场最大风暴的革命。

它以未来之势,将从内容、场景、职业、产业,全面渗透甚至取代当下文娱,最终「虚拟文娱」与「现实文娱」将会形成彼此交融又分庭抗礼的两大文娱阵营。

9月,传媒1号将连载《内容篇》《场景篇》《职业篇》《产业篇》4部「虚拟文娱」长篇特稿,本文《内容篇》为系列的第1部特稿:

上篇,1号邀您关注虚拟文娱内容的当下,您将看到当下各大品类内容正在涌现出的一个「虚拟进化」大趋势;

下篇,1号邀您关注虚拟文娱内容的未来,当各大品类的「虚拟进化」积累到一定势能,虚拟文娱即将迎来一个新内容物种大爆发的大时代(「1号虚拟文娱共研营」群内私享)

本文共计5675字,需要您有一段深度阅读与伴随思考的时间。

2016年前后,曾经风光一时的VR(虚拟现实)泡沫破裂,原因包括:技术不成熟、硬件过于昂贵难以普及等。另外,相关文娱内容太少也是最重要的原因之一。

近两年,亚马逊、Hulu、爱奇艺、YouTube、B站等多个内容行业巨头纷纷重金布局「虚拟文娱内容」。其中,既包括狭义上的以VR(虚拟现实)技术为基础的虚拟内容,也包括更广泛意义上的与「现实文娱」相对照的各种虚拟文娱内容。

传统各类型内容的「虚拟化」进程已开启,未来的内容生态将是什么模样?



上篇:你所该知的现状
全内容品类的「虚拟进化」大趋势

经过近几年的发展,以VR/AR、全息投影等各种技术为基础的虚拟文娱内容已经呈现出类型丰富、形式多样的特征,涉及到了新闻、综艺、影视、游戏、体育以及动漫等多个传统内容类型。

当然,目前「虚拟」元素与各类型内容的结合基本上都还处于最初级的阶段。各种「语法」和「理论」都还在摸索和实践当中。但其对各类型内容未来发展趋势的影响正在逐渐显现。

1、新闻+虚拟化元素

新闻节目的「虚拟化」进程体现在多个方面,包括:与AI人工智能技术相结合,出现了虚拟的播报型主持人;采用VR全景拍摄技术的新闻短片;还有虚拟演播室等。其中,采用VR技术的拍摄方式和手段,将会极大的提升观众的「在场感」,与重大新闻事件亲密接触,让新闻事件栩栩如生,观众感同身受,获得与现有新闻节目全然不同的感官体验,这对新闻节目未来发展趋势将会产生更加深远的影响。

今年全国两会期间,央视网的相关报道就采用了大量的虚拟手段,将VR全景技术贯穿于两会全程报道,集VR视频、Vlog、VR图集、手绘图解等多样态为一体,报道形式新颖生动。

其中,《全景沉浸看报告》首次在主题主线报道中运用「VR+AR」技术,聚焦政府工作报告中主要议题,提炼重点数据进行解读,在VR实景视频的基础上,在真实场景中糅合三维动画,对政府工作报告进行生动、具象的可视化展现。

《全景沉浸看报告》视频

央视网《VR全景|「通」民心「道」信心》《VR漫游|街里街坊看两会》《VR融媒体|奋斗路上》等三大主题系列报道,全视角、多样态的呈现「代表通道」「委员通道」等两会场内外的声音和故事。

Nonny de la Peña,沉浸式新闻的先驱之一, 创作了应对城市饥饿、家庭暴力、叙利亚难民危机等公众议题的项目并获奖,她表示:「有了虚拟现实,你可以亲身感受新闻报道,而不是只是靠想象。我们有机会真正创建关联。只有您置身其中,才能感同身受。」


2、综艺+虚拟化元素

综艺节目也越来越多的开始探索与虚拟化元素的结合。比如:虚拟歌姬开始参与偶像选秀类节目;虚拟主持人或嘉宾出现在综艺节目中;AR等技术支撑的虚拟舞美效果成为重点晚会标配;节目采用VR全景拍摄部分片段等。但目前,还没有出现完全意义上的、有较大影响力的VR综艺。

《明日之子》中,二次元选手荷兹HeZ的加盟,给节目带来较高关注度的同时,也带来了不小的争议。二次元选手的参赛资格、晋级标准的模糊性等成为了争议的焦点。


2019央视网络春晚中,撒贝宁的孪生虚拟主持人「小小撒」表现出了超强的主持控场能力,撒贝宁也忍不住感叹到:「我的天,我感觉像照镜子一样。」

在今年央视春晚中,吉林长春一汽分会场上,飞驰的高铁从眼前疾驰而过、巨大的机械臂整齐划一地排列在一汽生产线上,立体感十足。这样奇幻的舞台效果主要得益于AR技术的应用。目前,AR特效已经成为各大晚会高标准的标配。从春晚到各大卫视的跨年晚会以及天猫「双11」晚会等,AR特效助力成就了不一样的虚拟舞台。

除了上述虚拟元素之外,还有部分常态的综艺节目,如:《中国新歌声》《盖世英雄》等也拍摄了部分VR片段,供观众进行体验。

《中国新歌声》VR版本预告

另外,在节目推广及解锁环节中,也有节目植入了虚拟元素。爱奇艺网综《姐姐好饿2》在进行推广时,将宁波一公交车候车亭改造成全国首个AR候车亭。《明星大侦探3-末日蜂蜜》中侦探团陷入困境时找到的MG方舟登舰卡上的信息需要使用QQ-AR才能扫描出芯片图案,从而获得破案的一项关键性证据。

3、影视+虚拟化元素

电影应该是探索VR拍摄语言最为前沿的内容类型。每一次技术革新都会带来电影语言的一次巨变,比如3D,虚拟技术自然也不会例外,必将从拍摄方式、叙事模式、剪辑方式等方面带来一次全新的电影革命。

亚马逊Prime Video推出了VR流媒体平台,还有大量精选VR内容,比如:《侵入!》《返回切尔诺贝利》《格陵兰岛融化》等。YouTube VR 则拥有全球最大的VR视频内容库。

爱奇艺《仙剑奇侠传四VR》截图

爱奇艺从2015年开始布局VR产业,目前业务核心聚焦线上的VR内容分发平台打造以及面向线上线下的内容自制两部分。2017年,爱奇艺做了《无间道VR》《神探蒲松龄VR》《仙剑奇侠传四VR》《偶像练习生之VR恋之物语》等20余部VR影片。针对线下影院打造的首部VR电影《无主之城》已经入围威尼斯国际电影节VR单元,这也是国内首部科幻动作题材VR影片入围威尼斯国际电影节。

这些VR电影在镜头语言、叙事模式、剪辑方式等方面不断进行摸索和创造,以更加适应VR全景拍摄方式,提升观众的沉浸感。

另外,据报道,截止2019年我国约5400家LBVR(通过收门票的线下VR电影体验店),预测2023年将超过1万家。变现模式和商业模式逐渐清晰,这将在很大程度上进一步推动VR电影向前发展。


4、游戏+虚拟化元素

游戏可能是与虚拟元素结合尝试最多、进度最快的内容类型,并且,已经出现了影响力较大的作品。虚拟游戏被认为是游戏行业发展的未来方向。

据报道,2018年5月, VR 游戏《Beat Saber》的游戏过程视频横扫YouTube等各大社交网站,引发的关注度远超VR设备的限制。该游戏上线一个星期,销量突破五万份,不到一个月,销量超十万份。这一数字相对VR游戏而言具有突破性意义。目前,B站上也有大量的相关视频,播放量最高达到了150万次,可见其影响力范围之大。

VR 游戏《Beat Saber》

虚拟技术的互动性和沉浸性特征与游戏天生具有较高的适配性,只要技术支持到位,游戏模式选择恰当,发展前景相对清晰。青岛国际VR影像周暨砂之盒沉浸影像展创始人楼彦昕认为,叙事型内容还在摸索阶段,如何讲述故事、传递情感,是需要靠不断尝试和探索才能找到的。相比之下,游戏向的VR内容,其生存情况相对乐观,整体有抬头趋势。


5、动漫+虚拟化元素

二次元内容与虚拟技术的结合在虚拟偶像、虚拟主播等领域已经比较成熟,而且具备了较强的变现能力。随着技术的不断进步,虚拟技术与二次元的结合还有非常大的想象空间。

今年B站的BML VR演出迎来了初代虚拟歌姬初音未来与国内当红虚拟歌姬洛天依的同台,引发了巨大的关注。2016年2月,洛天依还登上湖南卫视小年夜春晚。目前,运营方已经开始为虚拟歌姬举办以现场全息投影、实时动作捕捉、线上AR直播为技术支撑的演唱会,承接商品代言等,表现出了较强的商业变现能力。

传统动画与VR技术相结合生成的VR动漫作品让受众拥有了更直接的沉浸式体验,尤其是对充满好奇心的青少年儿童具有较强的吸引力。爱奇艺制作的针对儿童的VR动漫作品《嘟当曼VR奇遇记》具备了较强的线下场景吸引用户的能力。据悉,接下来爱奇艺还将打造基于马伯庸原作的《四海鲸骑VR》等动画作品。


6、体育+虚拟化元素

VR直播体育赛事已经比较常见,但囿于各种技术和环境原因,要想让观众体验到理想化的在场状态还有较长的路要走。

2016年的里约奥运会开启了奥运会VR播放比赛的先河;2017年中超联赛也开始了VR直播。另据报道,皇马俱乐部将联手丽新集团在珠海横琴打造一座世界顶级足球体验中心,将融合体育、娱乐与高科技元素,以VR和AR带动不同的模拟足球训练体验,让宾客置身于顶尖的足球世界,一尝成为职业足球运动员的滋味。

但目前由于技术条件、全景拍摄方式的可行性等方面存在的问题,VR直播体育的效果还远没有足够真实到让观众以为自己好像就在球场中央。要想达到理想化的状态,还有很长的路要走。

这一部分,1号将在近期继续推出《体育的「陷」怎么包进虚拟文娱的「皮」》一文,为读者带来更深度的「体育+虚拟文娱」趋势观察,敬请关注。


下篇:你所该知的未来
虚拟文娱时代催生的「新内容物种大爆发」

基于上述各类型内容的「虚拟化」实践以及虚拟技术的互动性、沉浸性和多感官性三大突出特点,可以畅想一下儿未来真正的「虚拟」内容时代究竟会呈现出怎样的精彩呢?

它会催生新的内容物种,它会革新传统的内容类型,它会形成未来的内容生态……






编辑:董莉

198#
 楼主| 发表于 2019-9-8 22:27:56 | 只看该作者
【案例】
华为推出AI诗人“乐府”:唐诗宋词都不在话下,我竟一时分不出真假

理科生文艺起来,可能真没文科生什么事了。
不信?你看下这首七言绝句:
有网友读完之后表示:
真🐂🍺啊,押韵,意境,内涵都很赞。
不仅能够写诗,还能作词,比如这首满江红:
而且,还能写藏头诗:
你能想象,这是完全不懂写诗的理工生的杰作吗?
但它就是。
这些诗来自华为诺亚方舟实验室新推出的写诗AI“乐府”。
问世之处便引发了不少关注。
对于它的作品,有人称赞:
蕴意丰富的诗,工整不乏意趣,程序做的实在牛逼,给开发人员点赞
还有人“搞事情”,表示:
一声塞雁江南去,几处家书海北连。莫道征鸿无泪落,年年辛苦到燕然。要说这个 AI 写的没有北大中文系平均水平好我是不信的。
甚至有人说“李白看了会沉默,杜甫看了会流泪”。
当然,也有人指出问题:
很工整,不过感觉目前大多还是syntax层面的,没有到semantics层面。稍微欠缺些灵魂。
也有“真相帝”出来发声:
辛弃疾的流水散文式用典,老杜的沉郁顿挫拗救法,都是AI比较难学会的。问题不是AI太厉害,而是读者已经看不出格律诗里面比较精密的手法了…
对于这些问题,华为诺亚方舟实验室语音语义首席科学家刘群也在微博进行了答疑,披露了不少这只AI背后的故事:
其实我们也不懂诗,我们也没有用诗的规矩去训练这个系统,完全是系统自己学到的。
那么,这一AI到底是如何学的?论文已经公布。
理工男の文艺源自GPT
与自由生成文本不同,生成中国的古诗词是一个挑战,通常需要满足形式和内容两个方面的要求。
中国的古诗词有各种各样的形式,比如五绝、七绝、五律、七律、满江红、西江月、水调歌头等各种词牌以及对联,每一种都有相应的字数、押韵、平仄、对仗等规定;
内容方面虽然简单,但要求更加难以琢磨:一首诗要围绕着一个主题展开,内容上还要具有连贯性。
华为提出的“乐府”系统,与当前大多数解决方案不同,不需要任何人工设定规则或者特性,也没有设计任何额外的神经元组件。
整个研究中,需要做的就是把训练用的诗词序列化为格式化的文本序列,作为训练数据。
然后通过对语言模型token的抽样,生成满足形式和内容要求的诗词,比如绝句、律诗、词,以及对联等等。
而且,他们还提出并实现了一种对模型进行微调以生成藏头诗的方法。
这背后的能量来自GPT,一个由OpenAI提出的预训练自然语言模型,核心理念是先用无标签的文本去训练生成语言模型,然后再根据具体的任务通过有标签的数据对模型进行微调。
乐府AI是首个基于GPT打造的作诗系统,而且与谷歌提出的BERT息息相关。
整体的GPT模型是在BERT的源代码基础上实现的,Transformer大小的配置与BERT-Base相同,也采用了BERT中发布的tokenization 脚本和中文 vocab。
具体来说,训练诗歌生成模型的过程如下:
整个模型训练过程一共有两个阶段: 预训练和微调。
华为的这个GPT模型,是用一个中文新闻语料库进行预训练的,然后通过收集了公开可得的中国古诗词进行微调。
如上图所示,首先将示例诗歌转换为格式化序列。序列包括三个主要部分:格式、主题和诗体,中间用标识符分开。
在对联中,因为没有主题,就上句为主题,第二行为正文。所以,在生成对联的时候,就成了给出上联,生成下联的模式,也符合了“对对子”的习惯。
整体的数据集规模并不小,预训练用的中文新闻语料库,有2.35亿句子。微调用的数据集有25万绝句和律师,2万首词以及70万对对联。
预训练是在华为云上完成的,使用8块英伟达V100(16G) GPU训练了4个echo,一共耗费了90个小时。
微调的过程是将所有诗歌序列输入Transformer,并训练一个自回归语言模型。目标是观测任何序列的概率最大化:
微调的过程,不需要特别长的时间,如果训练过长,这个模型就在生成过程中,就会倾向于从语料库中直接用原始句子了。
训练完成后,先将要生成的诗歌的格式和主题转化为一个初始序列,然后将初始序列输入到模型中,然后对诗体部分的剩余字段按token进行解码。
在解码过程中,并不使用硬约束来保证格式的正确性,而是让模型自动为特定位置分配逗号和句号,在识别到token为“EOS”的时候,解码过程结束。
而且,采用截断 top-k 抽样策略来获得不同的诗歌,而不是束搜索。具体是每次采样一个Token时,首先选择具有 top-k 最大概率的Token,然后从 top-k Token中采样一个特定的token。
他们说,即使采用截短的 top-k 抽样策略,生成的诗歌仍然是正确的形式。
论文中介绍称,训练藏头诗的方法也是这样,只是在格式化序列的时候方法有所不同:用每一行中第一个字符的组合来代替一首诗的原始主题:“五言绝句(格式)床疑举低(藏头诗)床前明月光,疑…月,低头思故乡。”
效果如何,华为也在论文中进行了充分的展示,比如下面这四首“江上田家”,只有一首是唐朝诗人写的,其他三首都是来自乐府AI。
从上到下,ABCD,你能辨别出来哪个是真迹吗?(答案在文末揭晓)
谁是第一AI诗人?
中国古诗词生成AI,华为“乐府”并不是第一个,也不是最后一个。
在此之前,就有清华大学孙茂松团队提出的“九歌”。
根据官方介绍,这一系统的采用深度学习技术,结合多个为诗歌生成专门设计的模型,基于超过80万首人类诗人创作的诗歌进行训练学习,具有多模态输入、多体裁多风格、人机交互创作模式等特点。
近日,也有人基于中文版的语料训练出了中文版的GPT-2,并将其用于诗歌生成。
就在“乐府”上线的这一天,还有北京大学、国防科大等机构联合发布了新的作诗模型,基于无监督机器翻译的方法,使用基于分段的填充和强化学习根据白话文生成七言律诗。
那么,哪一个更强呢?
因为中文版GPT-2和北京大学联队的系统还没有开放体验,参与这场“华山论剑”的就只有华为“乐府”和清华“九歌”两个选手。
第一轮:主题“夏日”,七言绝句
清华九歌赋诗一首:
华为乐府赋诗是这样的:
两个AI都有瑕疵的地方,清华九歌一张嘴就开始说“秋来”,华为乐府也提到了“四月”,并没有特别的意思,显然都与夏日有些出入。
但相比之下,华为乐府的夏日元素也更多一些,比如荷香,夏阴等等。
第二轮:主题“长夜”,五言绝句
来自清华九歌的诗是这样的:
不须愁独坐,相对倍凄然?这个意境Emmm……婚姻要破裂了?
华为乐府的作品:
直观上来看,意境刻画不错,但冲击力有所不足。
这一轮,两个AI表现都不错,而且都有相应的意境体现出来。相对来说, 清华九歌的情感层次更丰富一些。
第三轮,藏头诗“神经网络”,七言绝句
清华九歌作品是这样的:
从押韵和意境来看,都还不错。华为乐府给出了这样一首诗:
同样,这首藏头诗也能够展现几分意境。
这一轮,两只AI都能较确切地完成任务,给出了具有几分意境的诗词。
至此,经过三轮比拼,整体上来说,高下难分。其差别,在于双方的实现方式。
清华九歌,基于多个为诗歌生成专门设计的模型,相对来说比较复杂,在诗歌的格式上,控制比较严格,虽然严肃但作诗速度的确比较慢。
而华为的乐府,只是基于GPT,按照刘群的话来说,他们也不懂诗歌,并没有用诗的规矩去训练这个系统,完全是系统自己学到的,生成诗歌的时候速度很快。
对于乐府AI生成的诗歌水平,刘群也颇为谦虚:
我们找过懂诗的人看,说韵律平仄并不完全符合规矩,只是外行读起来还比较顺口而已。
至于两种方式孰优孰劣,也不妨参考下那句老话:文无第一。
华为诺亚方舟实验室
华为诺亚方舟实验室成立于2012年,隶属于华为2012实验室。
诺亚方舟为名,也能体现出这一实验室在华为内部的重要性。此前,任正非也提到过,希望这些实验室能够成为华为的“诺亚方舟”。
目前,这一实验室在深圳、香港、北京、上海、西安、北美和欧洲等城市设有分部。研究方向包括计算机视觉、自然语言处理、搜索推荐、决策推理、人机交互、AI理论、高速计算等。
关于乐府AI,华为也在论文中标注说明,这是他们在研究GPT时的一个副产品。目前,华为乐府AI已经在小程序EI体验空间上线。
支持五言绝句、七言绝句、五言律诗和七言律诗,以及藏头诗模式。作词、对对子还没有上线。
最后,附上一首乐府生成的七言律诗人工智能
      
对了,答案选C。
相关传送门:
乐府AI论文
GPT-based Generation for Classical Chinese Poetry
https://arxiv.org/pdf/1907.00151.pdf
清华九歌作诗网站:
http://118.190.162.99:8080/

原文链接:https://mp.weixin.qq.com/s/efID_R9ajL34P95eGKkrQA


编辑:董莉


199#
 楼主| 发表于 2019-9-11 22:10:30 | 只看该作者
【案例】

韩国制定数据与人工智能经济激活计划(2019—2023年)



来源:中国科协创新战略研究院《创新研究报告》
第35期(总第301期)2019-08-30


编者按:2019年1月,韩国科学技术信息通信部(Ministry of Science and ICT)与相关部门在第一次创新发展战略会议上发布了《数据与人工智能经济激活计划(2019—2023年)》报告。该报告的发布旨在促进数据与人工智能的深度融合,制定了“3大战略9项任务”,通过实施激活数据价值链,构建世界水平人工智能创新生态系统,力争迈进人工智能先进国家。本报告就其主要内容进行摘编。

一、出台背景
第四次工业革命的成功,取决于高质量数据市场的形成、高水平人工智能技术的获取及数据与人工智能的有机融合。由于当前韩国的数据价值链(构建、流通、利用)市场不足、人工智能技术水平与其他发达国家差距较大,有必要制定有关数据、人工智能的领域培育战略,以及促进数据与人工智能融合的政策。


二、展望与推进战略

此次计划制定了“使用数据与人工智能最为安全的国家”的展望及3个目标:①加大数据市场的投资力度(由2018年14万亿韩元,预计到2023年达30万亿韩元)。②增加人工智能独角兽企业(由2018年0家,预计到2023年达10家)。③促进数据与人工智能的深度融合(到2023年实现数据与人工智能融合集群,并培养1万名专业技术人才)。


此次计划的实施集结了政府和民间的共同努力,政府的作用集中在促进数据与人工智能融合发展的基础设施建设及制度改进,为创业企业与中小企业创造公共领域需求等生态系统的构建上;民间的作用在以数据和人工智能为媒介,加强大企业和中小企业的合作及促进利用数据与人工智能开发新产品和服务上。


三、推进任务
该计划包括3大战略9项任务,主要内容如下:


//(一)战略1——激活数据全周期价值链//

1. 任务1——系统性的数据积累与数据平台的扩大开放

(1)优质的数据积累与扩大开放

为建设并开放交通、金融、能源等公共领域数据库,计划于2019年投入743亿韩元构建10个大数据平台和100个大数据中心。

(2)建立研究数据的共享与利用体系

为实现对政府资助的研发项目及开展过程中所积累的研究数据进行系统管理并共享利用,计划于2019年以韩国科学技术信息研究院(KISTI)为主力,建设国家研究数据平台。

(3)公共数据开发与有效管理

基于2018年4—7月对784个公共机构共24977个开放数据的全面调查结果,计划于2019年构建数据地图,到2023年,将需求度高的数据(如安全、新产业等)指定为国家重点数据并予以开放。

2. 任务2——建设优质的数据流通基础

(1)支持优质的数据购买与利用

计划从2019年起每年支持1640家中小企业、风险企业的数据购买与加工费用,使其利用数据开发新服务,计划到2023年累计支持8000家企业。同时从2019年起,针对创业企业、中小企业在加工和利用数据时可能产生的问题,在数据专门机构内部设立专门负责小组,提供法律咨询帮助。

(2)建设安全的数据交易基础

从2019年起,推进开展数据的交易标准、价值评估和法律制度等交易支持体系的相关研究。计划于2020年建设具备数据检索、交易与中介、分析与测试等综合功能的交易支持基础设施,并于2023年完成升级改造。

(3)数据质量提升技术开发与标准化

从2018年开始,推进与数据预处理、数据精炼、自动获取、开放型流通平台(CKAN,DCAT)1 等数据质量相关的核心技术开发,以及金融、通信、能源、制造等数据流通核心领域的数据标准体系与标准化(TTA,ISO)建设。

3. 任务3——扩大个人、企业和社会对数据的利用

为了让全国人民感受到数据利用带来的便利,在征得本人同意的情况下实施个人数据利用项目“我的数据”增加至每年8个。

(1)扩大以信息主体为中心的数据利用项目——“我的数据(My Data)”

计划于2019年投入97亿韩元扩大“我的数据”利用项目,支持在全国人民个人同意的情况下,在利用率高的金融、通信等领域开展个人数据利用项目。同时,为在金融等领域使信息主体可以积极行使权力利用数据,于2019年推进“我的数据”项目的制度化建设。

(2)支持中小企业利用数据创造新服务

为支持传统中小企业的大数据利用,2019—2023年在各地区推进大数据企业的咨询与分析援助项目,以解决各地区中小企业在新产品开发、生产改进及市场等方面遇到的困难。并从2019年起,企业之间共享生产现场中收集的数据,通过缩短工程时间、优化设计、减少错误等实现创新工程生产。

(3)扩大解决社会问题的旗舰项目

计划于2019年投入60亿韩元推进开展先导示范服务项目,以通过大数据分析解决社会难题、提高生产力。大数据旗舰示范项目包括如:预防老年痴呆症/抑郁症/自杀倾向、预防电话诈骗/短信诈骗、下水道设备提前维修感知等。


//(二)战略2——构建世界水平的人工智能创新生态系统//

1. 任务4——建立人工智能中心(AI hub)

(1)大规模人工智能数据的积累与开放

以民众需求为中心,于2019年投入200亿韩元阶段性构建并开放图片、常识等机器学习通用数据和法律、金融等产业特色数据。

(2)支持开发与挖掘人工智能的核心算法

2019年投入50亿韩元建设一个任何人都可以参与的开放式网络平台(暂用名为Challenge.kr),以研究者之间的自律竞争为基础,挑战性和创造性地解决问题。对开发出优秀人工智能算法的中小企业和风险企业(由2019年20家,预计到2023年达180家)予以人工智能商业化费用支持。

(3)提供人工智能技术开发基础

2019年投入60亿韩元给中小创业企业以特殊形式提供人工智能研究及人工智能产品、服务开发所需的资源支持。为企业提供云端GPU资源来处理大量的人工智能数据。

2. 任务5——提升人工智能技术研发实力

(1)掌握新一代人工智能核心技术

为突破算法局限,促进描绘人脑动作原理的强化学习技术等新一代人工智能技术开发,加强与美国、欧洲等先进国家和地区的国际共同研究。从2019年起,加大对人工智能相关基础研究、硬件技术(智能半导体、量子计算)等人工智能技术研发的投入力度。并制定包含新一代人工智能开发内容的《第3次脑研究促进基本计划(2018—2027年)》,推进通过脑科学研究揭示人工智能的“大脑”原理,将其应用于新一代的算法开发。

(2)加强人工智能技术研发

2019年投入84亿韩元以加强人工智能技术研发,开发SW-HW融合、复合功能等高难度的新一代人工智能核心技术。

3. 任务6——构建人工智能应用生态系统

(1)建立人工智能应用生态系统

以人工智能产学合作活跃地区的重点大学为中心,推进各区域“人工智能融合研究中心”的设定与运营,计划每年投入15亿韩元,使人工智能融合研究中心数量从2019年的2所扩展到2023年5所。

(2)支持人工智能企业的技术开发

2019年集中支持7家人工智能企业利用产业应用特色数据进行人工智能技术开发,增强竞争力。加强100家海外和国内企业之间的合作项目“全球AI 100”,通过人工智能产品化咨询、商业化支持和技术项目交流,增强韩国国内人工智能企业的技术竞争力,促进企业进军海外。


//(三)战略3——促进数据与人工智能的深度融合//

1. 任务7——打造人工智能融合集群

2020—2029年,打造汇集企业、大学及研究所,能够综合性支持数据与人工智能相关研究开发、人才培养和创业的人工智能融合集群园区,促进数据与人工智能相关的企业、高校和研究所之间的有机合作。通过实时收集和积累地区的主力产业数据,培育开发创新型人工智能产品和服务的创业产业。将政府研究机构产生的生物、化学、机械等不同领域研究数据与人工智能相关研究所、企业联系。

2. 任务8——拉动社会与产业的需求

(1)为国家层面的智能信息化创造公共需求

将国家信息化项目转换为基于数据与人工智能的智能化项目,增加国家信息化项目利用数据与人工智能的比例,从2018年的21.4%提升到2022年的35%。将不同机构各自运行的不同信息系统更新为综合性平台系统,将已落后的系统更新为可持续进行人工智能学习的智能系统。

(2)整个产业领域推广“人工智能+X旗舰项目”试点

为增强现有主力产业的竞争力、创造新市场以提升产业结构,2020年在安全等领域推进“人工智能+X旗舰项目”的试点服务。①医疗:建立以人工智能为基础的智能型医疗软件与应急医疗系统,以及对新药候选物质合成周期进行自动化模拟的定制型新药开发系统。②安保:建立可识别行动人员身份、实时监测、追踪危险状况的人工智能系统,以预防机场内的犯罪和恐怖袭击。③安全:建立利用大数据和人工智能进行监测、预测的预警系统,综合利用监控设施、空间信息GIS、无人机、影像分析技术等。

(3)机器学习用数据实现数据转换

为将公共支持项目所产生的数据转换成机器学习用数据,2019年制定各领域的数据收集与加工指南。2020年起对大数据中心、大数据平台的数据进行整合,自2022年起对国家研究数据平台的数据进行转换,到2023年再扩大到其他机构的大数据平台。

3. 任务9——制度融合与人才融合

(1)修订法律促进智能信息化

2019年,全面修订《国家信息化基本法》《电子政府法》,以数据和人工智能为中心的智能信息技术促发国家系统、产业和整个社会的革命性变化。同时,2019年修改《个人信息保护法实施令》,包括了为完善数据使用制度,对匿名定性处理、匿名信息安全义务措施等内容。2020年制定以人类为中心的人工智能伦理措施,以支持符合伦理的使用数据与人工智能,防止产生负面作用。

(2)培养专业技术人才

①数据与人工智能人才:通过大学、研究院的专业教育、业务培训、产业针对型项目,培养企业立即可用人才。受众以青年为主体,培养形式包括与岗位结合的大数据专业教育,设立人工智能研究生院与海外著名研究所、企业和大学的合作项目等。②各领域人才:通过了解和应用相关技术、案例分享等教育,培养最快应用到数据和人工智能的医疗、金融、制造领域人才。③创新人才:通过设立和运营非学位课程的创新学院(innovation academy),以数据与人工智能项目为基础培养问题解决型人才。建立类似法国42学院(Ecole 42)2 的两年制创新学院,计划2019—2023年投入1800亿韩元每年选拔500名,共培养专业人才2000名。同时,打造数据与人工智能领域的人才交流平台,计划每年召开1次“融合人才研讨会”。


1 CKAN: 综合知识档案网络(Comprehensive Knowledge Archive Network)/DCAT: 数据目录(Data Catalog).

2 位于法国巴黎的信息技术人才培养机构Ecole 42。该校为纯粹的民间教育机构,由法国第四大移动服务商Free Mobile的董事长Xavier Niel创办,以免学费、无教授、无毕业证为特点。入学时不限专业、履历、国籍,完成课程后不会授予学位。教育内容也是由人工智能、大数据等信息技术企业所需内容组成。


  
编译:叶京 罗彧 王达
编辑部成员:张丽琴 王国强 刘 薇 王 达 曹学伟


200#
 楼主| 发表于 2019-9-11 22:37:13 | 只看该作者
【案例】
17万“人脸数据”遭公开售卖 当事人对此一无所知
近日,北京青年报记者发现,在网络商城中有商家公开售卖“人脸数据”,数量达17万条。网络商城运营方已认定涉事商家违规,涉事商品已被下架处理。
  网售人脸数据
  每个人有多张照片
  近日,北青报记者在一家网络商城中发现,有商家公开兜售“人脸数据”,数量约17万条。在商家发布的商品信息中可以看到,这些“人脸数据”涵盖2000人的肖像,每个人约有50100张照片。此外,每张照片搭配有一份数据文件,除了人脸位置的信息外,还有人脸的106处关键点,如眼睛、耳朵、鼻子、嘴、眉毛等的轮廓信息等。
  此外,数据中还能提供人物性别、表情情绪、颜值、是否戴眼镜等信息。商家在商品说明中称,数据中并不提供所涉及人物的人名和身份证号等信息,也不得用于违法用途。
  北青报记者以买家的身份联系售卖前述人脸数据的商家,商家称,其售卖的人脸样本中,一部分是从搜索引擎上抓取的,另一部分来自境外一家软件公司的数据库等。该商家称,从发售至今,他已多次卖出这些数据。其表示,自己平时从事人工智能的相关工作,因此收集了很多人脸数据,发售出来“也就是挣个饭钱”。
  北青报记者获取到了该商家售卖的数据包,其中确实包括2000个文件夹,每个文件夹里都有数十张照片和相应的数据文件。一些照片属于知名演艺界人士,也有一部分照片来自医生、教师等市民群体,还有部分照片为未成年人。
  北青报记者随机选取了一名面露微笑的男子照片,其数据文件中,用英文记录着不少位置信息,在这些信息前可以看到左眼、右眼、鼻子等字样。数据中还记录了照片中的人为32岁的没戴眼镜的男性。
  数据中确实包含有照片中人物情绪的信息,但并不是直接指出人物流露出了哪种情绪,而是将情绪分成悲伤、中性、困惑、气愤、惊讶、恐惧、开心等指数,颜值、皮肤状况等也是通过指数来表现。
  面部数据上网
  当事人对此一无所知
  北青报记者辗转联系到有肖像出现在数据包中的当事人,广西的一名医生李先生,他在获悉自己的照片和脸部数据被人网上贩卖后非常震惊。他告诉北青报记者,自己从未授权任何人采集自己的脸部数据,也没有允许过任何人出售自己的照片和脸部数据。
  另一名在北京某大学任教的老师陈先生告诉北青报记者,自己从来不知道有人收集了他的脸部数据,无法接受有人用这些数据牟利。
  杭州又拍云网络科技有限公司工程师云飞告诉北青报记者,目前尚未听说有人利用人脸数据去进行不法行为的案例,“但17万个数据的数量还是非常罕见的,特别是每个数据还有相对应的信息标注,更是不多见。”
  云飞还表示,从理论上来说,人脸数据被随意出售还是存在一定的风险。“如果收集到某个人足够详细的肖像和人脸数据,通过技术手段可以实现实时换脸,搭配其他一些音频仿真技术及个人隐私信息的话,用来视频聊天诈骗可能就具有很强的迷惑性。”云飞建议,对于一些非金融类或者不太重要的服务,不建议用户开通人脸识别等功能。
  认定商家违规
  网络商城运营方予以下架
  京师律师事务所律师熊超表示,网上售卖人脸数据,除了涉嫌侵犯他人隐私权、肖像权之外,还涉嫌侵犯了公民的个人信息安全,“从网络出售个人人脸数据这个情况来看,属于侵犯公民的肖像权、隐私权和个人信息安全。尤其是在出售时没有获得公民的许可,这种行为是明确违反法律规定的。”熊超律师同时表示,也希望相关方面对于人脸识别技术和由此产生的数据尽快出台相关制度或者法律规定,让老百姓的个人脸部数据获得更好的保护。
北青报记者就网售的人脸数据情况向网络商城平台运营方进行了举报,经运营方核实,确认该商家销售的人脸数据不符合平台的销售规则,平台运营方称将立即进行相应的处理。截至9日下午,该商品已被下架。文/本报记者 屈畅
编辑:王豪

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表