传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
201#
 楼主| 发表于 2019-9-12 20:32:49 | 只看该作者
【案例】

我们都是天生的联觉者?


弗拉基米尔·纳博科夫(Vladimir Nabokov)曾把他创造的著名虚构人物,洛丽塔,称作“带有天然色彩的小幽灵”。每当他想到任何字母时,他的脑海中就会神奇地闪现不同的颜色,所以他赋予这个“小幽灵”的色彩尤其生动鲜艳。他在回忆录《说吧,记忆》(Speak Memory)中描述了一些这样的体验:“b的颜色被画家们称为赭,m是一卷粉色法兰绒,而今天,我终于成功地在迈尔兹和保罗的《色彩词典》中找到了与v相配的‘蔷薇石英色’”。他的这种体验就是联觉,也被称为共感觉。这是一种神经怪象:联觉者们的不同感觉会被混淆,他们有可能同时看到和听到音乐,或是尝到视线中物体的形状


— Vladimir Nabokov


纳博科夫和与他类似的联觉者们看到的每个文字和数字都有专属的、似乎独一无二的颜色。这一类联觉被统称为字素色彩联觉,也最为普遍;每100人中就有4人拥有这种联觉。这也是被研究最多的一种联觉。其他常见的类别包括色联觉——单个的音符音调会激发不同的色彩,交响乐产生的“音墙”则能描绘出一副三维的景象;空间顺序联觉——秒、周工作日、月或年会像行星环绕恒星一样环绕着联觉者们;词汇味觉联觉——这类联觉者认为每个词语或名字都有各自强烈而独特的味道,有些美味,有些则苦到说不出口。还有一些联觉者称他们会将序数语言人格化——认为字母和数字有各自的性别、颜色、和人格类型:“4”可能是个坏脾气又吝啬的男人,总是对他的妻子恶语相向,而“6”却是一位高贵体面,举止优雅讲究的女士。

这世上没有什么比我们感知世界那微妙而难以形容的方式更加主观和想当然。这也是为什么很多联觉者一生都没有意识到他们日常的感知体验有多么奇特而罕见。很多人都是在朋友不理解地问道“你说我的名字尝起来像豌豆汤?什么意思?”之后,才惊讶地察觉到自己的与众不同。自从20世纪80年代开始,有关这样突然发现自我的报道就渐渐多了起来,此时,为了判断这种情况的真实性,人们第一次开发了一些认知测试。到了90年代中期,脑部扫描和脑电波测量也开始用来追踪联觉的各个形态的生理机能。乔治华盛顿大学研究联觉的神经学家理查德·西托维克(Richard Cytowic)在《牛津联觉手册》中写道,联觉者们在得知这些测试证明了他们不是一直在“胡编乱造”后,非常“震惊和开心”。

随着越来越多联觉者们认识到自己的与众不同,新的联觉类型出现了。2008年,加利福尼亚大学圣地亚哥分校的两名神经科学家,V·S·拉马钱德兰(V S Ramachandran)和他当时的学生大卫·布兰格(David Brang)就首次遇到了一名“触觉情感”联觉者:一名对纹理有本能反应的年轻女子。她告诉布兰格,她发现自己有这种联觉是因为在小时候,每次父母给她穿上牛仔布料的衣物时,她就会感到又恶心又压抑,开始大哭。另一方面,蜡的质感让她感到尴尬,丝绸则会带来一种让她忍不住咯咯笑的满足感。

研究者们也意识到,一个人可以拥有不同的联觉体验。对某种质地感到厌恶的一个人可以同时看到覆盖着不同颜色的文字和数字。联觉也常常在家族成员中复现。纳博科夫的父母能看到染着不同颜色的文字和数字;他的母亲还能在听到音乐时看到一团团色彩。他的妻子薇拉和儿子德米特里也拥有相同种类的联觉——字素色彩联觉。如纳博科夫所说:“他(德米特里)认为是紫色或淡紫色的一个字母,在我看来是粉色,而我妻子认为是蓝色的。这个字母就是M。所以是粉色和蓝色混合到一起使他看到了淡紫色。这就像基因在画水彩画。”


很多著名的视觉艺术家和音乐家都是联觉者,包括荷兰画家梵高;俄罗斯画家瓦西里 · 康定斯基(Василий Кандинский);英国画家大卫 · 霍克尼;俄国作曲家尼古拉 · 里姆斯基 - 科萨科夫;美国作曲家伦纳德 · 伯恩斯坦和美国作曲家、钢琴家艾灵顿。
— 图片来源:1923年康定斯基描绘音乐的画作《穿越线》


如今,人们渐渐发现,联觉者这个群体或许并不像我们曾经想象的那样特殊而排他。普通人也可能体会到那些缤纷的色彩与生动的感受。虽然我们和纳博科夫没有血缘关系,我们也可以像看水彩画一样看书。有些神经科学家和发展心理学家认为我们对于日常感知复杂性的研究还远远不够,并提出,所有人都应该在“联觉谱”上占有一席之地。我们需要的只是回忆一下自己的婴儿时期,也就是当大脑还在发育中时。

这个想法的萌芽来自启蒙运动时期的哲学家让-雅克·卢梭所著的小说《爱弥儿》。他假设,一个刚出生就有成年人身体和婴儿感知的孩子几乎不会有任何自我感知的能力,并且他的各个感觉会相互融合,变成一种混乱的联觉原型。卢梭写道:“他的眼睛不能看到颜色,他用耳朵发声,他的身体感觉不到与相邻身体的接触,他甚至不会知道他有个身体。他所有的感觉都会被合并到了一处,并只能一起作为‘感觉中枢’存在。”

1818年,这个想法给了玛丽·雪莱灵感,并描述了另一个与众不同的新生儿最初的感知体验。她的小说《弗兰肯斯坦》中的怪人说,“我刚出生时能同时看到、感觉到、听到和闻到东西;我其实很久以后才学会了区分开不同感觉的运转方式”。




心理学家威廉·詹姆斯(William James)在《心理学原理》中也提出,婴儿的感官世界与联觉很相似。他写道(并激动地强调了加粗的部分),“无论是来自多少不同的感官的多少感觉,都会同时到达婴儿的大脑。因为婴儿的大脑还没来得及单独经历不同的感觉,所以他们感知到的其实是被融合为一体的感觉”。因此,“同时被眼睛、耳朵、鼻子、皮肤和胃肠‘围攻着’,婴儿的感官是一种合一而夸张的混乱;并且归根结底,我们之所以认为所有事物都处在同一空间内是因为,对于新生儿来说的所有强烈的、巨大的感觉都被合并到了同一个空间”。如果詹姆斯提出的感知模型是正确的,并且大部分人成熟后就可以区分不同的感觉,那联觉者们是否只是停留在了各个感觉融为一体的阶段?换句话说,是不是所有婴儿都是联觉者

1988年,这个非凡的想法在《新生儿的世界》(The World of the Newborn)一书中被再次提到。其作者,安大略麦克马斯特大学的发展心理学家达芙妮·毛瑞尔(Daphne Maurer)与她的作家丈夫查尔斯·毛瑞尔(Charles Maurer),也描绘出了一种新生儿的感官世界,与卢梭提出的“成年儿童”拥有的联觉原型非常相似:


他的世界闻起来和我们的差不多,但他不只通过鼻子闻到气味。他也能听到、看到、并感觉到气味。他的世界是一片刺鼻的混沌;除了刺鼻的气味还有刺鼻的声音、苦涩的声音、香甜的画面和让他闻到酸味的触碰。如果我们能体验新生儿的世界,我们会以为自己进入了一个生产致幻香水的工厂

毛瑞尔夫妇认为,所有婴儿都是联觉者:在他们的大脑中,化刺激为感知的部位之间有很多蜿蜒曲折的连接。他们觉得很有可能是这些跨大脑区域的串音给予了婴儿联觉的感觉中枢。查尔斯·毛瑞尔在阅读苏联心理学家亚历山大·鲁利亚(Alexander Luria)所著的《记忆大师的心灵》(The Mind of a Mnemonist)时,第一次想到了这种可能。这本书的主角回忆到了一次童年早期经历的“模糊的联觉感”,“一团有不同颜色的烟雾”代表噪音,并很有可能是一段对话。毛瑞尔于是问当时在研究婴儿视觉发展的妻子,有没有可能所有新生儿都是联觉者。

达芙妮·毛瑞尔在一次Skype面试上描述了自己的回答:“我说,呃,不知道……我得想想那种情况会以什么方式表现,然后回去看看婴儿们的数据。”她用一种轻盈、梦幻的声音说着,像是极尽全力想让小小的婴儿也听懂。“当我看完时,我觉得他说的有道理。”



她找到的证据来自20世纪80至90年代的一组脑解剖的研究;这组研究跟踪了神经连接的数量和范围是怎样随着婴儿长大成人而减少的。得益于解剖跟踪——一种可以标记神经元群并跟踪它们的发展轨迹的技术,这些研究记录了小猫、幼年猕猴和人类脑中的神经元网络是如何随着对某些技能的选择性强化而变得稀疏的。作为补充证明,毛瑞尔现在引用的一些更新的研究也表明,人类的神经网络修剪似乎主要发生在7至9岁

对于随着婴儿大脑的成熟和神经连接的修剪,联觉会减弱的假设,毛瑞尔在详查行为学实验时发现了一些有力的线索。一则早期的例子就是哈佛医学院的研究者们在1974年做的一个实验。她告诉我:“如果你把电极放在新生儿的头上,然后刺激手腕,他的触觉皮层会开始有活动。如果你同时开始放一些白噪音,你会发现他触觉皮层的活动变化增强了。”也就是说,在婴儿的大脑里,触摸和声音的刺激互相放大。但是在成人脑中,同样的触觉皮层不再处理听觉刺激,触觉皮层的活动也不再因为听到声音而增强。


这个结果证实了毛瑞尔多年在医院病房里研究新生儿视觉发展所得的发现。她还记得,在混乱吵闹病房里的婴儿会“开始哭,罢工”,而那些被单一的刺激温柔对待的,例如轻声细语或是被平整地盖上一张轻薄的毯子,则会开始“轻柔地笑。这些婴儿似乎是对刺激的整体级别作出反应,不管是来自什么感官的刺激。他们的神经系统似乎是在把各种声音、画面和触摸加在一起”。

随着时间的推移,他们的感知会变得更加精确。毛瑞尔在此引用了俄勒冈大学的神经科学家海伦·纳威(Helen Neville)的文章。她1995年的研究表明,语言的刺激可在六个月大的婴儿脑中产生脑波,涵盖听觉和视觉区域。但是这会逐渐减弱:到三岁时,语言就会渐渐只刺激听觉区域。毛瑞尔从这些和其他研究中得出的结论是,婴儿脑中高度连接的神经网络会随着时间的推移减少,或是被他们所处的环境和经历“修剪”。她认为神经网络修剪的作用就是减弱婴儿的这种“幻觉”现象——但在联觉者们的脑中,那些错综复杂的连接反而被强化和巩固了。

新生儿脑网络图像。
— 图片来源:imperial.ac.uk


要想以现象学的方式完全复制婴儿经历是不可能的。不过加州大学圣地亚哥分校的两名心理学家,凯蒂·瓦格纳(Katie Wagner)和卡伦·多肯斯(Karen Dobkins),最近第一次证明了该现象在游戏中的存在。她们给两个月、三个月、八个月大的婴儿和成人看了一些圆形和三角形的深色剪影;这些剪影会在两组不同的背景色上出现,包括红和绿,或是蓝和黄。该研究的其中一个分支假设,把三角形与红色联系在一起的婴儿与成人联觉者们会更倾向于看向出现在绿色背景之上的三角形。

在分析了大概100轮这样的婴儿测试后,瓦格纳和多肯斯可以确定两个月和三个月大的婴儿有这种联觉的体验,但八个月的婴儿和成人没有表现出任何强烈的联想或偏向。她们2011年在《心理科学》(Psychological Science)发表的结果中明确支持了毛瑞尔夫妇的伟大想法,写道,“联觉联想”在“早期出现然后……随着年龄的增长减弱”。


其他研究表明,婴儿联觉会随着他们的成长在幼儿期时“重置”。爱丁堡大学的神经科学家朱莉亚·西姆纳(Julia Simner)曾尝试用延时的方式记录这个过程。她在一篇2009年发表于《大脑》(Brain)的研究中,让615名6岁学童把13种颜色与26个英文字母和0至9的阿拉伯数字配对。10秒之后,他们的配对会被打分。47个得分最高的一年以后再做了一次这个测试。他们的联想在这一年的介入时间中被强化了——这也让我们得以窥到联觉的实时发展方式。当西姆纳在三年后再次测试这些现在已经10或11岁的准联觉者们时,她发现他们被固化的联想被继续强化、变得更加稳定了。因此,我们可以清楚地看出联觉的发展轨迹:34%的字母和数字联想在7岁以前就会固化,48%在8岁以前,71%在11岁以前。


达芙妮·毛瑞尔有一些其他相关的实验也正在进行中。例如,她从三名女性字素色彩联觉者的孩子三、四岁时就开始跟踪他们的发展。这些孩子需要从96支蜡笔中选出他们心目中分别符合每个字母、个位数字和四种基本形状的颜色。这些任务会被重复完成,并被交错分布在几周中的某几天。她目前已经发现,非联觉的孩子每次都会选择不同的颜色,但拥有联觉母亲的孩子们的选择始终如一,一样的颜色总是被配给一样的字母、数字和形状。一年以后,这种一致性增强了,从40%到了75%。毛瑞尔被这些孩子微妙的联想所震惊了——他们几乎就像他们的联觉母亲一样敏锐。以其中一个孩子举例说明,他/她甚至抱怨配给某个字母的绿色“绿得不太对”。


联觉者“看”到的音乐

跟踪整个人生的延时实验花费太多而且太具有挑战性,所以现在,联觉研究者们更多地专注于交叉知觉融合:大脑集合不同的感觉输入(例如气味和声音)的方法。你或许会觉得我们不同的感官是独立工作的,像针孔摄像机或者激光束一样专注于单一的画面或声音。但实际上,所有的感觉都在一直无缝融合着,一起以一种更加清晰、生动的方式记录着世界——现在就回想一下你上次感冒时吃的像棉花一样难以下咽的糊糊,或者你是怎么在听到一声低沉的狗叫后准确地知道该往哪个方向逃跑。这些都是画面、声音、气味和各种其他感觉被集结到了大脑中,相互交错的结果

这种感官之间的相互作用带来了一种隐晦的“第六感”。例如,你或许会觉得一个发出尖锐吠叫的生物的体型与另一个发出低沉咆哮的相比更小。1929年,芝加哥大学的语言学家爱德华·萨丕尔(Edward Sapir)与柏林大学的心理学家沃尔夫冈·科勒(Wolfgang Köhler)最早发现了这种跨感官的联系。萨丕尔让他的被试们把“mil”和“mal”两个没有实际意义的单词分配给两张一大一小的桌子。所有被试(除了一名)都认为“mil”是小一点的桌子。同时,科勒让他的被试把“takete”和“maluma”两个编造的单词分配给两种形状,分别是圆钝、凹凸不平的类变形虫形,和一种有锯齿状边缘的碎片形。大部分被试都确信“takete”应该是多刺的,而“maluma”则是那不规则的一团。后来的研究表明,儿童和成人都倾向于把明亮和刺耳联想到一起,也更多地认为一个相对较小的球会发出更高的声音


研究者们感兴趣的是这些相互作用是否存在于一个连续统一体上,其中非联觉者的情况比较轻微,而联觉者的比较强烈。这将表明,我们都多多少少能够感受到联觉带来的丰富感知。如前文所说,达芙妮·毛瑞尔提出,这些联觉的联系在大脑中体现为不同脑区之间的连接,并会在神经修剪的过程中被削减;她认为,这些相互作用或许的确存在于一个连续统一体上

威斯康星大学麦迪逊分校的神经科学家爱德华·哈伯德(Edward Hubbard)也认同这一观点。他告诉我,“你对世界的真实体验是高度集成的,并一直在结合来自不同感觉模态的信息”。他说,联觉者其实就是“在体验一种加强的版本”


一个著名的例子就是1976年由英国心理学家哈利·麦格克(Harry McGurk)发现的一种感知幻觉——“麦格克效应”(McGurk effect)。一个人重复说“ba”的视频与一个人重复说“ga”的音频被同时播放,而这两种刺激在大脑中会被融合,最终让你以为你听到了一个中和的版本:“da”。

2001年,哈伯德和他当时的指导老师拉马钱德兰在大脑皮层中发现,之前所说的连接很有可能就是通过角回这个十字路口来往返传递信息的。角回是一个极小的、侧贴在主要大脑区域旁的结构,并同时处理触觉,听觉,和视觉信息。哈伯德和拉马钱德兰给三名角回受损的病人展示两种抽象的形状,分别叫“bouba”和“kiki”——也就是另一个版本的“maluma-takete”测试。哈伯德说,“与健康的大学生相比,病人们没那么倾向于认为圆钝的形状是‘bouba’而尖锐的是‘kiki’。”


随后,哈伯德和拉马钱德兰让病人们解释了一些比喻或者修辞手法,例如 “董事下台”。如他们所料,病人们普遍在完成多种语言任务时遇到了困难。角回受到的损伤夺走了他们的“语言第六感”。比如说,他们不能认识到“尖锐”一词不仅可以用来形容人们看到的有锯齿的物体,也可以用来形容听到的吉他扫弦,或是“kiki”这样的单词。换句话说,他们缺少我们大部分人都默认的这种“第六感”。研究者们最后的确得出了结论:这种跨感觉融合的普遍性与它和大脑结构之间可能的联系说明,我们都是“隐匿联觉者”。

可以说,联觉是真正驱动隐喻和艺术的引擎。不信问问梅根·哈特(Megan Hart)。她就在小说《将你撕碎》(Tear You Apart)中写道: “‘爱’这个词对我来说一直尝起来像新鲜的墨水和柔软的纸张。就像一首刚刚写好的诗。”与小说一样,诗歌本质上是联觉的,而这一特质的秘密来源就是我们联觉的自我。

2014年11月,在华盛顿特区开展的神经科学学会会议上,“联觉谱”的概念吸引了很多注意。研究者们认为,这种天赋或许正解释了为什么有感官残疾的人依然可以正常生活。伊利诺伊大学香槟分校的博士研究生詹妮莎·西摩尔(Jenessa Seymour)描述了一个得出以下结论的实验:先天性失聪的个体拥有非常清晰的周边视觉,而且这在昏暗的环境下尤其有用。她说,管理这项特长的额外脑力其实来源于一个本来被用来合成画面与声音的部位——颞上回后部(superior temporal gyrus)。




多伦多大学的神经科学家瑞安·史蒂文森(Ryan Stevenson)进一步研究了这个部位的一个角落——颞上沟。颞上沟在言语感知、面部感知、情感解读和对他人目的的理解中都起到了作用。他指出,自闭症患者的这些能力都有受损。他在一个实验中测试了有自闭症和没有自闭症的儿童融合听觉与视觉信息的能力。首先,他测试了这些孩子们感知简单、非语言的声音的能力,例如“哔”声或口哨声。之后,他们需要通过麦格克效应的测试来融合声音和画面:也就是看一个人的嘴巴发出“ga”声的视频,同时听一个人说“ba”的音频。研究者们发现,两组被试听到“哔”和口哨声的能力不相上下,但自闭儿童听到“融合”的“da”声的几率小了很多。他们大部分都只听到了他们的耳朵独立听到的“ba”声。
史蒂文森得出的结论是,有自闭症的儿童在合并所看和所听到的事物时速度更慢,尤其是言语。他解释道:就比如对我们来说,在一个嘈杂的房间里听一个人说话时,如果我们能看到那个人的嘴,就能听得更清楚。但是对自闭症儿童来说,有区分地合并他们听到和看到的事物更加困难。


结合来看,这些发现说明我们都多多少少是隐匿的联觉者。自闭程度越高,可能就越少联觉感。联觉不仅能够加强我们自己大脑中的连接,也能加强不同人思想之间的联系。缺失联觉的能力就等于脱离这些与自己和他人的连接。各种丰富的感觉造就了我们的早期发展,也推动了人性的发展。如果我们的大脑能回到联觉能力的巅峰——婴儿时期,或许我们就能更强烈地感受到在这个纷杂世界中不停冲刷我们的各种感觉


译者:Lemona
校对:tangcubibi
编辑:德馨


编辑:王豪



202#
 楼主| 发表于 2019-9-15 20:38:01 | 只看该作者
【案例】

徐匡迪院士之问揭开当下中国人工智能虚伪的面纱 | DataLaws

导读:
徐匡迪院士之问揭开当下中国人工智能虚伪的面纱。五一前上海召开的院士沙龙活动中“徐匡迪之问”引发共鸣:“中国有多少数学家投入到人工智能的基础算法研究中?”核心算法缺位,人工智能发展面临“卡脖子”窘境。中国制造正从“硬件组装厂”向“软件组装厂”蔓延,政产学研浮躁如故、积习难改。



徐匡迪院士之问揭开当下中国人工智能虚伪的面纱
核心算法缺位,AI面临“卡脖子”窘境
内容来源:科学Sciences,作者:秦陇纪,时间:2019.05.03

“中国有多少数学家投入到人工智能的基础算法研究中?”五一前上海召开院士沙龙活动,中国工程院院士徐匡迪等多位院士的发问引发业界共鸣,被称为“徐匡迪之问”。这一对当下中国人工智能直击核心的提问,不但表明了当下中国人工智能发展的短板,同时也揭去了披在当下所谓“人工智能”算法外表华丽的面纱。

“我国人工智能领域真正搞算法的科学家凤毛麟角。”4月28日超声大数据与人工智能应用与推广大会,东南大学生物科学与医学工程学院教授万遂人表示,“徐匡迪之问”直击我国人工智能发展的核心关键问题,“如果这种情况不改变,我国人工智能应用很难走向深入、也很难获得重大成果”。

人工智能是计算机技术发展到高级阶段,融合了数学、统计学、概率、逻辑、伦理等多学科于一身的复杂系统。是当下所有信息技术所不能达到的高级应用。其最为核心的技术便是人工智能算法。如何让计算机能像人类一样进行思考,如同人一样利用现有的知识进行学习并实现合乎逻辑的推理,是人工智能算法试图实现的目标。其技术绝不是一般公司能够轻轻松松实现的。当下国际社会公认的人工智能研发顶尖公司,如Google和IBM等投入了海量资源,动用了顶尖的数学科学家、计算机专家,能实现了计算机程序的一定程度智能化,但距离真正的AI仍然相差很远。

进入2018年,中国人工智能产业“忽如一夜春风来,千树万树梨花开”,一下子出现了无数人工智能研发公司,并都号称到得了显著技术进步。比如基于人工智能的医学图像识别系统,对于某个疾病的识别率高达95%以上,远远高于人工判读。中国人工智能真实如此繁荣吗?

1
中国人工智能产业界研发现状
某业内人士有幸了解过国内某大型互联网企业制作的人工智能应用。其定位于利用AI程序判读CT图像,利用算法实现对病灶的判读,提高医生的效率并降低负担。

当问到其核心的人工智能算法的时候,企业倒也是直言不讳,其核心技术是使用了国际上开源的人工智能算法。在被引入后进行针对特定目的进行了二次开发,并最后整体打包成为一套完整的人工智能应用。正是因为使用了开源的人工智能算法,才出现了许多应用明显能力不足的情况。

比如其无法提供一套大一统的应用。公司一共向我们展了大约六种疾病的诊断应用。不同的疾病需要使用对应的AI程序才可以得出相对准确的结果。如果将A疾病的算法使用到B疾病上,完全无法正常工作。就我浅薄的理解,真正人工智能的算法并不应当如些。它应当是一套通用的算法,既可以用于A疾病的诊断,同样也可以用于B疾病。我们需要做的是提供大量疾病案例供AI学习训练,随着训练样本数量的增加,会使人工智能模型被训练的越来越准确。但是这种一个疾病一个AI的方式还是头一次听说。好比一个医生只能看男性长胡子的感冒患者,如果是个不没长胡子的男患者,只能去隔壁就医了。

浙江大学应用数学研究所所长孔德兴教授清清楚楚说明白了这个问题。因为公司使用的都是开源算法。开源人工智能算法能力是不足的,根本无法实现预期的能力。人工智能算法堪称信息行业的核武器。如此威力庞大的算法怎么样可会在网上被开源出来?可以认为开源的人工智能算法相当于玩具水平的东西。想借助这种低水平的算法,来实现真正的人工智能应用怎么可能实现呢?



开源算法唯一好处在于人人都可获得,门槛非常低。所以大量公司从网上下载了开源算法,然后以其为核心研发出一套AI应用,再披上华丽的面纱,唬的普通用户奉若神明。这也在突然间中国出现了如此多的人工智能公司的原因之一吧。

真正人工智能的到来还需要很长时间,绝不是借助网上共享了的代码就能够实现的,必须要脚踏实地,一步一个脚印地开发出来,不付出努力想投机取巧是万万不能的。我国依靠开源代码和算法是否足够支撑人工智能产业发展?为什么要有自己的底层框架和核心算法?

2
缺少核心算法,会被“卡脖子”
“如果缺少核心算法,当碰到关键性问题时,还是会被人‘卡脖子’。”浙江大学应用数学研究所所长孔德兴教授对科技日报记者表示,我国人工智能产业的创新能力并没有传说中的那样强,事实是,产业发展过度依赖开源代码和现有数学模型,真正属于中国自己的东西并不多。

4个月零基础学会人工智能、16讲入门人工智能、算法线下大课……类似培训在网络上非常火爆,通过对于现有算法、模型的学习和训练,成长为人工智能工程师的“短平快”可见一斑。

既然代码是开源的,拿来用就好,为什么还有可能被“卡脖子”?

孔德兴解释,开源代码是可以拿过来使用,但专业性、针对性不够,效果往往不能满足具体任务的实际要求。以图像识别为例,用开源代码开发出的AI即使可以准确识别人脸,但在对医学影像的识别上却难以达到临床要求。“例如对肝脏病灶的识别,由于边界模糊、对比度低、器官黏连甚至重叠等困难,用开源代码很难做到精准识别。在三维重构、可视化等方面难以做到精准反应真实的解剖信息,甚至会出现误导等问题,这在医学应用上是‘致命’的。”

“碰到专业性高的研究任务,一旦被‘卡脖子’将会是非常被动的,所以一定要有自己的算法。”孔德兴说。换句话说,是否掌握核心代码将决定未来的AI“智力大比拼”中是否拥有胜算。用开源代码“调教”出的AI顶多是个“常人”,而要帮助AI成长为“细分领域专家”,需以数学为基础的原始核心模型、代码和框架创新。秦陇纪总结,中国制造正从“硬件组装厂”向“软件组装厂”蔓延,浮躁如故。

3
有算法之“根”才能撑起产业“繁茂”
所谓“树大根深”,人工智能的发展也是同样道理,越在底层深深扎下根基,越能够发展出强大的产业。那么,借助开源代码,“半路出家”的AI产业为什么会难以为继?

孔德兴解释说,在获得同样数据的前提下,以开源代码运行,AI深度学习之后或许能输出结果,但由于训练框架固定、算法限制,当用户进行具体的实际应用时,将很难达到所期望的结果,而且难以修改、完善、优化算法。

“如果从底层算法做起,那么整个数学模型、整个算法设计、整个模拟训练‘一脉相承’,不仅可以协同优化,而且可以根据需求随时修改,从而真正解决实际问题。”孔德兴说,基础算法往往是指研究共性问题的算法,它涉及到基础数学理论、高性能数值计算等学科,可以应用到多种实际问题中;而针对性强的应用算法往往会应用到具体问题所涉及的“具体知识、先验信息”,从而更好地解决实际应用问题。

“基础算法和应用算法都很重要,拥有基础算法将更有助于应用算法的丰富与深入。”孔德兴说,AI要应对的现实生活是复杂、多变的,当能够“应对自如”时,才能够促成产业的“繁茂”。

4
呼吁三方协力让数学不再置身事外
“一方面是政策引导,其实国家已经在加大这方面的扶持,例如科研基金上的设置等。”针对如何解决“徐匡迪之问”反映出来的问题,孔德兴认为,第二方面是行业企业在进行科技创新时,应有意识将数学学者纳入进来。“如果通过算法的开发,最终产品落地了,企业应该将算法开发时的数学学者纳入到成果分享中来。”孔德兴说,社会目前对于数学科学等“软实力”的认可程度不足,行业或法规层面应该做好数学研究成果的产权保护工作。

“第三方面,数学家本身应该积极参与到人工智能发展的浪潮里。”孔德兴呼吁,AI的未来发展需要数学家深度参与。由于目前仍处于“弱人工智能”时代(可以说是数据智能时代),AI的实现主要是依赖计算机的巨大算力和巨大的存储能力,底层算法的问题或许并不突出,但在未来的发展,AI将可能融入逻辑、思维等智慧的内容,这些都需要数学科学的原始创新,有大量的基础问题亟待数学家攻克。

算法的进阶一定是来源于“原创者”,而不是“跟随者”。孔德兴说:“实际上深度学习的应用已遇到了天花板,我们需要新的数学技术(如部分依赖逻辑、部分依赖数据的‘聪明算法’),让计算机变得聪明起来。这些工作都需要数学家的参与。”(采访来源:科技日报)

5
人工智能发展陷入了拿来主义怪圈
历史已经证明,通过购买现成的产品与技术来实现技术的跨越,在科学技术领域是行不通的。中国科技行业的哪一样,不都是经历了艰苦奋斗,无数科学家默默无闻为之奉献后,方才得以傲视世界群雄?比如中国的量子技术,比如中国的国防科技,中国的天宫空间站,中国的嫦娥月球车。

作为技术高度密集的人工智能技术,其商业领域竟然是陷入了拿来主义,着实让人意外。中国AI产业大约从2018年开始一夜爆红,稍微有些规模的IT厂家无不宣称,已经推出人工智能产品到市场上。当时认为这也是中国科学人多年来的厚积薄发,技术积累到一定程度后实现了产业的繁荣。可惜的当徐匡迪院士发出直击灵魂的提问后,才发现原来中国的AI产业不过是看上去很美丽。

人工智能技术本质上是以数学算法为核心,辅以计算机技术的产品。与其说是一个IT产品,倒不如说是一套数学理论,如随机森林算法,贝叶斯算法等都是复杂的数学、统计学、概率领域的内容。这些算法试图通过数字概率来描述人类思考的过程。计算机技术不过是通过编程语言在信息系统中实现算法过程。可见推动人工智能前进的必定是数学领域的专家,而不是IT部门的人才。

基础学科,比如数学一直是我们非常薄弱的环节。当华罗庚将中国数学推向一个高峰后,之后众人还只是在努力追赶国际同行,一直没有能在国际上独领风骚。可想而知在人工智能商业、民用领域,我们的进展同国际同行相经差距明显。所以2018年的AI产业大爆发就让人心生怀疑。

没有安心研发,那么就拿现成的好了。正巧大家可以从网上下载到开源人工智能算法。于是大家都将其下载下来,加上漂亮的外壳,让我们的AI产品炫酷夺目。如果有机会能探究当下较火的商业人工智能产品,最终会发现所有算法都指向了同一个来源。不是说开源不好,正如浙江大学孔德兴教授所言,开源的产品是由其它国家人开发出来的,无论其功能好与坏,你并不知道它的开发思路是怎么样的。算法高效之处不知为何,而其能力不足之处也茫然不知。尽管其是开放源代码的,不知道有多少IT公司认认真真地研读一遍将其吃透研究明白了。

还有一点想跟大家讨论的是,开源的人工智能算法绝不会是高效的,或者说是真正的算法程度。开源代码是IT高手们将自己想法实现并放到网上供大家讨论的东西,往往是初级的,探索性的东西。据说当现开源AI代码是从印度工程师放出来的(这点也是听闻,不确定)。现在大家应当有所体会,人工智能绝不会是一两个工程师就可以搞出来的东西,要不为什么谷歌公司投入了那么多人力物力才实现了将国际象棋冠军打败的程度。而这套算法却无法应对英国高中数学问题。还有一点,真正尖端的人工智能算法,永远不会出现在互联网上供人们共享的。

资本的力量是可怕的。为了赚取利润占领市场,商家秉持着唯快不破的想法,极速将产品推出来,哪有功夫去管它是好是坏呢。可是人工智能是一门科学,是最为严谨的数学课题,不可能容得下这般不负责任的炒作。

这个世界是公平的,你怎样对待科学,这就会怎样对待你。玩弄科学,炒作概念,不脚踏实地的钻研反而投机取巧,必定会被其反噬。如果大家一直在追踪AI发展情况,其实已经可以感受到,似乎AI的热度较去年有所下降。而到现在为止尚未有一个真正能拿出手的商业人工智能产品在市场上出现。这已经说明许多。

爱之深恨之切。我们都期盼着中国IT有朝一日能够站在世界巅峰。这个过程是需要脚踏实地的,一个台阶一个台阶攀登上去,没有任何取巧的办法。亡羊补牢未为晚也,希望徐匡迪之问能惊醒中国IT公司,扎扎实实的一步一个脚印的走下去,让国人早日用上真正的人工智能应用。

编辑:王豪

203#
 楼主| 发表于 2019-9-16 22:06:52 | 只看该作者
【案例】对抗人脸识别的一个新方法:隐藏身份、随机换脸

原文作者:杨晓凡
原文来源:AI科技评论


AI 科技评论按:人脸识别技术已经进入了大规模应用,个人数据的隐私问题也得到越来越多关注,针对隐私保护、躲避和攻击人脸识别系统的研究也陆续出现。

这其中,有篡改输入人脸识别系统的图像,让它无法识别图中存在人脸的,比如多伦多大学的《Adversarial Attacks on Face Detectors using Neural Net based Constrained Optimization》。


也有 CMU 设计的特殊眼镜,佩戴以后,即便经过监控设备的采集,仍然无法识别到图像中存在人脸,或者会被识别为另一个人;而且这种装饰方法算不上夸张,不那么容易引起别人怀疑。(论文《Accessorize to a Crime: Real and Stealthy Attacks on State-of-the-Art Face Recognition》)

隐藏身份的「换脸」

近日又出现了一篇新的论文,来自挪威科技大学的《DeepPrivacy: A Generative Adversarial Network for Face Anonymization》(arxiv.org/abs/1909.04538),从新的、更有挑战的角度欺骗人脸识别系统:在不改变原来的数据分布的前提下把人脸匿名化,更通俗地说就是模型的输出还是一张逼真的人脸,姿态和背景也和原图相同,但完全无法识别出原来的人脸身份,也就是「换了一张脸」。


作者们提出的模型 DeepPrivacy 是一个条件生成式对抗网络(conditional GAN),生成器能够以原有的背景以及稀疏的动作标注生成逼真的匿名(其它身份的)人脸。生成器的架构是一个 U-net,用逐步扩大图像尺寸的方式最终生成 128x128 尺寸的图像。

为了避免向这个模型泄露个人信息,按照作者们的设计,这个模型的输入就直接是经过随机噪声遮挡的人脸,模型完全观察不到任何原有面部信息。不过,为了保证生成的质量以及动作的一致性,作者们仍然需要两组简单的图像标注结果:圈出了面部位置的边界框,以及(与 Mask R-CNN 中相同的)标出了耳朵、眼睛、鼻子、肩膀一共 7 个关键点的稀疏姿态估计值。


根据作者们的测试,经过他们的模型匿名化的人脸仍然保持了接近于原图的人脸可识别性,普通的人脸识别模型对于匿名化后的图像,识别出人脸的平均准确率只相对下降了 0.7%。而人脸含有的身份信息自然是 100% 不重合的。


不同人脸匿名方式的对比,从左到右依次为:原图,DeepPrivacy 模型的遮挡后的输入,马赛克,高斯模糊,DeepPrivacy 模型输出

在论文中作者们也做了一项带有一定前瞻性的工作,那就是整理发布了一个新的多姿态人脸数据集 Flickr Diverse Faces。数据集共含有 147 万张人脸,并按照他们的这个模型输入所需,标出了含有面部位置的边界框以及 7 个关键点。这个数据集的独特之处在于它的多样性,它涵盖了许多不同的面部姿态、部分遮挡、复杂背景、以及不同的人。


Flickr Diverse Faces 数据集中一些人脸样本

相关研究比较
另一些人脸匿名化结果 —— 左图大家本来可能熟悉,现在就难认出来了

这篇论文的模型中的生成器设计参考了《Progressive Growing of GANs for Improved Quality, Stability, and Variation》(arxiv.org/abs/1710.10196)论文,从低分辨率的图像开始,逐级地提高分辨率、增加细节,最终可以同时兼顾图像中的内容高度协调、高稳定性、高多样性。这种方法是 GANs 首次可以生成 1024x1024 尺寸的高清图像。作者们还一并讨论了一些改进 GANs 训练过程的技巧。
可能有人已经想到了,DeepPrivacy 所做的「生成匿名逼真人脸」的任务,其实就和图像补全(Image Inpainting)高度相似,都是让模型为图像中的指定区域填充全新的内容。不过图像补全任务中要补全的内容就不仅仅是人脸了,包含了各种日常物体和场景。也有图像补全的研究人员尝试过补全人脸的效果,他们在高清晰度、数据丰富、姿态单一的 Celeb-A 数据集上进行尝试,结果模型并不能生成逼真的、身份不同且随机的人脸。

另外值得一提的是来自英伟达的《A Style-Based Generator Architecture for Generative Adversarial Networks》(arxiv.org/abs/1812.04948),它是 CVPR 2019 的 最佳论文之一,也是目前为止生成高清晰度、高多样性的人脸效果最好的方法。毋庸置疑,这种方法生成的人脸比 DeepPrivacy 更逼真,而且也同样可以生成随机的新身份,不过就没办法控制同样的姿态和背景了。

一些讨论

作者们认为大企业可能能够通过这种方法躲避欧盟《通用数据保护条例》(GDPR)的约束。GDPR 中要求,使用个人的隐私数据的时候必须定期征得当事人的同意;但是当无法根据数据识别定位某个个人的时候,企业无需同意就可以使用这些数据。这种人脸匿名化方法就可以成为「无法识别个人,从而绕过 GDPR 限制」的帮手。

不过,在高度遮挡、不常见的角度、复杂的背景中,模型还是会出现一些错误的生成结果的(扭曲的人脸看起来有一些可怕)。作者们也通过对照试验说明了更大的模型大小、7 个动作关键点的标注都有助于生成更高质量的图像。

在 Reddit 以及 Twitter 的讨论上,有人提出,仅仅更改面部是不足以完全隐藏身份的,有的人(比如奥巴马)仅凭发际线就有机会认得出来,再加上穿着、场景、身边的人(比如有另一些政府首脑)的话,知名人物能够被认出来的可能性大大增加;也有人提出,变成随机的身份,还不如都用 DeepFake 把所有的脸都换成同一张生成的虚拟人脸,同样可以达到无法通过面部识别确定身份的效果。(另外网友们还吐槽了为什么要起 DeepPrivacy 这么一个烂大街的名字)


AI 科技评论报道。
编辑:吴悠


204#
 楼主| 发表于 2019-9-17 21:05:38 | 只看该作者
案例危险的人脸识别

原文来源:科技鉴定师

AI换脸软件ZAO的走红,打开了人脸数据应用的潘多拉魔盒。

“仅需一张照片,出演天下好戏”,这是ZAO的宣传口号。当不少人惊叹于其换脸效果的逼真之时,一些人开始担忧:倘若这一技术被居心叵测的人利用,同样“仅需一张照片”,你就可能变成色情电影演员、犯罪事件主角或其他你不想成为的人。而这些以假乱真的素材,极有可能成为新型敲诈或诈骗的趁手工具。就像网友担心的那样:视频欺诈很快会成为最流行的犯罪玩法,对骗术识别能力差的老人有极高杀伤力......

卸载ZAO(很多人这么做了),也许能减少一些你的担忧。但一个严峻的事实是,除了ZAO之外,收集并使用我们人脸数据的机构和企业,正变得越来越多。比如,拥有你相册读取权限的APP、为你提供人脸解锁功能的手机厂商、对你进行身份验证和面部检测的金融或教育类APP,甚至是你办公楼里的刷脸出入系统,以及无处不在的安防摄像头。为了便利,我们正在把自己的人脸数据免费交给越来越多拥有新技术的组织。这一趋势浩浩荡荡,个人仿佛无法抵抗。

个人信息买卖几乎每天都在发生,而如今我们连“脸”都不能好好保护了。除了上面提到的AI换脸带来的欺诈风险之外,攻击人脸识别系统从而进行身份冒用带来的财产、名誉、人身等方面的安全隐患也不容忽视,而3D打印技术的成熟正让《碟中谍》电影里面的换脸场景成为现实。更可怕的后果在于,一旦人脸数据与其他隐私数据打通,我们最终会进入“裸奔时代”——当你走在大街上,掌握数据的人只要看你一眼,就洞悉了你的一切,身份、职业、收入、偏好、性格……

如果不想沦为数据的奴隶,我们必须从今天开始认真对待我们的“脸面”。

你的人脸正在成为别人的生意

在北京中关村的一家咖啡馆里,刘嘉为燃财经演示了自己的创业项目。

用户只需上传一张照片,几秒之内就能自动生成一份长达12页的“事业报告”,报告会对一个人的人格特征、内在特质、外在特质等进行详细的分析和评价,目的是诊断其适合的职业和管理风格。在使用不同人脸进行了多次尝试后,准确度之高令笔者十分惊讶。

“这绝对不是AI算命。”刘嘉反复对燃财经强调,他的产品基于基因学、心理学、医学等科学,并结合了AI和大数据等前沿技术。未来,刘嘉希望把分析范围从事业向情感、健康等领域拓展。在笔者看来,刘嘉的项目的最终目标非常可能是——仅需一张照片,就能洞悉你的一切。

惊奇,伴随着恐惧。

刘嘉的项目只是人脸识别浪潮中的一朵小小浪花。一个不得不承认的事实是,我们的人脸正在成为别人的一门生意。

不久前,人工智能企业旷视科技在港交所提交招股书。旷视科技成立于2011年,起家于人脸识别,在计算机视觉领域与商汤科技、依图科技、云从科技并称CV(计算机视觉)四小龙。2016年、2017年和2018年,其营业收入分别为6780万元、3.13亿元和14.27亿元。资料显示,旷视科技为OPPO、vivo、联想等知名企业提供人脸识别相关服务。

旷视科技谋求上市的背景,是人脸识别技术从公共领域向消费领域的快速延伸。过去,由于技术创新不足、应用推广有限、成本高,人脸识别被制约在公共用途,一直没有进入更广泛的商业化应用中。

在智能手机采用人脸识别技术之前,采集我们人脸数据的场景主要是:小区、街道、地铁、写字楼、商场、景区等公共场所,采集主要用于安防目的和管理目的。比如去年,张学友在全国召开巡回演唱会,累计有超过10名逃犯在演唱会前后被抓,“功臣”正是人脸识别技术,这让张学友本人都不得不感叹:“我们国家真的太先进了”。

近几年,这一局面得到扭转。智能手机剧增、移动支付习惯的养成,加上人们对智能家居的狂热,个人消费需求的增长直接推动了移动端消费级人脸识别应用的爆发。从这一点上说,我们正在协助越来越多的厂商收集人脸数据。

2017年,苹果推出支持人脸识别解锁的新款手机iPhone X,小米Note3、vivo V7+等智能手机也推出了人脸识别功能。同年,支付宝、京东、苏宁也都先后开启刷脸支付功能。人脸识别的消费级应用场景开始不断延伸。和指纹识别、虹膜识别、语音识别等其他生物识别技术相比,人脸识别具有极高的便利性和不错的安全性,其应用场景不断增多。

资料来源 / 中商产业研究院

中商产业研究院的一份报告显示,2019年生物识别技术将进入大规模应用阶段。据预测,2020年我国生物识别技术(含人脸识别技术)行业市场规模将突破300亿元。围绕人脸识别,已经形成了基础层(芯片、算法、数据)、技术层(视频人脸识别、图片人脸识别、数据库对比检验)、应用层(硬件、应用和应用方案)的完整产业链结构。

如果细心观察,你会发现线上线下越来越多的场景都在增加人脸识别功能。

人脸识别过度使用令人担忧

ZAO的风波还没过去,旷视科技的风波就来了。
人脸识别被用于课堂

几天前,一张带有“旷视”标志的视频监控图像在社交网络上疯传。图中不仅有被监控的两名学生,还有她们的行为数据,比如趴桌子、玩手机、睡觉、听讲、阅读、举手的次数等。尽管旷视科技回应称,这只是“概念演示”。但关于隐私的讨论铺天盖地而来。大部分人认为:技术虽好,但应该“用对地方”。

对于人脸识别的应用,微软主席布拉德·史密斯曾在去年的一场科技研讨会上发出警告:“如果不加以规范和监管,脸部识别技术会彻底改变人们的生活方式并让人们毫无隐私可言。”

这不是危言耸听,来看看我们的科技公司们都在谋划什么吧。

教育是人脸识别的“重灾区”。不少教育科技公司都推出过类似旷视的监控功能,声称可以分析学生在课堂上的行为,并对异常行为实时反馈。一段宣称是“智慧课堂行为管理系统”的描述是这样的:

系统每隔30秒会进行一次扫描,针对学生们阅读、举手、书写、起立、听讲、趴桌子等6种行为,再结合面部表情是高兴、伤心,还是愤怒、反感,分析出学生们在课堂上的状态。目前仅趴桌子一项为负分行为。若此类不专注行为达到一定分值,系统就会向显示屏推送提醒,任课教师可根据提醒进行教学管理。

除了课堂以外,高校所谓的“智能校门”,教室门及宿舍的出入也都在加装人脸识别系统。但闸机只是切入点,更多方案提供方希望用AI重构教育全流程,所以出现了上面我们看到的场景。《2019年中国智慧教育行业市场发展及趋势研究报告》数据显示,2018年智慧教育的市场规模超过5000亿元。众多AI技术公司、教育场景公司加入红利的争夺中。

巨头公司也不例外。京东曾推出过一款基于AI的“超级眼镜”,据介绍,佩戴“超级眼镜”的店员可以看到眼前顾客的会员信息、用户画像、购物倾向等重要信息,全面实现“知其所想,投其所好”。2017年,京东还推出过自己的无人便利店,通过刷脸来记录顾客的购买喜好,并将这些消费行为信息保留。

百度将活体识别技术用在百度钱包账号找回功能,腾讯微众银行用于开户过程。微众银行活体检测需要镜头前的用户读一段文字,并配合语音识别检测。借着刷脸识别、人脸支付等黑科技的噱头,能够收集人脸信息的应用到了无孔不入的地步。如今人脸识别应用已经变得娱乐化,收集人脸数据的门槛正在一步步降低。

娱乐化大大降低了厂商收集用户人脸数据的门槛

当然,正如苹果公司CEO库克所说,“技术本身没有好与坏,一切由我们人来决定”。

人脸识别的应用边界在哪里,值得所有从业者思考。百度创始人李彦宏曾经因为说“中国人愿用隐私换便利”引起舆论围攻,在技术好与坏的判断上,科技大佬们的态度也很关键。

可怕的后果

早在2017年,前美国中央情报局技术分析员斯诺登就曾经预言:以手机解锁为代表的人脸应用出现,会让人脸扫描正常化,也会让人脸识别终将被滥用。

如今,随着越来越多的人脸数据被上传到云端,数据泄露或违规使用的可能性大大增加。以ZAO为例,ZAO能走红的一大原因是,它降低了AI换脸的使用门槛。但该技术同样可能被用于虚假宣传,比如爱“炫富”的微商们,以前喜欢P图和奥巴马握手,以后是不是会直接上一个以假乱真的握手视频?以前希望借“马云语录”为各种忽悠项目站台的微商们,以后是不是会直接上一个马云“亲自代言”的视频?

敲诈和诈骗也需要警惕。2017年底,国外一位ID为“deepfakes”的网友,首先使用了AI换脸算法,此后这种算法也被命名为deepfakes。随后在国外的Reddit论坛上,产生了大量的AI换脸视频。然而这一技术后来被乱用,开始有人用换脸技术将色情作品中的主角换成明星脸,并上传到著名的色情影片分享网站Pornhub上。未来,如果有人把我们换脸成色情影片演员、犯罪事件主角、被绑架的人质……或者伪装成我们进行视频通话(结合声音模拟技术),并以此进行敲诈或对亲友诈骗,后果同样不堪设想。

《每日邮报》日前报道,今年3月,一名诈骗犯利用AI语音模仿软件冒充公司大老板,成功让一家英国能源公司的CEO相信自己正在与德国公司的老板通电话,并骗走了22万欧元。未来,如果类似骗术结合换脸视频,诈骗的成功率恐怕会更高。

FaceTime是苹果手机内置的一款视频通话软件,曾有不少网友表示接通后对方处于黑屏状态。除了发垃圾广告外,还存在一种可能,对方截取你的面部画像用以破解人脸识别系统,细思极恐。

用淘宝搜索“假脸面皮”,可以以非常低的价格轻松买到周润发、刘德华、周星驰等明星的乳胶面具,有商家也可接受定制。未来,随着3D打印技术的成熟,电影《碟中谍》里面的场景恐怕很快会成真。

福布斯记者Thomas Brewster发布过一篇文章,介绍了3D打印头型如何成功骗过智能手机人脸识别的过程。Thomas Brewster合成了一张自己完整的3D图像,打印出了一个3D头型,然后对5款手机的人脸识别功能进行解锁测试,惊讶的是其中有4款都沦陷了。人脸识别被成功骗过意味着我们并不能百分百依赖人脸识别措施。

Thomas Brewster的3D打印头型

唯一值得庆幸的是,换脸技术暂时还不能大规模威胁到我们的手机支付安全。一位技术人员告诉燃财经,刷脸支付需要调用摄像头对人像进行检测,屏幕反拍的方式目前并不能骗过摄像头的生物监测技术。

但也不要轻易乐观。美国有一款名为Twinning的应用,用户只需上传照片,就能通过人脸识别找到与其容貌最相似的明星。但在走红之后,产生了非常严重的信息泄露,现在在谷歌搜索中,还能看到不少泄露出来的照片。因此,谨慎使用可能收集我们人脸数据的应用十分重要。

可能到来的“裸奔”时代

人脸识别最大的风险在于,一旦人脸数据被泄露并和其他个人信息打通,将导致一个彻底“透明”的时代的到来。

今年年初,燃财经曾经报道过巧达科技,这家企业因为非法窃取公民信息被查封,36人被检察机关依法批准逮捕。燃财经拿到的一份文件显示,巧达科技宣称其数据库有2.2亿自然人的简历、简历累计总数37亿份。此外,巧达科技还有超过10亿份通讯录,并且掌握着与此相关的社会关系、组织关系、家庭关系数据。

巧达科技靠此牟利巨大。2016年,巧达科技全年收入1.2亿元,净利润4800万元;2017年,巧达科技全年收入4.11亿元,净利润1.86亿元,净利润率超过45%。而其杀手锏就在于对数据的“打通”。

人脸数据,倘若被泄露,并与其他数据关联,将带来灾难性的后果。因为其特殊性在于,人脸代表着对一个人现实身份的确认。未来,非常可能出现的场景是:当我们走进一家商店,店员立刻就能知晓关于我们的一切:身份、职业、收入、偏好、性格……

而当这一天来临时,每个人都将处于“裸奔”状态。甚至戴上面具也无济于事,因为摄像头还能识别你的体型、你的步态。
我们应该如何对待人脸识别

除非与世隔绝,否则无法完全拒绝人脸识别。

对外经贸大学数字经济与法律创新研究中心执行主任许可认为,人脸识别技术在商业上的使用无法一刀切禁止,从理论上讲,所有的数据都有泄露的可能。对于个人而言,需要在便利性和个人信息保护上权衡和取舍,对于珍视个人信息胜于便利的人,最好完全不使用任何要求进行人脸识别的App,通过市场机制倒逼企业做好隐私保护。

北京市安理律师事务所高级合伙人王新锐表示,人脸数据在各国的立法中通常都属于个人敏感信息。之所以敏感,在于其天然能够真正识别个人身份且终身无法更改,而且容易以非接触的方式收集。从某种程度上说,生物识别信息真正定义了我们每个人。

目前,多国都在开始进行立法强化对人脸信息收集以及识别技术应用场景的约束。今年7月,继旧金山之后,美国出现了第二个禁止人脸识别的城市。马萨诸塞州的萨默维尔市议会通过了禁止在公共场所使用面部识别软件的投票。新政策生效后,该市各机构、分局或下属部门,均不得在公共场所使用面部识别技术。但只是禁止了公共场所的使用权,没有涉及商业范畴。

图 / 视觉中国

我国也已经有数据相关的立法,正在征求意见阶段。国家互联网信息办公室在今年5月发布的《数据安全管理办法(征求意见稿)》中规定:“如果收集使用规则包含在隐私政策中,应相对集中,明显提示,以方便阅读。另仅当用户知悉收集使用规则并明确同意后,网络运营者方可收集个人信息。”而且“网络运营者不得以改善服务质量、提升用户体验、定向推送信息、研发新产品等为由,以默认授权、功能捆绑等形式强迫、误导个人信息主体同意其收集个人信息。”

王新锐认为,换脸、换声这类App最大的问题在于其大规模收集的生物识别信息如果发生泄露及滥用,会造成各种欺诈和造假。且生物识别信息的丢失会比其他身份信息的丢失造成更严重的后果。主要原因在于不可更改性,比如邮箱、电话可以更改,但人脸、声音、虹膜等信息泄露后,没有办法再更改。

针对AI进校园、生物识别技术在校园逐步开始应用的现象,9月5日,教育部科学技术司司长雷朝滋在接受澎湃新闻采访时表示,“(对于人脸识别技术应用)我们要加以限制和管理。现在我们希望学校非常慎重地使用这些技术软件。”

到目前为止,人类在人脸识别这一技术面前仍然处于手足无措的观望状态。我们应该行动得更快一点,在人脸识别的大规模危害正式发生之前。

编辑:吴悠


205#
 楼主| 发表于 2019-9-18 15:56:21 | 只看该作者
【案例】英国《数据共享行为守则》

原文来源:数字经济与社会
原文作者:田申



译者序言

ICO《数据共享行为守则》
——基于源发驱动型的数据安全生态治理

2019年7月16日,英国数据保护机构ICO就《数据共享行为守则》的修订情况公开向社会征求意见(简称:守则)。守则是基于GDPR与英国数据保护法(DPA 2018)而编制的实践指南,旨在提供相关数据合规的指引。截止8月初,ICO已经收到了101条反馈意见。

众所周知,数据共享既是数字经济与产业发展的核心环节,更是数据主体权益保护的重大课题。数据融合对经济的促进与对个人隐私的“侵入性”效应同样显著。更为显著的问题是,企业、组织间的数据共享活动外界感知度相对较低,对数据主体权益可能造成的后果归因难且潜伏期长,传统的“检查—执法”监管机制难以发挥有效作用。

在这一背景下,ICO对守则修订的核心思路以“问责制”为出发点,以保护数据主体权益为核心,通过推动组织间开展数据保护影响评估(DPIA)、订立数据共享协议来落实企业、组织的数据保护主体责任:即企业、组织需要提供DPIA评估文档、共享协议等存档资料,表明数据共享活动对数据主体、组织等各方带来或可能带来的收益与损害,并对这些利益进行了认真的权衡,通过法律协议明确数据共享各方的责任与义务,以证明相关数据共享活动符合GDPR等数据保护法律的要求。

具体而言,守则对数据共享活动提出了相关具体要求,主要归纳为以下六点:

一、开展数据保护影响评估

作为数据保护法规“可规则性”原则的核心抓手,守则强调即使在法律上并未强制要求组织开展数据保护影响评估的情况下,在数据共享活动中,组织主动遵循 DPIA 程序也是非常必要的,因为数据共享可能会导致对个人的高风险。

开展DPIA也是在数据共享前组织所需考虑的第一步,除了GDPR中规定的应当开展DPIA的四种情形外,对于数据匹配(data matching)、不可见的处理(invisible processing)、在发生数据泄露时可能对个人造成伤害的信息处理等情形均需要开展DPIA。

通过DPIA对数据共享活动进行评估,应当综合考虑:

数据共享目的;
共享数据类型;
目的实现是否可以通过不共享数据或共享匿名化数据方式达成;
共享数据对个人信息主体可能造成的侵害;
共享数据对社会和个人潜在的收益与风险;
不共享数据是否会造成损害;
是否有任何法定限制或其他因素对数据共享的限制;
谁会访问这些共享数据;
共享数据是持续性的还是临时性;
共享数据的方式;
共享数据是否已经达成目的,是否需要继续共享数据;
动态重新审查DPIA,是否有新的变化。

二、订立数据共享协议

订立数据共享协议是证明组织满足GDPR"可归责性”要求的重要有效途径。因为数据共享协议可以帮助所有各方明确各自的角色,明确规定数据共享的目的,涵盖数据共享各阶段将要处理的事情以及确定数据共享的标准。

在订立数据共享协议中,应当包含下列内容:

数据共享的目的:为何数据共享是必要的、共享数据的具体目的、为个人或者社会带来的好处;
哪些组织会参与数据共享:列明所有参与数据共享的组织,及其DPO和其他关键员工的联系方式,在与另一个数据控制者共享数据时,还应当列明自身的责任,并将相关情况告知数据主体;
共享数据的类型:详细说明共享数据的类型,对于某些数据还应当仅允许特定员工访问;
明确数据的共享的合法性基础:是以同意作为披露数据的合法基础,那么协议可以提供一份同意书的模板,并解决有关拒绝或撤回同意的问题;
记录敏感或特殊类别数据:如果共享数据设计特殊或敏感数据,必须根据GDPR或DPA的规定记录相应的处理条件。
数据共享协议在满足上述条件外,还应当能够应对数据共享时出现的主要实际问题,以确保参与数据共享的组织满足共享数据最小化原则,确保数据共享准确,使用兼容格式的数据集,共同的保留或删除共享数据规则,共同的技术和组织安全规划,处理公众请求、投诉、询问的程序,协议有效期限以及协议终止的程序。
定期复查数据共享协议,特别是在出现新情况或新的数据共享理由时。

三、贯彻“问责制”原则
根据GDPR问责制原则,如组织进行或参与数据共享,须能证明你遵守GDPR有关保障数据主体权利的规定。

作为贯彻问责制原则的一部分,在适当的情况下,组织必须制订数据保护政策,并采用“设计及默认方式保护数据”( “data protection by design and default”)的方法,保护数据主体权利。即:采取适当的技术和制度规范来确保数据保护原则的落实,并保护数据主体个人权利。

确保关键文档的留存,例如大型企业、组织需要保留数据处理(共享)活动的记录,并定期对记录进行复盘。

DPIA是问责制的组成部分,签署数据共享协议有助于企业或组织证明符合问责制的要求。

四、确定共享数据的合法性基础

GDPR确定了六项进行数据处理活动的合法性基础,数据共享前应至少确定一个合法性基础。

根据问责原则,企业或组织必须能够显示在开始数据共享之前已经考虑并确定数据共享的合法性基础。

GDPR中的大多数合法基础要求处理是“必要”的。评估合法性基础涉及DPIA,这要求企业同时考虑必要性和比例性。


五、确保数据共享的公平性和透明度,

保障数据主体法定权利
公平和透明是GDPR中数据处理原则的核心。
不能以会对他们产生不合理不利影响的方式使用他们的数据。
必须确保共享个人数据是合理和相称的,以及共享个人数据的情况不会出人意料或令人反感,除非有充分的理由。
确保个人知道他们的数据正在如何被共享、处理,哪些组织在共享或获取、访问这些数据,除非适用豁免或例外情形。
共享数据之前,必须以可访问和易于理解的方式告知将如何处理他个人数据。
六、安全地处理个人数据

安全措施必须与数据处理的性质、范围、背景和目的以及对个人权利和自由构成的风险向适应,并考虑最新技术和实施成本。

通过守则对数据处理活动做出的规范指引可以发现,对数据共享等处理活动的监管措施是通过问责制等制度安排,激发企业、组织的“源发驱动力”,通过数据保护影响评估、共享协议等具体措施,将监管的重点由监督审查转向敦促企业、组织“负责任”地开展数据处理与共享活动。

长期以来,数据安全评估、隐私保护合规评审都被认为是增加了企业、组织的负担,而在问责制原则下,这些不仅是法律规定的合规要求,更是在出现可能侵犯数据主体权益的情形出现后,数据保护机构评判责任的重要依据。

数据保护机构会基于风险的执法方法,根据比例原则进行评判:如果企业、组织未开展DPIA,未能通过协议等方式约束数据共享方的责任,导致数据主体权利受损,则可能面临2000万欧元或全球营业额4%的罚款。因为企业、组织无法证明其切实落实了保护数据主体权益的法律要求。反之,如果在数据共享前认真进行了 DPIA,通过合同、协议等形式严格约束并认真落实,在安全事件、违约情形或第三方因素导致的数据主体权益受损的情况下,则会根据比例原则合理界定其应当承担的责任边界与程度。正如ICO在守则中表明的:“我们将始终按照我们的监管行动政策,以有针对性和比例的方式使用我们的权力。”“我们将一如既往地执法,同时确保商业企业不受繁文缛节的约束,或担心制裁将被不成比例地使用。”

同样,数据共享组织之间签署协议,本身并不会确保一定符合法律要求,或可以免除法律责任,但是这些是数据保护机构接到有关投诉后去审查和考虑的重要因素。ICO在守则中明确提到:“起草和遵守协议本身并不向你提供任何形式的法律保障,使你免于根据数据保护立法或其他法律采取行动。但是,如果ICO收到关于你的数据共享的投诉,它将考虑这一点。”

通过这样的制度设计,企业、组织内部的合规控制流程不再仅仅是付出而无法收回的“沉没成本”(Sunk Cost),而更可以将通过这些程序获得的“沉默利益”(笔者将其定义为:通过DPIA等风险控制活动而规避的潜在安全风险)显现出来,激发企业、组织以“负责任”的方式开展数据处理活动意愿。亦言之,通过制度设计促使企业、组织内部可以从风险控制流程中获得实际的、可见的收益,风险与合规评估由单纯的成本付出活动转变为利益收益活动,形成自发推动并严格落实数据保护措施的“源发驱动力”。

近期,我国就《数据安全管理办法》等法律法规公开征求意见,全国信息安全标准化委员会也于2018年7月公布《个人信息安全影响评估指南》(征求意见稿)。个人信息安全影响评估对于国内而言仍是刚刚起步,数据监管体系与方式也在探索之中,此次ICO发布的《数据共享行为守则》不仅仅是一份合规指引性文件,更是一种构建数据治理生态的方法论。我国当前数据经济蓬勃发展的背景下,这种新型的数据安全治理模式,也许值得行业与监管部门去共同探索。

编辑:吴悠

206#
 楼主| 发表于 2019-9-18 16:45:10 | 只看该作者

【案例】学人|施畅 • 赛博格的眼睛:后人类视界及其视觉政治


原文来源:批判传播学


编者按:今天,批传公号推送由暨南大学新闻与传播学院施畅老师所著的两篇文章,将带领大家从“幻想地图”的故事叙事探讨中,进入到对“赛博格之眼”的视觉政治分析之中。

赛博格的视觉令人不安地蠢蠢欲动,而人类的自然视觉却迟钝得令人恐惧。

当机器视觉侵入人眼

赛博格的眼睛:后人类视界及其视觉政治

摘要  20世纪60年代以来,西方科幻电影渐次描绘了一幅「机器视觉逐渐侵入自然视觉」的图景,为我们观察后人类视觉的可能性构想提供了一个有益的窗口。晚近以来,「赛博格之眼」从增强视觉到终端视觉,从佩戴外设到植入芯片,从例外状态到常态化,呈现出不可逆转的趋势。

作为「赛博格之眼」的重要技术,「视界」是视野与界面的融合,既是对自然视觉的增强,也是对它的修改、屏蔽,甚至替换。针对那些偏离社会规范的「怪物们」,视界的政治在于识别其身份,标注其类别,制造其形象。唯有视界出现故障或被停用,人们方能发现征兆,最终穿越幻象。科幻电影中有关「赛博格之眼」的欲望与恐惧,折射了人们在遭遇后人类境况时的兴奋、焦虑及惶惑。

关键词 后人类;视界;视觉政治;AI视觉;增强现实

「赛博格」是有机体和机器的杂糅,意指被科技改造后的超越自然限度的人类,源自于改造人类自身以适应环境的需要(最初是为了适应严酷的太空环境)。

赛博格:改造人类自身以适应环境的需要

有关赛博格的科幻影视作品,其共同之处在于:充斥着关于「人类终将被淘汰」的持续不安的预感,人之为人的定义开始变得岌岌可危。
《纽约客》2017年10月23日封面

以往的相关研究多集中于赛博格的「身体」或「意识」问题,对视觉问题多有忽视。套用唐娜·哈拉维的话,我们似乎可以说:

赛博格的视觉令人不安地蠢蠢欲动,而人类的自然视觉却迟钝得令人恐惧。

面对日益错综复杂的环境,人类的自然视觉显然已经不够用了。

格雷主编《赛博格手册》与布凯曼《终端身份:后现代科幻中的虚拟主体》

「赛博格之眼」回应了晚近以来日益升温的「后人类」议题,或可将其称之为「后人类视觉」。

「赛博格之眼」既属于用以补充、替代原始器官的义肢/义体,也意味着一种全新的资讯模式或将重塑人类的身份认同,这正是凯瑟琳·海勒所谓的「后人类」典型处境。

唐娜《类人猿、赛博格和女人》与海勒《我们何以成为后人类》

它还与自动化视觉(automatic vision)、机器视觉(machine vision)、增强现实(augmented reality)等当代前沿技术密切关联。这并非遥远的技术构想,而是愈益迫近的日常现实。

视界与增强现实(AR)技术紧密关联

本文以20世纪中叶以降的若干科幻影视作品为研究对象,聚焦其中有关「赛博格之眼」的科幻想象,并以此为观察点,增补后人类研究的视觉维度。

这里的研究对象不包括复制人或人造人的视野(如《银翼杀手》《终结者》等),也不包括虚拟现实或VR视野(如《黑客帝国》《头号玩家》等),而是强调机器视觉对自然视觉的侵入。

研究对象不包括人造人视野(终结者)或VR视野(头号玩家)

本文以「视界」(sight,赛博格的所见视野与目视科技)为切入点,借用并改造了尼古拉斯·米尔佐夫「视觉复合体」的分析框架,尝试将视觉技术分析引向更为广阔的视觉政治分析,进而揭示个体意志与视界政治的冲突与妥协。

这里关切的问题在于:视界如何记录、分析、限制、过滤人们的自然视野?视界让哪些事物变得可见,又让哪些事物不可见?视界对视觉的再配置,其背后存在怎样的权力结构与权力关系?

米尔佐夫在《观看的权力》中指出,「视觉复合体」涉及分类、隔离、美化等视觉技术

一、机器视觉的发生

如今是物在看着我。

在保罗·维利里奥看来,视觉机器(vision machine)的兴起正应验了这句谶言。

视觉机器不仅持续「看见」还始终「看懂」,而且这一过程是自动化的(无涉人力或很少借用人力),在短时间内即可完成。

阿米蒂奇《维利里奥论媒介》与雷德黑德主编《维利里奥读本》

视觉自动化可以从两个层面予以理解:一是捕捉、记录的自动化,即成像手段如摄影、摄像;二是理解、分析的自动化,即机器视觉。

我们这里讨论的是广义上的「机器视觉」,既包括借助传感器(如雷达、红外遥感)获得的视觉,也包括晚近兴起的计算机视觉或称AI视觉(如人脸识别)。前者是对特定场景的视觉化「感知」,后者是从图像或图像序列中生成符号性描述。

屈运栩等:《抢跑AI视觉》,《财新周刊》2018年第1期封面

如果说「让『不可见』可见」属于视觉现代性问题,那么「让『不可见』持续可见」就是一个视觉现代性与视觉自动化紧紧缠绕的问题了。

20世纪以来的两次世界大战以及随后的「冷战」有力地推动了视觉自动化的进程。在维利里奥看来,以自动化为核心特质的视觉机器之所以被需要,是因为在某些场景下,「我们自身的视觉能力由于某种限制而显得不够」。军事战场,这一至关重要而又瞬息万变的特殊场景,正是视觉机器的最初发生之地。

战争在不断加速,战争之输赢越来越取决于实现速度的能力。维利里奥在《速度与政治》(1977)一书中首次提出了作为政治概念的「速度学」(dromology)。不同于哈·麦金德强调速度对地缘政治格局的影响,维利里奥着重考察了「速度」在军事史上的消长起伏。

维利里奥与《速度与政治》

维利里奥把军事史简化为「现代运动战」取代「封建包围战」的历史:防御性城堡持续败落,而机动武器与高速武器系统则强势崛起。在封建时期,备有防御工事的城市是一个易守难攻的战争机器。人们以高墙深壕备战待敌,长于减速而弱于加速;而在现代战争中,地形对战争的限制愈来愈弱,交通运输能力的长足发展让战争变得愈发便利。例如,能够驰骋于各类地形的装甲战车,抹除了一切障碍。它们爬过堤围,越过森林,行过淤泥,推倒灌木、墙体,畅行无阻。

由此,维利里奥坚称:地理意义上的「据点」已经失去了往昔的战略价值,如今重要的是移动的速度以及移动路径的不可预测性。

抹除一切障碍的装甲战车

自动化武器、精准武器的发明与应用,更是一定程度上消解了「疆域」的概念。导弹袭击,横跨诸国,任意往来,毫无限制。「疆域」不再是一个可以「围起来」的地理概念或政治概念,而凝缩成了速度意义上的「反应时间」。地理意义上的「战场」消失了,「前线」亦无从确认,对敌情的快速反应及决策事关重大。

一言以蔽之,速度意味着一切。

千里奔袭的导弹让「疆域」不再是一个「围起来」的地理概念

随着军事移动能力的不断提升,战场形势可谓错综复杂、瞬息万变,这就对「影像补给」提出了新的要求。摄影机不再只是「再现」战争,而是直接成为了战争机器中一个不可或缺的环节。现代战争中的影像补给品,其重要性堪比弹药、食物及药品等军需品,因为它让战争行为(尤其是轰炸)变得更加精准,从而令战争不再「盲目」。

战场时刻处于变动之中,反馈必须及时、准确、不可间断。然而,如潮水般汹涌而至的影像材料要被迅速地理解和消化,几乎是一件不可能的事情。

任务归来的飞行员对所拍摄的照片加以拼接、理解。来源:维利里奥《战争与电影:知觉的后勤学》

当源源不绝的影像补给无法依靠人力及时处理时,军事科学家便尝试让机器自行理解图像。维利里奥将其称作「知觉自动化」(automated perception),即机器快速、准确地感知特定目标,并以视觉的方式呈现出来以供决策。

换言之,只需「感知」到目标即可,未必真正「看见」目标,譬如利用各种传感器(如雷达、热成像仪)发现目标。知觉自动化体现为一种无休无止、永恒注视的能力。视觉机器成了一台「绝对速度的机器」,拥有「无目光的视觉」。

维利里奥与《欺矇的戰略》

知觉自动化意味着以最快的速度掌握敌方的部署情况,并将其再现出来;相应地,一旦被对方发觉,也就意味着失败的可能。

由此,战争的「威慑」原则发生了根本性逆转:原先,各种武器的致命功能非得叫人知晓不可,因为这样才能发挥威慑的效力;如今的隐形装备只能通过「测不准」、通过隐匿其存在才能发挥功用。当代军事力量「无休止地瞄准,始终盯牢,便能取胜」。
维利里奥与《消失的美学》

「热战」结束,「冷战」开启。视觉自动化并未因战争的停歇而中止,反而因「铁幕」的降临而备受重视,由军事—工业复合体资助的视觉自动化革命不断升级。随着美国、苏联在航天领域展开剑拔弩张的太空竞赛,高空视野甚至卫星视野进入监控领域,视野之广袤无垠彻底超越了人类目力所及的范围,图像的自动化识别开始成为一个相当重要的研究领域。

蓝色弹珠,1972年美国宇航员在阿波罗17号宇宙飞船上拍下的地球照片

20世纪60年代以来,随着计算机技术的快速发展与应用,视觉自动化不仅在成像技术上突飞猛进,而且在对象识别技术上也有了大幅增强。

在此背景之下,我们有必要追问:

机器视觉的兴起对人类而言究竟意味着什么?

科幻电影有关「赛博格之眼」的诸多构想为我们观察「机器视觉对自然视野的侵入与改造」提供了一个不错的窗口。

进击的机器视觉

二、视界:当机器视觉侵入人眼

维利里奥热情洋溢地宣告:这是知觉自动化的时代,也是「合成视觉」的时代。「视界」是机器视觉侵入人眼后所带来的「合成视觉」,由自然视野(view)与人工界面(interface)融合而成,它既指涉机器或系统所操控的视野范围,也指涉赛博格佩戴或植入的视觉界面。

视界与「增强现实」(AR)在概念上较为接近,却各有侧重。增强现实旨在处理「虚拟图层与现实景观的融合」问题,即虚拟图层如何定位、匹配、覆盖现实景观;视界则更多地体现为一种「目视的能力」,即视界被用来实现何种功能、被纳入到何种权力结构之中。

增强现实(AR)注重虚拟如何定位、匹配、覆盖现实景观,视界则更强调「目视的能力」

在以好莱坞为主的西方科幻电影中我们可以发现,视界使用者从「机器战警」过渡为「黑镜公民」,视界从用以穿透空间的「增强视觉」发展为可供接入系统的「终端视觉」。

增强视觉的本质在于「穿透」,即「穿透」障碍以便捕获目标。增强视觉的「穿透」功能可谓「医学目视」的理想技术。福柯在《临床医学的诞生》(1963)中论述道:沿着手术刀解剖的轨迹,医学目视抵达内脏的沉默世界,以可见性粉碎不可见性的抵抗;在医生的实证目光下,身体的黑暗渊薮被确定为许多客体,被牢牢地置于目视的巡视监控之下;医学目视擅长捕捉偏差,透过表面症状直抵病理根源。疾病由此暴露无遗,彻底失去了晦暗性。
福柯与《临床医学的诞生》

哈拉维也将这种增强视觉称之为「无限视觉」(infinite vision),意指机器视觉跨越层层障碍,最终抵达预期的层次或目的地,包括超声波系统、核磁共振成像、X射线扫描等。从科幻电影中,也可梳理出增强视觉用以打造赛博格形象的一个发展过程。

20世纪60年代,科幻电影《电睛怪客》(1963)讲述了一位名为泽维尔的博士发明家意外获得透视之眼的故事。借助一双具备X射线功能的「电睛」,博士的目光穿越一切障碍:衣装之下的赤裸身体,皮肉之下的病变器官,赌桌之上的骰子点数,均一一可见。

《电睛怪客》海报

70年代流行剧集《无敌金刚》(1973—1978)讲的是岳史迪上校负伤残疾后被改造为超级特工的故事。上校堪称超能运动员与特工007詹姆斯·邦德的合体,力大无穷,健步如飞。值得注意的是,上校的左眼植入了高倍望远镜,宛如千里眼,目力所及超越肉眼。

70年代的科幻影视《电睛怪客》与《无敌金刚》

70年代最引人注目的科幻影片莫过于《星球大战》(1977),其片尾卢克炸毁巨型空间站「死星」的桥段尤为精彩。年轻的卢克临危受命,他必须驾驶战斗机通过狭窄堑道,将质子弹(不同于可自动制导的导弹)精确地射入狭小的排气口以引爆「死星」。

《星球大战》(1977)海报

在前有激光炮阻击、后有追兵奔袭的紧要关头,凭借一款名为「瞄准计算机」的视觉机器,射击的精准度显著提升,这一几乎不可能完成的任务也有了几分胜算。

「瞄准计算机」外观类似于头戴式双筒望远镜,通过雷达扫描和高速计算将飞行视野简化为几何图形,进而锁定射击目标。尽管在最后关头卢克停用了机器,选择听从「原力」的指引,但是影片对于这一视觉机器的展示给人类的视界活动添加了另一种可能。

卢克与「瞄准计算机」

「瞄准计算机」可简化环境、锁定目标

在80年代的电影《机器战警》(1987)中,底特律警察墨菲在执行任务时身负重伤,后被打造为拥有人类头脑和机器身体的机器战警。机器战警全身由高强度金属打造,并配备高性能武器,在这座犯罪猖獗的城市大展神威。

墨菲的头盔设备不仅可以瞄准、锁定目标,还集成了红外线热成像等功能,适用于在复杂作战环境中穿透障碍物发现敌人。

机器战警墨菲

目标瞄准与红外感应

值得注意的是,20世纪90年代,随着计算机与互联网技术的普及,科幻作品不再限于表现以「穿透空间」为特征的增强视觉,而是转向了以「接入系统」为特征的终端视觉。

像剧场版动画《攻壳机动队》(攻殻機動隊,1995)就是表现终端视觉的一个典型案例。影片中义体人拥有自身可控的新陈代谢、强化的感官知觉、异于常人的反应速度和运动能力,以及大幅提升的数据处理能力。通过暴露在外的接口——「脑后插管」,义体人大脑瞬间升级成海量信息库。

《攻壳机动队》海报

例如女性少佐草薙素子在驱车追捕嫌犯的过程中,通过「脑后插管」接入系统,将数字地图影像纳入自己的视野范围,进而规划最优追捕路线与方案。
义体人的「脑后插管」

进入21世纪,接入系统的方式获得改造升级,「脑后插管」让位于「植入芯片」。此时的终端视觉意味着虚拟不再有明确的边框,而是直接冲出屏幕、不断融入我们的自然视觉之中。

抬眼之际,挥手之间,个体便能调出可视化界面,实现对自然视野的改造和提升。这无疑意味着「赛博格之眼」愈发灵便、敏锐,同时也意味着人们不再能够随时随地地停用视界,视界完全成为人的身体的一部分,人们与之朝夕相伴、融合共生。

视界与人们融合共生

不过,虚拟图景并未真正地「嵌入」空间,只是「漂浮」或「遮挡」于我们的视野之内。不难想见,率先进入眼帘的恐怕会是无孔不入的商业广告。

短片《增强(广告)现实》(2012)是由同人制作的谷歌眼镜官方宣传片的戏谑版本。制作者对官方版本的影像素材加以大胆「挪用」,将各种广告不断加入用户的视野之内。在野心勃勃的厂商眼里,增强现实倒是现成的广告牌,成本低廉,便利有效,抵达率高。

冲咖啡时会弹出 Starbucks 等广告
逛书店时会弹出 Amazon 等广告

在伦敦设计师松田启一制作的短片《超现实》(2016)中,借助无处不在的二维码,广告被视界一一激活,犹如一面面旗帜漂浮在半空中。影片以第一人称视角贯穿全片,随着主人公的移动,广告与我们狭路相逢,几乎向我们扑面而来。

弥漫的广告

更糟糕的是,主人公似乎正遭受来自网络黑客的攻击,终端视觉开始变得闪烁、混乱、不稳定。人工智能客服只会一味安抚,无法提供任何实质性的解决方案。主人公只好不断重置其视界系统,但问题似乎并未得到解决,反倒更加严重。

影片试图提醒我们:虚拟视界貌似强大,有时也难免会出现故障乃至崩溃,与普通操作软件并无本质区别。
广告与我们狭路相逢,几乎向我们扑面而来

终端视界可以持续地记录视野所见,这意味着人们不再遗忘,或者说遗忘被永续储存的记忆克服了。《黑镜·你的全部历史》(2011)中,一款名为「Grain」的视觉植入物将个体所见全部存储为影像记录(甚至包括呼吸、嗅觉、触觉等知觉记忆),同时允许用户随时调取播放,这意味着个体可以无休止地重温生命历程中的任何时刻了。

不过,电影提醒我们,这未必是一件值得庆幸的事情。当一个妒火正燃的丈夫开始质问偷情的妻子,两个人激烈的争执逐渐升级为借助视界记录的冷酷举证。对真相的无限逼近,最终对亲密关系造成了不可修复的伤害。片尾,随着妻子的离去,男主人公日益沉沦,只能反复回放曾经那些美好的视界记录以寻求慰藉。
男主借助视界记录寻找真相

在《黑镜·白色圣诞》(2014)中,借助一款名为「Z-EYE」的视觉植入物,一个有社交障碍的羞涩男孩通过转播视野来获得恋爱导师的经验指导,游刃有余地与心仪的女孩展开约会。

不过分享男孩视野的可不止恋爱导师一人。为了获得更大的利润,恋爱导师还将男孩的约会场景暗中直播出去,供线上会员付费收看
宅男通过转播视野来取得 PUA 导师的指导

以色列短片《视界》(2012)中的男主人公利用一款名为「僚机」的约会应用,对女孩的脸部表情、肢体动作予以实时分析,同时迅速检索她的社交网络以获取谈资。

约会过程中,男孩不断得到视界系统给出的最佳沟通建议,如「装作感兴趣」「装作谦虚」「何不微笑」等。

借助视界与「僚机」应用,对约会对象进行分析,此时视界给出的建议是「装作谦虚」

视界建议你「装作感兴趣」

可见,在终端视界(尤其是芯片植入)的辅助下,不仅事物或对象可以被轻易地感知、分析、重组,转化为易于理解的信息,而且关键信息在讯息洪流中被筛选、精简、勾勒出来。

目力所及之处被迅速转化为可视化界面,操作便捷,决策优化,将风险控制在最低水平。借助视界技术,一切似乎尽在掌控。

三、视界的政治:「怪物」的识别、标注及制造

有关「赛博格之眼」的科幻电影,其精彩之处在于:它们并不一味地展示技术的赋能,而是试图揭示这些隐藏在貌似客观、理性的技术背后的权力结构及其所支撑的特定的意识形态。

哈伦·法罗基指出,「机器美学」之本质就是对那些不甚重要的事物的「否定」,而且往往是对细节和复杂性的否定。「机器程序只是寻找它打算找到的事物」,「只有被标记的事物才能被看到」。

帮助 AI 看懂图像的数据标注师

那么,视界技术究竟打算找到、看见什么呢?这里借用福柯所使用的「怪物」(monster)一词,用以指涉那些异于常理、常规的异己之物,如违法乱纪者、声名狼藉者等。

视界的主要任务是将「怪物」清晰无误地识别出来,并予以醒目标注,有时甚至会主动制造「怪物」,以此来实现更为有效的社会控制与社会排斥。

(一)身份识别

在现代社会中,视界的一个重要功能就是承担起身份识别的任务。在科幻电影中未来城市常常化身为可怕的阴影区,成为滋长犯罪、衰败和混乱的土壤,而终端视觉对于城市秩序的维护者而言意义重大。

在影片《少数派报告》(2002)中,当男主角乔恩惨遭构陷时,终端视觉却成为了他逃亡过程中的最大障碍——他被随处可见的虹膜扫描仪不断识别身份,几乎被逼到了无处可逃地步。乔恩唯一的选择只能是更换眼睛,将自己的终端身份进行置换与隐匿。

面对铺天盖地的虹膜识别,男主人公几乎无处可逃

在影片《机械战警》(2014)中,机械战警墨菲的大脑接入了城市闭路监控体系和警务部门的个人信息数据库,可随时调取实时或历史监控录像以及嫌疑人或罪犯的档案信息。墨菲借此不仅可以一眼鉴别犯罪分子,而且可将城市各处的监控摄像头纳为己用,锁定目标的实时位置。新闻发布会当日,机械战警刚一出场便抓获了一名侧身人群的在逃罪犯。

借助视界,机械战警墨菲一眼识别人群中的在逃罪犯

电台主持人激动人心地评论道:
直至今日,托马斯·金是恶贯满盈的逃犯……这位犯罪达人究竟藏身何处呢,就隐藏在警局大门口。看看他,就站在底特律警察几步远的地方,这两位警官却毫无察觉。之后仅仅六十秒,墨菲探长就把他缉拿归案!朋友们,这就是美国正义的未来!

在视界的辅助下,识别「怪物」的过程只需一瞥便可完成,无需查阅档案或者漫长监视。把终端视界与美国正义联系起来,显然在向观众强调一种机器视觉的正义。
用于安防警务的视界被誉为「美国正义的未来」

为了应对社会意外,我们选择信任机器,让视界与权力机构高度结合,通过系统分析、计算、评估,从而达到最大限度地规避风险。与此同时,权力机构被授权调取、审查人们的视界档案,例如航空安全检查、业务尽职调查等。

《黑镜·鳄鱼》(2017)中,主人公在接受保险公司代表的记忆检查时,无意间暴露了自己曾经犯下的一桩罪行。为了加以掩盖,她接连犯下更多的罪行。谁曾想,记忆挖掘机可以探寻人脑记忆并将其恢复为视觉影像,而权力部门、商业保险机构则被授权检查这些影像档案,一切终将真相大白。

影片中的视界记录构成了视觉监控体系的重要一环,这一由机器视觉、旁人目视以及个体目视共同交织而成的监控罗网已经使得这个世界没有什么秘密可言了。

视界记录,让这个世界再无秘密可言

面对不明底细的陌生人,视界通过生物识别来鉴定其身份,进而判定他是否构成威胁。视界很好地实践了刑事近代学派所倡导的理念:为了保卫社会,不应再秉持传统社会和古典学派主张的事后惩罚主义,而是应该采取事先预防的措施,即将重心放在那些具有危险人格、怪异性格、特殊癖好、行为和心理异常、犯罪或危害社会可能性很大的人身上,对这些危险者进行预防和管控。

正如塞缪尔·纳恩所言,监控空间的核心目标就是找出异常之物,然后对其采取行动:确认它、逮捕它、驱逐它、排除它、拒绝它、击退它。显然,机器视觉营造的视界环境为其实施提供了更为便利的条件。

福柯与《必须保卫社会》

(二)类别标注

在身份识别之外,视界还具有对被识别对象进行必要的类别信息标注的强大功能。影片《黑镜·急转直下》(2016)构想了一种针对社交网络的视界系统。不同于一般意义上的社交网络,该视界系统将每个人的社交评分(基于他人的总体评价)实时地、强制性地敞露在他人的视界之内。

如此一来,社交评分变成了每个人如影随形的身份标签。几乎所有人都被卷入这一分布式的信任评估体系之中。

视界将社交评分即时显示在视野中

依据社交评分,人们被分成了三六九等,从而形成了新的社会分层与不平等。高分者处处受到优待,享有绿色通道或优惠折扣,而低分者的选择则极为有限,只能得到劣质服务,且屡屡碰壁,几乎寸步难行。

那些被评估并标注为「次等人群」的对象,被打上「危险」「可疑」的标签,被禁止进入某些区域,或被禁足于另一些地方。这种分类本身构成了一种社会性的歧视技术。


由于社交评分不够,女主无法获得航班的预留座位

《黑镜·急转直下》中的主人公蕾西一心想博得他人的好评以拉升自己的社交评分,藉此享受优惠购房折扣进而顺利搬入高端社区。于是,主人公开始更加努力地取悦别人以获取社交好评。

不过故事的残忍一面在于,在这个拜高踩低的社会中,一旦犯错,情况就有可能急转直下,因为这是一个过错不会被抹除、评分被永远标注的算法世界。一个社交评分远低于均值的家伙大概率就是一个社交怪物了,人们唯恐避之不及,有时甚至欲除之而后快。

努力练习笑容,才能更好地取悦他人以获得好评

该片所表现出来的对于视界技术的应用,亦可归属于大卫·里昂所谓的构成当代监控核心驱动力的「社会分类」技术,即通过社会分类来验证身份、评估风险和分配价值,以确定谁需要被特殊对待,谁需要被怀疑,谁符合资格,谁被准许进入,谁被授权访问。

实际上,这种视界技术结合其他空间治理手段将「可疑人员」圈禁在遥远而缺乏保护的、混乱失序的空间中,而将「高档人群」或「无辜人群」安置在过度保护的堡垒之内,这种排他性的歧视技术并未真正消除风险,而只是将风险重新分配。

派尔等编著《无法统驭的城市:秩序与失序》

福柯曾指出,从古典社会到现代社会,「惩罚从一种制造无法忍受的感觉的技术转变为一种暂时剥夺权利的经济机制」。在福柯看来,现代社会意味着一系列封闭性的社会机构,如家庭、学校、军队、监狱、医院、工作场所等,通过高墙、空间、机构、规章、话语对身体实施监禁与干预。

德勒兹则指出,当代社会已不再是福柯所言的「规训社会」,而是进入了「控制社会」阶段。

德勒兹:当代社会不再是「规训社会」,而是「控制社会」

在德勒兹看来,控制社会以控制和定义核心参数为中心,并通过持续的控制和即时的信息传播来运作。

控制是短期和迅速轮换的,但也是持续和无穷尽的,而惩戒是长期、无限而断续的。人不再是被禁锢的人,而是负债的人。

换言之,那些偏离平均数值的「负债」之人尽管可以移动,但「债务」却如影随形。更有甚者,视界技术帮助我们更为便捷、准确地标注出哪些是「负债」之人,令其「债务」水平即时可见,进而引发持续性的社会排斥。

不能不说的是,标注分类的视界技术提供了一种面对「未知的陌生人」的解决方案,但它也是一把双刃剑,增强了安全感的同时也降低了信任、提升了恐惧,最终销蚀了正常的人际关系。

随时随地的社交评分

(三)形象制造

除了身份识别与类别标注之外,视界技术还可以成为形象制造的有力工具。视界技术有意将虚拟覆盖物叠加在自然视野之上,修改、屏蔽、替换特定的事物或行为,旨在实现合理化与美化。视界以「安全」的名义,自动屏蔽那些被定义、被评级、被扫描、被降级的危险之物。

《黑镜·白色圣诞》中有这样一个场景:某人将你屏蔽了,这将意味着他变成了你的视界里一团模糊的雪花状的虚影,他的声音也被一同屏蔽,你无法和他进行任何有效沟通。这种屏蔽还适用于照片、影像,甚至适用于后代。

在登记在案的偷窥狂的眼中,所有人都显示为白色虚影
同时在所有人眼中,罪犯被屏蔽、标注为警告性的红色虚影

在《黑镜·大天使》(2017)中,家长为孩子植入了一款名为「大天使」的视界系统。「大天使」可以将那些引起不适的所见所闻(如危险、血腥或情色之物)打上马赛克,同时屏蔽其声响。

视界的这种类似于「过滤」的功能将危险摒除在感知范围之外,但问题随之而来,因为缺乏知觉上的相应刺激,孩子开始变得缺乏情感与同理心。

以「保护」的名义,视界为小女孩「过滤」了一只狂吠的黑狗

视界技术也让替换与篡改成为了可能,甚至被用于「制造怪物」。在《黑镜·战火英雄》(2016)中,每个士兵都被植入了一款名为「群视」的视界系统。他们的任务是清除「蟑螂」——它们被指责为携带病菌的污染源,看上去犹如可怕的丧尸,面目狰狞,叫声凄厉。

一方面,「群视」系统控制了士兵的知觉输入,士兵在作战时听不见尖叫声,也闻不到血腥味,从而避免情绪感知上的刺激与干扰;另一方面,「群视」也控制着士兵的梦境,通过复制欢愉来嘉奖取得良好战绩的士兵。视界所提供的幻象被用以遮蔽社会的不一致与基本对抗,以及制造欲望和享乐的场景。

当视界出现故障,知觉屏蔽功能失效,士兵开始听见鸟叫声、闻到青草味

然而,可怕的真相在于,所谓的「蟑螂」其实都是普通民众,只不过他们都被判定为不良基因的携带者(如患癌几率高、智商低下、性行为异常等)。他们被视界系统性地篡改为妖怪的形象——假如瞄准的是妖怪,那么开枪就会容易得多。

如果说纳粹德国是借助打着科学旗号的生物种族主义,通过大众媒体宣传、基础教育灌输等方式来制造怪物,那么《黑镜·战火英雄》中的极权政府就是通过视界的篡改、替换功能来制造怪物了。视界将那些所谓的次级遗传基因携带者视觉化为丑陋的、可怖的、无法对话的邪恶客体,令类似于种族清洗的大屠杀合法化甚至崇高化。

某些情况下,视界也可以被「逆向操作」,成为弱者手中的一件武器,用来揭露和对抗意识形态霸权。在电影《极度空间》(1988)中,在未来的极权社会中的强权统治的反抗者们发明了一种眼镜。戴上这种眼镜之后,官员和警察即刻显形为骷髅,广告标语背后的资本主义意识形态一一显形:「尽情消费」「服从」「工作!工作!」。

消费社会意识形态一一显形

透过终端视觉,虚拟影像实现了对物理景观的「覆盖」。这不同于不易修复的「破坏」或「嵌入」,也不同于不易清理的「涂鸦」。事实上,虚拟影像只能通过终端设备予以观看,物理景观并不因虚拟的「覆盖」而有损分毫。终端影像故而谈不上是一种倔强的介入方式。

不过,它牺牲了破坏性与耐久度,却由此获得了轻灵与自由,犹如盗猎者一般来而复往、不断纠缠。

四、视界的崩溃:发现征兆与穿越幻象

显然,视界技术不是简单的赋能技术,还是一整套的视觉分配体系。它既是对视觉的增强,也是对视觉的规训。作为识别—分类技术,视界对未知对象进行身份识别与分门别类,并在人们的视界中将这些信息予以实时标注。在这一过程中,视界还成为一种针对视觉—空间的隔离技术,既可定向屏蔽指定的事物,也可让那些被标注为「怪物」的对象在空间中寸步难行。

视界服务于特定的意识形态

通过视界看到的世界,实质上是一个被仔细监管、被精心过滤的世界。只不过,在视界发挥这些功能的过程中,它为自己找到了一种合法化的修饰手段,有偏向地对使用者视野加以改动,由此服务于特定的意图或意识形态。

一般而言,在科幻电影中,人物通常并未觉察到视界的操纵与篡改,或者将视界的存在视作理所当然。他们要么对自己被修改的视野茫然无知,要么就干脆坦然处之,直到这套视觉分配体系出现故障。「视界的崩溃」通常是同类题材影片中的叙事转折点或高潮——一直以来信以为真或习以为常的「视界之幕」被一把撕扯下来,一个真实而残忍的世界展现在主人公眼前。

当视界出现缝隙

当视界所打造的幻象与现实出现裂缝,人们方能逐渐发现征兆,最终穿越幻象。换言之,唯有发现幻觉之为幻觉,才能够意识到视界的摆布,才有逃逸或反抗的可能。从懵懂无知到幡然醒悟,他们的人生正遭遇前所未有的剧烈变动。

《黑镜·急转直下》中,蕾西在航班延误时忍不住对办事人员大吼大叫。在被机场保安处以惩罚性扣分之后,她发现自己的生活开始失控。蕾西眼睁睁地看着自己的分数嗖嗖下跌,犹如手中紧握流沙,不断地失去自己所珍视的那些东西。

视界评分系统的残酷一面在于:向上攀爬尤为不易,向下滑落却无比迅猛。

电影《急转直下》海报

视界对蕾西社交评分的标注,犹如一个撕扯不掉的糟糕标签,成了一个屈辱性的「红字」。依据这个标签,人们对她避之不及,随意慢待,或者干脆落井下石。蕾西一度天真地以为低分是暂时的,把分数重新拉上去是可能的。

不过,最致命的打击在于昔日的闺蜜亲口对她说:「婚礼你不用来了,绝不能让2.6分的人出现在我的婚礼上。」


依据社交评分「拜高踩低」的未来社会

终于,蕾西认清了视界评分的欺骗性:人们只是虚情假意,惺惺作态;社交高分者亦不免冷漠残忍,而低分者(通常被认作反社会的疯子)却不乏友善之辈。

片尾,大闹婚礼现场的蕾西被警方拘留,后被摘除视界作为惩罚。此后,她开始看到空气里的微尘,看到自己脸上的粉刺。我们这才意识到:视界不单单打造了一套霸权式的社会评价体系,同时也自动屏蔽了粗糙的、脏兮兮的现实,提供了一个洁净无尘的、充斥着美颜和马卡龙色的世界。

剥离视界后,世界不免粗糙,但更加真实

不过令人欣慰的是,蕾西似乎终于得到了某种解脱。随着视界的摘除,她来到了一个不必看他人脸色、肆意发言的世界,其代价是游离在社会秩序的边缘。

当发现停用视界是不可能的时候,个体意志就难免会走向崩溃。《电睛怪客》中的主人公痛苦地意识到,透视之眼已经不可逆地取代了原先的自然视觉。在神父的严厉斥责之下,他唯有自行挖眼以求救赎。

挖眼以求救赎

在《黑镜·你的全部历史》中,视界记录既承载了昔日美好的回忆,但同时也是对当下失败婚姻的残忍提醒。最终,痛苦不堪的男主角决心告别那些令人心碎的幻象记忆,亲自动手粗暴地摘除了视界。
亲手摘除视界

《黑镜·白色圣诞》的惊悚一幕在于,一个女孩似乎意识到了视界之视野分享功能的滥用——「无数的人在透过我的眼睛看」。她最终不堪忍受而试图结束生命。
「无数的人在透过我的眼睛看!」

对抗视界,本质上就是对抗整个社会控制体系。这不仅很不容易,而且往往代价惨烈。在《黑镜·战火英雄》中,由于一次偶然的视界故障,黑人士兵突然发现自己所对抗的「妖怪」实际上是手无寸铁的无辜平民。

觉醒后的士兵不再甘于受视界的摆布,拒绝继续执行任务。作为惩罚,他被独自关押,强制性地反复观看自己亲历的作战过程:此前视界将敌人丑化为妖怪,并对他的知觉做了部分屏蔽;如今视界将现实还原,未做任何修改与屏蔽,他被迫直面自己参与屠戮平民的过程,犹如身陷一个循环往复的恐怖梦魇。

在视界的篡改下,士兵自以为在清理「妖怪」
实际上他在杀害平民

与视界妥协似乎是一个更具诱惑力的选择。片尾,主人公退役回家。破败的房屋空无一人,却在视界的修饰下焕然一新。虚拟的女主人款款走出,迎接英雄的凯旋。主人公激动地流下了热泪。

对此我们可以作多重解读:他是否还记得当初发生的一切?他是因为回家而激动万分(丢失了记忆,依然被视界欺骗),还是因为自己的懦弱而悲愤不已(与视界妥协,但仍意识到了视界的欺骗性)?或许齐泽克是对的,幻觉正是现实的一部分,「他们对自己的所作所为一清二楚,但他们依旧坦然为之」。

齐泽克:他们对自己的所作所为一清二楚,但他们依旧坦然为之

剧集《黑镜》的片头不啻一个隐喻:最先一块幽深漆黑的屏幕,随着系统的加载,字符开始出现,而后显示变得不稳定,最终一道裂痕贯穿屏幕,犹如黑镜幻象被撕开了一道口子。

当视界出现故障被停用,人们才会逐渐察觉幻象与现实不一致的地方。为了安全与便利,我们选择将信任托付于视界,而视界却最终辜负了我们的信任。唯有真相得以揭示,逃离或反抗幻象才成为可能。

发现征兆与穿越幻象

「黑镜」之隐喻既指涉虚拟现实,也指涉增强现实。前者重塑时空,旨在隔绝、取代现实,后者近乎透明,据称只是保守地对现实加以补充、改动及辅助。虚拟现实犹如一架穿越时空的时光机,打算让我们进入一个完整、封闭的世界,同时鼓励我们沉浸其中;而增强现实是碎片化的,必须在个体移动的过程中不断地与之相逢,堪称「弥漫的界面」。

以增强现实为核心技术的后人类视界比虚拟现实更具迷惑性:人们似乎被赋予某种主体性与行动力,却往往被纳入到一个更为隐秘的幻象之内、一个更为严酷的系统之中,深受裹挟,无力抵抗,实难撤出。沉溺幻象过久,幻象亦将反噬己身。长久凝视黑镜,黑镜必报以回望。


长久凝视黑镜,黑镜必报以回望

结语:透明社会的兴起
「可见性」是现代性的核心诉求之一,该诉求在危机时刻会变得尤为强烈。战争或潜在的战争对可见性提出了很高的要求,能不能在尽可能短的时间内发现特定目标成了赢得军事胜利的关键所在。在军事加速的背景下,视觉自动化技术突飞猛进,并被施用于当代社会治理实践之中。视觉机器与数据库相互配合,图像连续地被采集、被分析,被编码进入数据库,成为可检索、可匹配、可计算的数字信息。

在新近出版的《视觉的技术:图像与数据的战争》(2017)一书中,作者斯蒂夫·安德森表示:在传统视觉文化中,我们看的同时也被看,观看意味着权力,凝视铭刻了文化,公与私、贫与富的区隔由此体现;而在以计算、数据为主导的当代视觉文化中,我们感知的同时也被感知,追踪的同时也被追踪,我们的数据被持续挖掘,同时我们也贪婪地消费那些数据机构(从事数据采集、数据可视化、信息评估等业务)提供的信息与建议。

汉森《身体代码:界面与数字媒介》(2006)与安德森《视觉的技术:图像与数据的战争》(2017)

晚近以来,科幻电影中的「赛博格之眼」从增强视觉到终端视觉,从佩戴外设到植入芯片,从例外状态到常态化,呈现出不可逆转的趋势。改造自然视觉成了一件再正常不过的事情,未使用或停用终端视觉的人反倒成了异类,徘徊在社会的边缘。这正是一种典型的后人类处境——赋予那些人机混合的赛博格们以主体地位或优势地位,同时排斥那些未经技术改造的人们。

再也没有一个完好如初的现实空间了。出于种种目的,虚拟之物总是试图侵入、标注、修改、覆盖、占领现实空间。这挑战了视觉艺术中关于「图像」的传统定义——一种被框取的、类似窗户的视觉再现机制。如今,虚拟不再有明确的边框或边界,而是不断进击、四处弥漫,最终世界本身构成了界面。

再也没有一个完好如初的现实空间了

正如马克·汉森所预言的那样:一切现实均为「混合现实」。虚拟化不再是有待经历的过程,而是永续的既成状态。或许是时候考虑一下虚拟自身的悖论了。米歇尔·海姆有言,「虚拟的消逝意味着虚拟的成功」。虚拟的终极目标是将自己彻底融入背景,从而消弭于无形。换言之,虚拟消失不见之际,方为虚拟大获全胜之时。

虚拟对现实的改动可以是自主的、透明的,但也可能是胁迫的、隐蔽的。虚拟犹如一个等待召唤的幽灵。我们举行仪式,反复念咒,期盼它即刻现身,赐予我们力量。然而,我们又心怀畏惧,不肯完全托付,害怕与其纠缠最终将反噬己身。

虚拟的反噬

虚拟之所以难以剥离,正是因为视界提供了某种令人难以拒绝的便利。不过在享受便利之余,人们也日益感受到视界的胁迫。看似平稳的生活开始出现各种不详的征兆,人们愈发觉察到视界所打造的幻象实际上遍布裂隙。最终,视界崩溃了。更糟糕的是人们发现自己竟然无法停用视界,只得选择与之妥协。

「赛博格之眼」折射了现代人内心深处对技术的一种普遍性焦虑:对技术的过度使用(侵入人体)造成人们对技术的严重依赖乃至无法中止。
人们对「赛博格之眼」的依赖难以中止

「赛博格之眼」的崛起,预言了当代世界日益透明化的趋势。它为我们展示了一幅并不遥远的图景:视界目光所及之处,一切移动都会留下痕迹,一切痕迹都会被自动化解读,以至于没有什么难于理解的情形了,未来社会将变得前所未有地透明。

齐格蒙·鲍曼曾有慨叹:在流动的现代性世界中,须放弃所有总体性的希望。然而,后人类视界是对移动视野的自动化译读,是对流动世界的即时监控,将在一个日益液化的现代社会中重振总体性的希望。


透明社会的兴起

不少人热情洋溢地拥抱有关「后人类」的伟大图景,坚称「后人类进化」会在创生肉体、完善生命、解放主体、改变人生观念、提高生存质量、实现个性自由和社会公正等方面开创出美好前景。

然而,诚如戴锦华所言,目前社会上占据主导的是最廉价、最古老的发展主义信念,我们既无知又勇敢,几乎完全不经抵抗,不做准备,没有任何质疑。科幻想象亦是如此。

我们欣然植入视界,自愿分享视野,同步上传记录,永久储存记忆。那么我们究竟得到了什么,又失去了什么?

我们是否正逐渐失去对人生方向的控制?
那些被排斥在所谓的主流社会之外的弱势群体将会遭受怎样的命运?

西方科幻电影为我们展示了关于后人类视觉的未来图景,这并非危言耸听,亦非遥遥无期。
电影《急转直下》海报

我们或许可以以此为鉴,构想一个别样的未来——一个既享受便捷技术、也不至损害自由平等的更为和谐的世界。

这需要我国当代科幻文艺作品为世界贡献更多的中国智慧与中国方案。

编辑:吴悠

207#
 楼主| 发表于 2019-9-18 20:12:26 | 只看该作者
【案例】是否顺应互联网大脑的发育趋势决定科技企业兴衰

原文来源:刘锋的未来课堂


前言:本文摘录自2019年7月中信出版社出版的《崛起的超级智能:互联网大脑如何影响科技未来》

为什么谷歌、脸书、亚马逊、阿里巴巴、腾讯等互联网企业发展得如此迅速,成为世界科技巨头?科大讯飞、商汤科技、ARM、Palantir等新兴科技企业如何面对巨头的激烈竞争?GE、海尔、格力、西门子、三菱等传统制造业巨头如何在物联网、云计算、大数据、人工智能一轮轮热潮中寻找到自己的位置?

50多年来,人类从不同方向推动互联网领域的创新,并没有统一的规划要将互联网建造成什么结构。直到有一天人类抬起头观看自己的作品时,发现互联网的全貌与自己的大脑高度相似,而且连接了数十亿人类群体智慧和数百亿机器设备的智能,共同形成一个不断发育壮大的超级智能体,这是一个非常奇特的现象。

“看不见的手”是经济学领域一个重要的概念,同样互联网大脑的形成中也存在一只“看不见手”,这只手对过去50年科技企业和科技创新有着巨大的影响,包括它们的兴起、凋零和衰亡。我们总结了10条规则,选择腾讯、Facebook、阿里巴巴、谷歌、百度、科大讯飞、商汤科技、猪八戒网、知乎、沃民高科、华为、GE、海尔、滴滴等公司作为案例,分析互联网大脑的发育是如何影响科技企业的未来命运。

这些规则并不是对科技未来的规划,而是对一种自然进化现象的总结。如果这种总结是正确的话,无论我们是不是意识到它们,21世纪的前沿科技和科技企业都会受到这只“看不见的手”牵引。

我们在这篇文章就介绍其中的第一条规则:是否顺应互联网大脑的发育趋势,决定科技企业兴衰

互联网从1969年4台联网计算机发展到2018年类脑架构,这个过程中有很多创新技术涌现又被淘汰、无数创业公司诞生然后死亡,但互联网从不完善的网络结构向成熟类脑模型进化的步伐,一直坚定和不可阻挡。

我们在之前的研究中已经提出互联网进化的若干规律,诸如不断增强人脑与互联网链接时间的链接规律;互联网的计算机,通讯线路甚至人类等元素,运算速度不断增强的加速定律;不断从分裂的商业形态走向产业整合的统一定律;进入互联网虚拟世界时不断提升身份验证水平的信用定律;互联网覆盖范围从实验室到整个地球甚至太空的膨胀定律等。

从过去50年的发展看,那些顺应这一趋势的企业,在互联网大脑模型中就占据更有利的位置,获得更强的竞争优势。而那些处于过渡阶段或不利位置的企业就有更大概率被淘汰。

智能手机领域的诺基亚是个典型的案例。诺基亚曾经创造了手机行业的高度,2008年时,它份额曾高达40%,这对任何手机厂商都是遥不可及的数字。但由于那时没有顺应互联网进化过程中的链接定律,忽视了人类对快速高效、不分地域进入互联网的需求,终于在2013年因经营不善被卖给微软。

诺基亚一直具有持续创新的基因,从1865年诞生之初的木材、橡胶制造商,转行成为手机行业的领头羊,从1996年开始,在长达14年的时间里一直是世界手机行业的龙头。它的每一次转变都让人刮目相看。但最后一次转型,诺基亚没有成功,走上了九死一生的深渊,而失败的重要原因是没有重视互联网的连接规律产生的生态变化。

转折点发生在2008年,这一年,美国苹果公司的掌门人史蒂夫·乔布斯在苹果全球开发者大会上正式发布iPhone 3G,同样在这一年,谷歌正式发布了智能手机操作系统Android 1.0。这两个事件吹响了从有线互联网向移动互联网进化的号角,也间接促进互联网大脑的的神经纤维从电话线,同轴电缆向3G、4G、5G等移动通讯技术发育。

从那一刻开始,手机的内涵正在悄然发生变化,从打电话为主的功能手机向链接互联网的移动电脑转换。从此人类可以不受时间和地点的限制,更便捷的进入到互联网中,可以浏览到更为丰富的互联网内容,可以享用更强大的互联网应用如定位,购物、游戏、社交等。

互联网生态变化的速度,远远超过了诺基亚的想象。诺基亚在2G时代稳固的地位,使其在智能手机开发上犹豫不决。在诺基亚看来,手机主要用途就是通话,却没有意识到,用户已开始逐渐利用手机查看电子邮件、寻找餐馆并更新Twitter信息。

应该说苹果、谷歌、三星、甚至之后的华为、小米等厂商都抓住了这个转折期的重大机遇。但诺基亚确多次误判了科技的未来趋势。浪费了时代给予的一次次补救机会。

2008年12月,诺基亚把由众多手机厂商持有股份的塞班公司全资买下,想组建以诺基亚为核心的塞班联合组织,打造一个史上最强的智能手机操作平台。但由于塞班系统先天的缺陷和诺基亚对移动智能手机时代认识不足,在2009年年底,包括摩托罗拉、三星、LG、等各大厂商纷纷宣布终止塞班平台研发,转而投向谷歌Android领域。这使得诺基亚在此后的几年里,一直在塞班系统、MeeGo系统和微软的Window Phone之间摇摆不定,消耗掉最后的机会。

诺基亚从此被“看不见手”从时代的火车头中直接扔出了车外。2011年,诺基亚在销量上被苹果及三星双双超越,2013年,曾经的手机巨头被微软收购,在2016年又被甩卖给富士康。

BBS(电子公告牌)是互联网大脑发育过程中兴起和衰落的另一个典型案例。BBS面临的主要是互联网统一定律带来的压力,由于互联网要形成完整的类脑结构,而类脑神经元网络是这个架构的核心,BBS作为类脑神经元网络的前期过度产品,那些不能顺势趋势改变的BBS运营企业就衰落下去。

20世纪90年代万维网诞生后,BBS是世界范围互联网用户使用最为广泛的交流平台,在中国,三大门户网站新浪、搜狐和网易都是起源于20世纪90年代的BBS网站。天涯、猫扑在21世纪初也曾经是互联网最有声望的社区网站。

但在2010年之后,各大BBS网站纷纷关闭,2017年,搜狐论坛发布停止服务的公告:它写到“终于还是走到这一天,1999—2017,我们万分不舍却又不得不遗憾地通知大家,搜狐社区将于2017年4月20 日正式停止服务。2012年网易论坛关闭时,有人就曾预测中国的BBS五年内必定关停大半,到2018年,西祠胡同、猫扑等社区都逐渐沉沦,而即便是曾经的BBS霸主——天涯社区,也面临着用户流失、内容稀缺等困境。
从互联网大脑的发育看,BBS的衰落是一个必然的过程。在20世纪90年代,BBS网站承载了人类互联网绝大部分信息和资料,但这些信息是杂乱无章的,仿佛地球早期的“原汤海洋”。21世纪早期博客的兴起,解决了互联网虚拟世界“个人”角色缺失问题。在互联网虚拟世界中人的角色出现后,它们之间的交互就同步了现实世界人类社会的社交属性,并最终成为社交网络或者互联网神经元网络的基础。

也就是说BBS在互联网大脑发育过程中只是神经元网络产生的过渡产物。当互联网绝大部分用户和信息迁移到社交网络时,BBS的历史使命就完成了,那些顺应这一趋势的企业就获得了更大的竞争优势,例如,中国三大门户之一的新浪在过去20年中实现了从新浪BBS到新浪博客,再到新浪微博的三次成功跨越,而网易BBS、搜狐BBS、天涯、猫扑以及更多专业BBS没有顺应互联网大脑的发育轨迹,于是就逐渐被“看不见的手”淘汰。

关于《崛起的超级智能:互联网大脑如何影响科技未来》

2019年7月,《崛起的超级智能:互联网大脑如何影响科技未来》由中信出版社正式出版。作者刘锋。吕乃基、石勇、吕本富做序。

张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹等专家为这本书撰写了推荐语。

《崛起的超级智能》主要阐述了21世纪以来人工智能、云计算、大数据工业4.0、云机器人、区块链、城市大脑等等新技术不断冲击着人类的工作和生活。这些前沿科技的爆发的背后原因是 50年来互联网正在从“网状结构”发展成为“类脑架构”,由此产生的互联网大脑将数十亿人类的群体智慧和数百亿设备的机器智能链接在一起,形成大自然前所未有的超级智能导致的。

书中深入解析了互联网大脑的形成与发育过程,详细阐述了超级智能的崛起对行业产业、城市建设、人工智能、脑科学、生物进化、科技哲学以及人类社会的未来影响,预测了21世纪前沿科技的发展趋势。

通过这本书希望帮助读者深入理解行业产业与前沿科技结合将呈现出怎样的发展趋势,企业和个人在科技大潮中将如何寻找自己的定位,人类的未来在新科技的影响下会有怎样的命运。

编辑:吴悠

208#
 楼主| 发表于 2019-9-19 15:19:03 | 只看该作者
【案例】羊城三人行,共话法律人工智能的前生今世

原文来源:理脉LegalMiner
原文链接:https://mp.weixin.qq.com/s?__biz=MzAxNDY5MTE1NA==&mid=2650474339&idx=1&sn=4074011bd59e370a8559354a1d106174&chksm=8380d95eb4f750485f24352d9b024b7dc2572835d9eff959f85583fd084c3549911b9c7e8dfd&mpshare=1&scene=1&srcid=&sharer_sharetime=1568865858233&sharer_shareid=399f5d6261583f8d1336edc7245fa151&key=00a5eb0b7d905038df9e677e907f7b96005dc903db672f93f4fc21e012fbe4c675244fd5dc77a8c9a9beda851b3828c09b5946e1a27254fc7c27ea688b38ad65cf002d7ab95e702316d787eeaf7f0de0&ascene=1&uin=MTgyMDkwMDgzNA%3D%3D&devicetype=Windows+8&version=62060833&lang=zh_CN&pass_ticket=L6mlQFZ22dhS1bhf5zjixS%2BBq9g%2Fa2jJKfAmk9tIzhvdWWfNaS244HQ5ElC7%2BefR

大V说“理”,十一献礼!

2015年,祖国成立66年,理脉诞生了!以先行者的姿态,站在风口浪尖。

2019年,时逢祖国70年华诞,理脉度过了4年春秋,继续在法律科技领域不断深耕。

当下,以数据科学为基础的人工智能技术已经渗透到各行各业,应用AI技术的产品层出不穷。中国法律服务市场也在不断拥抱变化,通过“法律+AI”提供更精准完善的法律服务,助力法制建设现代化信息化。

生之逢时,顺势而为,作为法律科技的先行者,理脉有幸与法制现代化建设同行,也一直高度关注法律人工智能的发展。

本期《大V说“理”》国庆献礼特辑由理脉联合创始人及CEO涂能谋博士作主持,特邀中山大学法学与哲学教授熊明辉教授、金杜律师事务所合伙人沙骏律师,共话法律人工智能的前世今生,畅聊法律与法律人工智能的方方面面!

涂能谋:学术界对法律人工智能是什么态度?
熊明辉:人工智能首先是一个哲学概念……
涂能谋:律师对法律科技产品有什么期待?
沙骏:将来我会有AI化的律师助理和自己的大数据库……

涂能谋博士作为法律科技业内践行者连连发问,熊明辉教授作为学院派权威从理论研究出发解读人工智能,沙骏律师作为法律资深从业者畅想AI与实务结合的种种可能……

编辑:吴悠

209#
 楼主| 发表于 2019-9-20 21:44:17 | 只看该作者
【案例人民日报智慧媒体研究院成立

原文来源:人民日报

在新中国成立70周年之际,人民日报智慧媒体研究院今天宣告成立。体现主流算法的人民日报客户端7.0版、短视频客户端“人民日报+”、人工智能媒体实验室、全媒体智慧云和融媒体创新产品研发与孵化项目正式亮相。
人民日报社总编辑庹震,国务院新闻办公室副主任郭卫民,人民日报社副总编辑、人民日报智慧媒体研究院院长许正中,中央广播电视总台副台长阎晓明等共同为研究院揭牌。

这是人民日报社贯彻落实习近平总书记重要指示精神的战略举措,是推进媒体深度融合、加快构建全媒体传播格局的积极探索。以研究院成立为契机,人民日报将把人工智能等新技术运用在新闻采集、生产、分发、接收、反馈各环节,实现内容传播与先进技术的融通共享;探索催化融为一体、合而为一的体制机制,并通过与企业、机构合作,加快资源整合、技术融合、项目联合、人才聚合,形成化学反应,催化融合质变。

研究院由人民日报社注册成立,由人民日报社新媒体中心负责日常运营。首批推出的重点项目中,协同国内一流人工智能技术团队开发的主流算法,在满足人民日报客户端算法需求的同时,将面向媒体行业提供服务。短视频聚合平台“人民日报+”,由普通用户、专业用户生产内容,以“人民问政”为主要特点,将通过对产品、技术、内容、运营全方位把控,致力构建兼具主流价值和创新活力的短视频内容生态。

百度董事长兼首席执行官李彦宏,快手科技创始人兼首席执行官宿华,京东集团副总裁梅涛,第四范式创始人兼首席执行官戴文渊出席成立仪式并致辞。中国电信、中国移动、中国联通、阿里、腾讯、百度、京东、字节跳动、快手、微博、小米、美团、奇安信、哔哩哔哩、第四范式、拼多多、同创伟业、视觉中国等成为研究院首批理事单位,北京大学、清华大学、中国人民大学、复旦大学、中国传媒大学等单位的专家加盟研究院专家委员会。


编辑:吴悠

210#
 楼主| 发表于 2019-9-20 21:48:31 | 只看该作者
【案例】人民日报为何搞智慧媒体研究院?

原文来源:传媒学习社

9月19日,人民日报智慧媒体研究院成立之际,第四范式与人民日报社正式签约,携手共同打造主流算法,推动传媒行业在AI时代的转型与创新。双方共同打造的主流算法将在实现海量内容与用户个性化需求精准匹配的同时,保持主流核心价值观,实现主流媒体优质内容的传播目标。
以下为人民日报社副总编辑、人民日报智慧媒体研究院院长许正中的致辞全文:

各位领导,各位来宾:

在庆祝新中国成立70周年的大喜日子里,人民日报智慧媒体研究院正式成立。这是人民日报社贯彻落实习近平总书记重要指示精神的战略举措,是推进媒体深度融合、加快构建全媒体传播格局的积极探索。在此,我代表人民日报社,代表李宝善社长、庹震总编辑,对各位领导、各位嘉宾的莅临,表示热烈的欢迎和衷心的感谢!

今年1月25日,习近平总书记率中央政治局同志来到人民日报社,走进媒体融合发展第一线,就全媒体时代和媒体融合发展举行第十二次集体学习。总书记指出,“现在,人民日报社已经有十多种载体,是影响力最广泛的时期了,从中可以看到科技发展的力量,也可以看出主流媒体回应时代挑战的努力。”总书记强调:“要把人民日报办得更好,扩大地域覆盖面、扩大人群覆盖面、扩大内容覆盖面,充分发挥在舆论上的导向作用、旗帜作用、引领作用。”

人民日报是媒体融合发展的积极探索者、践行者,也是受益者。近年来,我们坚持导向为魂、移动为先、内容为王、创新为要,在体制机制、政策措施、流程管理、人才技术等方面加快融合步伐,建立融合传播矩阵,打造融合产品,取得了积极成效。今天,我们还要同步上线“人民日报+”短视频客户端,推出加持主流算法的人民日报客户端7.0版本,成立人工智能媒体实验室。我们的目标,就是要坚持一体化发展方向,通过流程优化、平台再造,实现各种媒介资源、生产要素有效整合,实现信息内容、技术应用、平台终端、管理手段共融互通,催化融合质变,放大一体效能,加快构建融为一体、合而为一的全媒体传播格局,打造具有强大影响力、竞争力的新型主流媒体。

我们成立智慧媒体研究院的考虑主要有两点:

一是实现内容传播与先进技术的融通共享。技术是媒体融合的发动机和加速器。随着5G、大数据、云计算、物联网、人工智能等技术不断发展,移动传播将进入加速发展新阶段。人民日报等传统媒体在技术研发上有短板,但必须保持对新技术的敏感,着力于对新技术的快速应用。通过与各类科技公司和研发机构的多维度、多层次合作,我们可以为技术研发提供媒体的具体应用场景和应用需求。同时,我们也将培养自己的能够理解、消化和应用新技术的团队,这可能是主流媒体应对未来技术挑战的恰当路径。以人工智能为例,媒体智能化已是大势所趋,我们要增强紧迫感和使命感,推动关键核心技术自主创新不断实现突破,探索将人工智能运用在新闻采集、生产、分发、接收、反馈各环节,用主流价值导向驾驭“算法”,以全面提高舆论引导能力。

二是探索催化媒体融合质变的体制机制。传统媒体和新兴媒体不是取代关系,而是迭代关系;不是谁主谁次,而是此长彼长;不是谁强谁弱,而是优势互补。推动媒体融合发展,需要处理好传统媒体和新兴媒体、主流媒体和商业平台的关系,既要建设好主流媒体自己的移动传播平台,又要用好商业化、社会化的互联网平台,形成资源集约、结构合理、差异发展、协同高效的全媒体传播体系。人民日报智慧媒体研究院将深度参与这一进程,通过与不同体制机制的企业、机构合作,积极探索有利于新技术研发应用的体制机制,加快资源整合、技术融合、项目联合、人才聚合,形成化学反应,催化融合质变。研究院实行公司制运营,将组建经营实体,面向市场,选择国内技术领先、实力雄厚的互联网企业进行实质性合作。

媒体融合是一条正确的道路、光明的道路,前景无可限量。我们希望与社会各界携手合作,让主流媒体借助智慧技术,牢牢占据舆论引导、思想引领、文化传承、服务人民的传播制高点,让正能量更强劲、主旋律更高昂,让党的声音传得更开、传得更广、传得更深入。

编辑:吴悠

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表