【案例】
FTI发布2019年媒体趋势报告:108个新风向最全输出
如今,无论是传媒从业者还是普通用户,已经没有人会轻视技术的力量。
从传统智能手机到可穿戴设备、区块链技术、标志计算机新时代的人工智能,以及即将成为主流的混合现实(Mixed Reality)……这些逐渐切近日常生活与行业变革的技术,传媒从业者应当如何把握?
Future Today Institute(简称FTI)近期发布了《2019年传媒业技术趋势报告》,即介绍了包括以上技术在内的共计12种前沿趋势,以及其中的108项具体革新。如FTI的创始人 Amy Webb所说:“媒介组织应当主动了解技术革新的信号,而非被动跟进”。
本期全媒派(ID:quanmeipai)精编了这份报告,以期和读者一同触碰技术与传媒业态的未来。
趋势一:人工智能
我们习惯将“人工智能(Artificial Intelligence)”当成一个总体概念,但事实上,人工智能范畴之中,包含着许多具体类别。在当下的传媒行业,那些看似生僻的技术,实则也渐渐应用于我们熟悉的领域中。
自然语言生成 (Natural Language Generation, NLG)
自然语言生成技术现今已被不少媒体与营销机构所应用,基于大规模的数据集来进行自动内容生产。NLG可实现的功能包括,集成关键词、提升SEO(Search Engine Optimization,搜索引擎优化,即利用搜索引擎的规则来提升网站的搜索排名)以及为用户批量提供个性化的内容。
这项技术有两项具体应用,我们都不陌生。
首先是将结构化的数据转化为叙事性的报道,Bloomberg、AP等媒体都在应用这项技术,来收集数据并自动写作有关足球赛事、收益报告等方面的报道,ProPublica等机构也在试验如何在公开数据中发掘报道线索。
另外,一些阅读App可以根据用户所选的阅读水平,来对词汇、语法的复杂程度进行调整。一家教育行业的初创公司Newsela就主打“阅读水平转换(reading level converter)”的产品,为用户提供个性化文本,文本来源则是与他们合作的各大新闻机构,如《华盛顿邮报》和《卫报》等。在未来,NLG还可能与智能语音等领域结合,为内容个性化提供技术基础。
Newsela界面示意,左边栏可选“Reading Level(阅读水平)”
自然语言理解 (Natural Language Understanding, NLU)
现今,我们会频繁接触到以社交媒体文本、政府企业网站公开数据等为代表的各种非结构化数据,自然语言理解技术能够帮助研究者来量化此类数据,从中抽取关键概念、梳理关系以及分析情感。在医学、法政、农业、交通、教育多种学科领域,NLU都可以帮研究者获取更深层面的洞察——传媒领域同样。
机器阅读理解 (Machine Reading Comprehension, MRC)
MRC使得系统阅读大数据、推断含义并且立即得出答案的流程成为可能。举个例子,当你搜索时,你是希望系统直接给出一个确切答案,还是提供给你一堆“欲知后事如何请看更多超链”的URL合集?前者就是MRC可以做到的事。在未来,MRC是实现强人工智能的关键性步骤之一,而近期,它则可以协助我们把技术手册、历史地图和医疗记录等各种资料转化为易于搜索的信息集合。
实时机器学习 (Real-Time Machine Learning)
机器学习指的是一种应用算法来分析数据,从而可以更好地完成各种任务的系统,并且随着时间推移,它会越来越擅长这些任务。但这种系统也面临着效率问题:系统需要停下来解析数据。而最新研究表明,实时机器学习可以随数据获取而实时调整模型。这种技术使得同声传译自动化成为可能,即便是在多种语言混杂的情况下;也可以协助对内容分发进行随时调整,从而为读者提供更具有贴近性的内容。比起刻板地使用历史数据(读者XX只喜欢体育类报道),实时偏好则能够将内容纳入推荐机制(读者XX在接下来的几天里对大选新闻的需求可能会更强烈)。
IBM的“辩论者(Project Debater)”即是真实世界的文本如何被应用于实时学习系统中的范例,它是首个能够和人类就复杂主题展开辩论的AI系统。它能够实时消化复杂信息、组织逻辑完整的主题演讲、清晰阐述并且反驳对手。这一系统将可以提供论据支撑的有力论点,并限制其中情感、偏见和谣言的影响,从而帮助人们辩论。
IBM Project Debater的网站首页
音视频算法 (Generative Algorithms For Voice, Sound and Video)
MIT计算机科学与人工智能实验室(MIT’s CSAIL)正在研究儿童如何学习新词汇,从而将之应用到训练计算机的自动语言识别功能的开发中去。研究人员也在训练计算机在观看视频的同时,预先判断其中会出现的真实物理世界中的对应声音。比如,树叶落地是什么声音,那木条触碰到沙发呢?研究目的在于,训练系统理解真实物理环境中的物体之间是如何发生交互的。
这种算法未来可以为游戏、视频电影和电视节目自动配音与添加音效,但它也意味着,音频可能构成欺骗——当计算机能够模拟我们的声音和自然音时,会发生什么呢?2017年,华盛顿大学的研究者们就开发了一个能“展示”奥巴马总统某次演讲的模型,事实上这次演讲从未发生过。这恰恰与当今的假新闻和新闻核查不谋而合。
图像修复 (Image Completion)
如果计算机系统接触到足够多的图片,那么它可以修补图片缺陷,如失焦、人像肤色等问题,专业摄影师和普罗大众皆可使用。但这种技术难免面临伦理争议:真实和美化的界限在哪里?多大程度上的修补是被允许的?这些问题记者都应当自问。它也可以成为执法和军事的一部分,帮助相关部门识别图像中的人或者物体。以及,考虑我们已经在机器学习和算法中发现的偏见,图像修补的未来,可能涉及设备与隐私等方面的争议。
“隔墙有AI” (AI For Seeing Trough Walls)
MIT的计算机视觉科学家已经发现了如何通过“意外摄像头(accidental cameras)”来追踪信息。窗户、镜子、角落、绿植等许多物体都可以和AI结合,被用来追踪光线、阴影、震动等外界的细微变化,据此分析出某种条件下我们难以用感官直接捕捉的信息。举个例子,研究者们宣布他们拍摄了一株绿植,通过投射在叶片上的阴影来建立室内其他部分的三维影像,或者他们也可以将叶片转化为“视觉麦克风”,根据叶片震动来分析出室内的人正在说什么。
技术应用示意图
这样,我们可能都会拥有X光般敏锐的视觉——调查记者对此表示十分渴望。
可预测性机器视觉 (Predictive Machine Vision)
MIT的研究者们正在训练计算机,它不仅可以识别一段视频中有什么,还要推断其中的人接下来会做什么。比如说,基于YouTube平台上的视频和电视节目(例如《绝望主妇》),计算机系统现在可以预判两个人接下来是会拥抱、亲吻还是握手。有朝一日,这项技术能够帮助机器人更容易地判断人的身体语言并和人互动。
新型生成式建模技术 (New Generative Modeling Techniques)
自回归分位点网络(Autoregressive Quantile Networks for Generative Modeling, AIQN)看上去复杂,但它本质上就是一个帮助提升算法、使之更加稳定的创新理念。这种技术可以提升AI技术的进步速度,也就意味着媒体和技术领域中的机遇与革新会更快出现。
更快的深度学习 (Much Faster Deep Learning)
深度学习(Deep Learning, DL)是机器学习中相对较新的分支,也会很快无形融入到各个组织机构当中。设计者会使用较为特殊的深度学习算法,结合包括文本、图像、视频、演讲等类似内容在内的各种数据库。从概念层面上来讲,它不算新,最近更新的是计算处理能力和可用数据的数量。落实到实践,这就意味着更多的人类事务可以被计算机自动完成,比如设计软件写代码。
DL受计算机网络运行速度的制约:几年前,用ImageNet网站中的数据集来训练图像识别功能,可能要花费一个月或者更长时间;而现在,Facebook可以在一小时内实现相同的效果。随着计算机提速和硬件技术的提升,系统也会以更加“超人”的速度完成任务。
强化学习与分层强化学习 (Reinforcement Learning and Hierarchical RL)
强化学习(Reinforcement Learning, RL)是处理决策型问题的强力工具,它被应用于训练AI系统,使之拥有超出常人的能力。在计算机模拟过程中,一个系统尝试、失败、学习、实验,然后再次尝试——这一系列步骤都能飞速完成,且每次试错都会对它的未来尝试有所修正。我们所熟悉的AlphaGo就是基于RL机制学习如何决定战胜人类棋手。但这项技术也存在问题:当智能体(agents)缺乏足够的监督(supervisor,简单来说监督就是设定输出值/目标,在数据中发现潜藏模式能更容易,而无监督式学习不设定输出值,下文在机器学习相关技术中出现的“监督”也是同一个概念),或是需要运行一项长时间的复杂任务时,可能会遇到困难。
这时,研究者将尝试应用分层强化学习(Hierarchical Reinforcement Learning)——能够发现高水准的行动,有条理地克服学习困难,最终以出乎人类意料的速度掌握新的任务。RL可以提升AI系统的“智能”,来使汽车能在非常规条件下自动驾驶,或者协助军用无人机实现之前尚未实现过的复杂动作。
持续学习 (Continuous Learning)
现在,深度学习技术已经可以帮助系统学习,去以更接近人的所作所为的方式来完成复杂任务,但是这些任务仍然很具象,比如在某一项比赛中打败人类。并且它们需要遵循一个严格的程式:收集数据、设定目标、应用某一项算法。这一过程需要人工参与,也会花费不少时间,特别是需要监督式训练(supervised training)的早期阶段。持续性学习(CL)将偏重于构建提升自主学习与增量学习的技能,研究者未来还将持续扩展其能力边界。
多任务学习 (Multitask Learning)
电影《龙威小子(The Karate Kid)》里,园丁宫地先生承诺教男孩Daniel空手道,但Daniel很快厌倦了日复一日的训练。对于Daniel来说,漆栅栏、汽车、无休止的“打蜡、封蜡”……这些事情看起来都毫无用处,肯定不能帮他学会空手道。当然,最后所有的杂务都被证明与空手道有关,这样的训练也帮他成为一名空手道冠军。
提起这部电影,是因为研究者最近就在训练智能系统像Daniel这样学习。当开发者使用机器学习时,他们要尝试用这种方式解决单个特定的问题。他们会监督智能系统微调,且不断修正,直到系统的表现符合预期。但是仅仅聚焦于单个任务,经常会指向无效结果——也许有比研究者发现的机制更好的解决方案呢?于是,新的研究领域,也就是多任务学习就产生了,让系统像Daniel这样,在各种各样的相关任务中寻求联系,探寻如何更好地解决问题。
电影《龙威小子》剧照
对抗性机器学习 (Adversarial Machine Learning)
简而言之,一段对抗性内容(包括图片、视频、音频等),都包含了一个很小的“优化点”,人类通常无法察觉。科学家设计模型,给计算机训练“识别细微差异”的能力。不过,它也可能被黑客利用,用对抗性图像来误导机器学习系统。
对抗性信息可能会被有意或无意地植入到图片、多媒体报道、虚拟现实等内容之中,在假新闻广泛扩散的当今,这一点尤需谨记。对搜索引擎来说,给图像自动标记tag,实现起来也并不容易。
更加重要的环境交互(A Bigger Role For Ambient Interfaces)
环境交互(Ambient Interfaces)也以“零界面(zero-UIs)”的概念为人所知。现代交互更像是身边环绕的音乐,更少的直接指令,却能做得更多,还能吸引我们的注意力。据悉,在现代社会,成年人平均每天要做20000多个决定,大到股市投资,小到要不要刷一下手机。新型数字助手(DAs)有望对所有需要决定的事务进行优先级排序,替我们作出委托,甚至自动应答——这一无形的决策制定过程都不需要你直接输入指令。根据梅特卡夫定律(Metcalfe’s Law),网络的价值将和使用者数量成正比。这就意味着,越多的人加入这一环境交互的信息网络中,这项技术就会越好用。
将来,数字助手会变得无处不在,会搭载于手机、耳机、汽车、冰箱,甚至藏在口袋中。MIT等高校的研究者也在尝试让我们的设备能够“听”和“看”,它们会知道我们去了哪里,见了什么人,我们的习惯喜好,等等。之后,它们就会用这些数据来满足我们的需求。不难想象,营销机构、银行、以及媒体,都会用这些技术来呈现和传递信息。
当然目前最常见的还是这些
创意型人工智能 (AI For the Creative Process)
AI能不能从事创意性工作?过去的几年里,我们已经看到了不少AI系统设计创作的音乐、服装、自行车等等作品。比如,去年罗格斯大学和Facebook AI实验室等机构的研究者就设计了以创作艺术作品为目标的AI系统。结果是,艺术批评人士无法分别AI作品与人类作品之间的区别。这种创意型应用,可以说是从弱人工智能走向强人工智能的关键一步。
机器人 (Bots)
基本意义上的机器人(Bots)是指,为自动完成某一特定任务而设计的软件应用。在媒体领域,机器人可被分为两大类:新闻型机器人(news bots)和生产力型机器人(productivity bots)。前者可以协助集合新闻信息,并自动为读者推送特定新闻事件;而生产力型机器人,则可以帮助新闻组织自动化他们的日常流程。比如说,推送一则地震警报需要几步?手动登陆美国地质调查局(USGS)的网站,获取信息,再派一位记者撰写一则简讯。或者设计一个机器人,自动抓取与写作。这种自动化可以提高简讯新闻的时效性,并且解放记者生产力,使其能从事到更复杂的任务中去。
而新闻型机器人相关的主要风险是,它们依赖于背后的程序设计,这就使一些居心不良的人可以利用它来散布虚假信息。
还有我们所熟悉的聊天型机器人(chatbots)
AI中的偏见 (Ongoing Bias In AI)
研究者发现算法当中出现了预期之外的偏见。这一问题与训练AI的初始数据有关:系统一开始基于有限的数据集训练,而且训练程序由人设计,这就难免会反映出我们身上潜藏的偏见。随着计算机系统越来越擅长制定决策,我们可能会发现自己莫名被打上了某一类群体的标签,被判定为无资格贷款或不能享有某种医疗服务——而理由却潜藏在算法中,不那么容易发现。
AI云 (The AI Cloud)
过去一年,人工智能生态之中的领导企业,一直在争夺“人工智能云共享(AI cloudshare)”,以期成为值得信赖的AI远程服务提供者。Amazon、微软、IBM和Alphabet都在为开发人员推出新的软件服务,让AI初创公司能更容易地将自己的创意投向市场。不仅仅是提供服务器,每个公司都会提供现成的AI软件。如Amazon的SageMaker能帮开发者训练神经网络(neural nets),而Rekognition则可以检测并追踪视频中的人、运动和物体。
专有AI语言 (Proprietary, Homegrown AI Languages)
当AI开启了计算机时代的第三纪元,巨头公司都开始竞争市场份额和注意力。上文提到,微软等公司已经为开发者提供软件包,它们同时也为AI应用提供了独特的编程语言。如Uber发布了自家用Python写的编程语言,名为Pyro。这意味着未来AI生态的竞争中将更加分裂多元,而不仅仅类似现在的OSX和Android,或者早期的MAC和PC两大阵营。这提醒新闻机构也该开始为这种多元做准备,为开发者提供训练,提升从业者的能力。
AI芯片组 (AI Chipsets)
对我们来说,平常笔记本和手机上搭载的CPU性能已经在不断提升,却满足不了机器学习的要求。它们的问题在于,缺少足够的处理单元,去完成下一个计算机时代所需的连接和计算。这时就需要一组新型处理器,搭载于SoC(系统级芯片)之上。华为、Apple、IBM等企业都在试水新系统的构建和SoCs。简而言之,这意味着芯片已经可以在AI项目中发挥作用,并且有更快的速度和更精确的数据——也不难预料到,几家企业在未来即将开展竞争。
AI算法交易市场 (Marketplace For AI Algorithms)
大多数组织都无法组建一个无限期地创造、测试和提升算法的开发者团队,所以,开发者团体会在算法交易市场中提供他们的算法。Algorithmia 是现今最大的算法公共交易市场,在这里,开发者可以将他们的算法上传至云,其他人付费获取。Amazon、微软、谷歌等巨头公司也在将自家的框架和服务提供至算法交易市场。
Algorithmia网站首页
AI生态中的更多整合 (More Consolidation in AI)
AI生态中现在不乏这样的担忧:未来方向即将被掌握在少数几家公司手中。AI版图已被九家巨头占据:Alphabet、Amazon、Microsoft、IBM、Facebook和Apple,以及中国的腾讯、百度和阿里巴巴。投资方面,则由Intel Capital、Google Ventures、GE Ventures、Samsung Ventures、腾讯和In-Q-Tel等引领。对于任何技术领域来说,当少数几家公司主宰时,他们会倾向于垄断自身的创意和知识产权,也会视情况和他方展开合作。谈及AI的未来,我们应当思考整合会带来更好的前景,还是如电信和有线电视领域一样,可能带来一定的垄断和阻碍。
AI构筑无处不在的深度链接 (AI For Deep Linking Everywhere)
移动深度链接已经随着智能手机的普及而普及,通过手机应用搜索和分享数据都变得更加容易。深度链接分为三种:传统、延迟和场景。传统深度链接能够实现你从一个应用或网站直接跳转至另一个已安装应用;延迟深度链接则导向应用商店,安装链接导向但本机尚未安装的应用;情景深度链接提供更为强大的信息,实现网站向应用、应用向网站、应用向应用的跳转,并且可以提供个性化功能。比如说,当你下飞机时,你可能会发现你的航程应用为你推送了一条导向Uber的链接。随着机器学习的发展,基于独立用户习惯的应用链接应用的体验会更普及。
AI为自己代言 (Making AI Explain Itself)
有人质疑AI正在成为“黑箱”,除了领域内的研究者之外,没有人知道最新系统是怎么运作的。这不完全正确,但却呼应了一些计算机与认知科学家、记者和法律学家现在的主张:AI系统不应该如此神秘。接下来,我们会争论AI是否应当能够解释自身决策过程,并且提供更多的透明度。这一主张的障碍在于,这样的揭示可能会泄露商业机密,以及不断停下来解释,可能会影响AI工作的速度和质量。
责任与信任 (Accountability and Trust)
很快,我们会到达一个无法判断数据集是否被干预过(无论有意无意)的阶段。如果我们不再信任AI系统输出的结果,那么数十年的技术进展都将付之东流。政府、商业还是非营利组织的领导者,都必须对自己所使用的数据和算法有自信。构建信任需要展示算法工作的流程,但这又与组织希望数据保密矛盾。
建立信任的方式包括,承诺机制的透明性,不必然损害个人数据;另外,请一位伦理学家来和经理人以及开发者一起工作,也可以减少算法中可能出现的偏见。
AI的中国式繁荣 (China’s AI Boom)
现今,中国正成为无可置疑的AI强国。中国的AI初创公司现在已经占据了领域内全球投资的48%,中国研究者拥有的AI研究专利数量也是美国研究者的5倍,人口优势则为科技创新提供了足够的未来需求,BAT几家引领性科技公司也在不断加大对AI领域的投入。同时,中国所能获取的丰富数据,也为应用与从教育到零售制造业等各行各业的AI的训练提供了数据基础。
算法数据特种部队 (I-Teams For Algorithms and Data)
随着数据和算法应用于我们的日常生活,媒体中一支用来调查AI的特别行动小组出现了。《纽约时报》、《华尔街日报》、Publica和《华盛顿邮报》都开始应用采访的核心技能来调查算法。技术越发展,AI系统的不透明度就越高。且不论AI最终的结果是如何输出的,仅仅理解信息从哪里来、如何传播、以及它具有什么影响,就都需要一定特殊的技巧。
对于算法的调查,其结果的紧迫性前所未有。路透新闻研究所的报告表明,在美国,41%的被调查者认为政府应该努力抵抗在线假新闻,英国和法国则是61%,而西班牙则超过了70%。
趋势二:计算新闻学
数据和算法怎样加持新闻业?
计算机摄影 (Computational Photography)
计算机摄影是计算机视觉、计算机图形学、网络和摄影等技术的融合产物。不仅是单单依赖于光学过程,它同时应用了数字图像采集和生成技术,来捕捉真实生活。每一个智能手机用户现在都可以体验到计算机摄影。比如iPhone就使用计算机摄影来实现浅景深效果(人像模式)。
计算机摄影接下来还有许多可实现的功能:实时调节构图,产出多个角度的摄影作品;在图片中增减特定元素,调节光影效果;与此同时,MIT人工智能实验室和Google还联合开发了修饰照片和增强手机拍摄效果的自动功能。显然这会给记者带来一些伦理问题:多大程度上的修正是被允许的?而对应的,新闻从业者也应该开发一种技术,在将一张图片应用于报道之前,先看看它经过了多少修改。
一个处理过程的图示
计算新闻学 (Computational Journalism)
计算机辅助报道(CAR)是一项调查新闻应用的技术。记者寻找、清洗和挖掘公共记录与文件,处理数据并发现潜在的报道线索。在机器学习算法和AI的协助下,计算新闻学就是进化版的计算机辅助报道。
计算机新闻学技术包括多语言索引、自动写作、算法可视化、对于数据集的多维度分析和灵活的数据抓取,这些都可以帮助记者综合在数据中的发现,然后在事实、概念、关键词之间发现联系,从而找到人或组织之间的潜在关系。
此外,还包括一类技术叫做“众学”(crowdlearning)。这项技术可以从我们无意之间产生的数据当中,比如线上活动、定位和健康记录等,来挖掘到一些新的事实。初创公司Neura就是应用这项技术的一个范例。
Neura网站
脸部标记 (Faceprints)
系统现在可以根据我们面部的独特特征——骨架结构、肤色甚至毛细血管——来识别出我们是谁。“脸部标记”现在相当于指纹。比如去年,Apple就在iPhone X中引进了人脸识别技术。英国的研究者还尝试在脸部识别时应用热感因素,日本的研究者也在用3D扫描来提升人脸识别——预期这项技术能够应用于2020年的奥运会。而这一项技术也面临着法律挑战,在获取用户的面部信息之前,应当在何种程度上得到他们的许可。
声音标记 (Voiceprints)
你的声音由许多独特特性集合而成,这种特性就是声音标记。新型机器学习技术能够通过听我们说话时的微小特征,来协助研究者识别我们是谁。这项技术可以帮助智能语音助手,为家里的每个成员定制对应的交互风格。卡内基梅隆大学的研究者甚至还发现了,如何只根据声音标记,建立起一个人面部的3D模型。
趋势三:区块链技术
区块链代表一种在一个分布式系统上分享和储存信息的方式,在这里身份和交易都被加密。它从比特币开始进化,从数字货币的边缘脱身成为主流。尽管这项技术还在发展中,它的广泛应用已经足以影响许多产业。因此,我们需要了解它与新闻业相关的关键主题。
代币经济 (Tokenomics)
区块链技术使商业公司能够创造代币(token),Token是指商业公司创造出来,以实现机构自我运作、激励用户和对所有利益相关者进行利益分配的价值单位。代币经济能够为媒体公司变现和分配的方式带来革命性的变化。
通常媒体都是依赖于广告与订阅两者结合的盈利模式——当然报纸也证明了这种模式能多迅速地被数字竞争者冲击。区块链可以实现零交易成本的小额支付,或者能允许用户降低月度订阅费用,却可以消费更多媒体内容。
适用于智能版税和自由职业者的代币 (Tokens For Smart Royalties and Freelancers)
以Ethereum为代表的平台,能够实现对新闻或音乐等内容版权的小额支付——通过自动生效的智能合约。比如说,每当一首歌已经播放了一段时间,它就会从听众那里给歌手拨过去一小笔钱。
类似的平台的创建有两个重点:给内容创作者以最大限度的所有权,和奖励创作内容。内容创作者会很快采用这一模式,因为这能让他们得到大多数收入,而不是要把大多数收入给分发平台。同时,创作者能让自己的版权更多地控制在自己手里,且能直接与受众互动。报告预测,新闻平台会迅速跟进这一模式,但会努力激励读者转向新的平台——毕竟单个记者缺乏足够的市场影响力和关注基础。
永久新闻 (Immutable Journalism)
区块链技术可以创建一个分布式的永久性信息记录(不能被删除或者更改,本质上只能被添加)。这就使得信息的记录和分发的过程可以被所有人看见,不能被改变——除非通过大多数用户更改全部记录。一个应用区块链技术的分发渠道,会让监管和信息限制更难以施行。内容创作者会以此来保护他们的内容在通往终端读者的过程中,不被第三方修改、过滤或封锁。
TRON和Civil都是为信息资源去中心化而设计的平台。他们允许任何人自由创造并分发内容,不受监管。去中心化的信息平台会给内容发布方(包括媒体)以更多的控制权,而削弱平台在权力结构中的优势。另外,不妨把这作为一种为关键信息增加可信度的方式。
自主身份系统 (Self-Sovereign Identity)
身份管理系统已经从政府应用逐渐向邮箱和社交平台账户转移。Google、Yahoo和Facebook等公司现在也根据用户数据建立自身的商业模式,但用户却苦于大规模信息泄露。自主身份系统的逻辑是,用户完全拥有自己的数据,并对其有绝对的控制力。数据在不同应用、设备和平台之间具备互用性和可传输性。它有两个好处,提升安全性和可控性:去中心化的身份理论上更难受攻击;个人拥有自己的数据,他就可以自行决定如何利用数据变现盈利。
对于媒体公司来说,自主身份系统也是一种趋势,可以关联付费墙、身份验证(比如解决几个用户共用一个付费帐户的问题)、创意IP和版税跟踪,以及数字广告。
共有目标的分布式计算 (Distributed Computing For a Cause)
分布式计算意味着这样的过程:大型电脑问题可以被分解,成为多个可以在许多常规电脑上运行计算的问题片段。这就使个人电脑、手机和其他电子设备的闲置时间成为有价值的资源。预计会有不少平台允许用户以此种方式变现他们的电脑闲置资源,需要计算资源的开发者也可以降低成本,增加选择的多样性。对媒体来说,这能减少数字新闻分发的消耗,促进针对社会公共事业的计算机资源的捐赠,并因此减少信息分发的经济负担,和由新闻提供者承担的分析工作。
去中心化策展 (Decentralized Curation)
加密货币和应用平台可以成为去中心化内容策展(Curation,此处可理解为对信息内容的“策展”,即收集筛选、整合编辑、传播分享等处理过程)的一种模型。这是因为平台在探索自治方式,而不是设立集体组织中一贯出现的中心权威管理者。结果就是,基于区块链和智能合约平台建立的自治和激励结构,创造出一种替代性的信息策展方式的试验场,这种信息处理方式更能根据特定利益相关者的需求而灵活变化。
Steemit是类似于Reddit的博客型社区,它建立了一种加密型分数系统,在这里创造、策展内容以及与内容互动的用户会被奖励一定分数,分数可以交换现实货币。另外,名誉值高的用户则可以在内容策展方面拥有更高的影响力,名誉值可以逐渐积累或是直接购买。
未来,用户会对平台信度的建立提出更高的要求。如Reddit之类的网站,起初内容都由用户“众包”提供,这种“众包”内容将会从以往的“大多数人决定”到“有资格的大多数人决定”结构进化。加密系统中的数字人格将会更加重要,因为此种资格会视特定个人账户/用户名之下的历史贡献而定。
趋势四:界面交互
语音交互 (Voice Interfaces)
我们已经进入了一个对话交互的时代。语音交互系统使用自然语言生成技术(NLP),结合我们的数据,来参与我们的所想所需。2019年需要考虑的一个新问题:当语音交互逐渐成为更多的网页搜索行为的接口,会发生什么呢?
对话式交互,能够模仿记者与编辑之间可能发生的谈话,这些谈话可能会与报道事实相关。IBM的人工智能程序Watson的许多应用程序接口(API),包括上文提过的Debater,以及对话和语调分析等,都可以用来协助记者工作。同时,传媒组织也该思考,如果Amazon和Google掌握了我们未来对话的方式,自身应该如何融入这个生态,并在其中取得优势呢?
基于聊天应用的内容变现 (Monetizing Chat-Based Journalism)
信息交流平台已经成为社交行为的新中心,这其中就包括信息分发和经济交易行为,且二者可以合二为一。这种渠道的中心化创造了到达读者的新机会,且读者拥有小额数字支付的功能。比如微信公众平台的“赞赏”设计。其他包括Facebook messenger、iMessage、Gmail等平台,也加入了此种使读者向作者进行个人交易的功能,这也促使记者从在新闻编辑室的工作中抽离出来,转向他们自己的追随者。
音视频叙事新形式 (New Video and Audio Story Formats)
利用视觉响应、触觉反馈和语音交互等技术,报道者正在开发非传统的新型叙事来吸引读者。已经有新闻媒体和娱乐组织开始探索创意叙事形式,其中重点在于个性化、交互与沉浸。
去年,BBC发布了可以在Amazon智能音箱Echo上播放的广播剧,听众可以通过直接与人物对话的方式来决定故事走向。同时,以RYOT为代表的公司也在尝试和主流新闻组织展开合作,比如《纽约时报》和NPR等,开发了用VR形式观看的沉浸式纪录片视频片段,观众可对其展开360°的全景探索。在网络交互剧集《那个时刻(that moment when)》中,观众则可以决定主角的行动,实时改变故事线。
《那个时刻》中的选择之一
趋势五:新闻教育与业务训练
新闻编辑室的自适应学习 (Adaptive Learning For Newsrooms)
AI加持的交互式学习方式已经应用到了商业和教育组织中,根据问题回答的正误来为个人定制课程。具体机制可以解释为:当四个人同时参与一个关于报道突发新闻的测试,一个人回答正确,另外三个人都回答错误,却分别选择了三个不同的错误答案。按照传统方式,此时回答错误的三个人会继续受到同等的训练,但自适应学习则会根据错误为受训者额外提供对应帮助。对于新闻编辑室来说,想要为记者编辑提供特定领域的训练,帮助组织在更广阔的主题领域建立专业度,这个技术将大有可为。
授予记者的纳米学位 (Nanodegrees For Journalist)
相比为期两年到四年的传统学位项目,线上授课的纳米学位(Nanodegrees)提供了一种替代选项,它涉及某个特定主题领域或行业的研究,目标是增长知识,以及获得某种资格认证。这种方式适用于那些只想获得某一领域学习认证,却不想花费过多成本、也不想获得与传统教育同等精进程度的人。
以Coursera为代表的平台即为记者提供更具体的课程,比如由宾夕法尼亚大学开设的“记者专业外语”。Udacity是最受欢迎的纳米学位平台之一,一般6~12个月可以结业,按学期或按月付费都可以,主题包括成为数据科学家、学习开发者技能以及数字营销等。纳米学位在未来面临的重要障碍之一则是,HR和招聘团队对这种资格的认知与认可程度。
Udacity网站中的一些课程项目
趋势六:出版与分发
Web 3.0
就像云计算革命性地改变了商业管理和储存信息的方式一样,区块链技术也将带给信息技术和数据库一波创新浪潮。分布式账本能够鼓励大规模的公共参与,并开启Web 3.0 的新时代。在Web 3.0时代,合作和分散创作都能够加速发展的原因有二:基于数据挖掘、自然语言生成(NLP)和文本解析等技术,收集、挖掘与理解非结构化数据都变得更容易;通过AI和机器学习,机器能够直接彼此合作。最终,机器将能够互相训练。
已经有类似的项目在进行中。在媒体领域,Otoy通过创立一个合作者组成的去中心化分布式网络,共享空闲的处理资源,降低视觉设计效果的生产成本。另外,在Web3.0时代,媒体也能够建立微型支付系统,或者使用户能对自己的隐私和数据拥有更多的控制力。
Otoy网站首页
接近性新闻 (Proximity News and Information)
不仅仅是我们的设备能够推送和接受信息,新技术使得身体也具备这一功能,这就把我们纳入一个永远运转的信息网络当中。具体技术机制是围绕“信标(Beacon)”发生的。基于低功耗蓝牙技术的信标就是一个能够广播信号、并且根据地理上的接近性来触发行动的微型设备。Target就已经在数百家商店配置了信标,这些信标将跟踪消费者在商店不同区域间的移动。
蓝牙技术之外,内容生产者现在可以在手机应用中内置地址围栏(Geofence)功能,来根据用户位置推送通知。比如说,受过CRP心肺复苏训练的人,现在就可以在PulsePoint应用上收到提醒——附近有人需要帮助。这也意味着媒体可能实现基于消费者地理位置的精准投放。
数字化脆弱 (Digital Frailty)
过去三年,我们目睹了无数广泛传播的重要新闻报道从网上被抹去的例子,因为媒体兼并或因为网站不再维护。“数字化脆弱”指的是,新闻网站发布的数字资料难以永久保留、易于损坏的现象。
当2015年Peter Barbey收购杂志《村声(Village Voice)》时,他信誓旦旦地说“它会活下来,并且蓬勃发展”。但两年之后,Barbey取消纸版,2018年,《村声》被彻底关停。也没有任何备案来保存它的数字记载,这就意味着那些仅仅在线上发行的内容永远地消失了。而这个案例,只是无数不再存在的新闻组织之一而已。
《村声》在纽约的总部
彻底透明化 (The Case For Radical Transparency)
在未来,打击不实信息的唯一方式就是让信息收集过程完全透明化。就像读者想看内容署名一样,他们很快就会想知道内容写作的过程,确认内容的可信度。而使用智能系统的记者,也应该说明他们所使用的工具和数据。同时,由计算机自动写作内容的报道,也应该标明算法负责的是内容的哪些部分。
罗格斯大学教授Ahmed Elganmmal 开发了一种算法,能够寻找绘画作品中的创新性,并分析哪些艺术家对此产生了影响。他的研究激励别人去使用类似的网络分析、历史数据和机器学习等技术,来寻找在文学和新闻中的相似性。类似的系统可以被用来寻找新闻报道中的潜在影响因素。
闪现式新闻编辑室与限期新闻产品 (Pop-Up Newsrooms and Limited-Edition News Products)
一些组织已经开始实验“闪现式新闻编辑室(Pop-Up newsroom)”,主要为了打造特别主题的报道和一些短期产品:限期发送的新闻信、只播出几集的播客等,仅仅在专项活动发生时报道。比如,瑞典2018年选举时,一百多个记者组成了Riksdagsvalet——一个用来在选举期间抑制不实信息的短期新闻编辑室。
同时,新闻组织也在创造限期新闻产品(Limited-Edition News Products),不需要太多人力和工作流程。将来也会有更多的新闻组织做出尝试,专为某些特定活动打造短期播客、新闻信和聊天机器人。由于这种指向性,它们也适用于数据收集和精准投放广告,对媒体来说是提升收入和读者参与度的好机会。
“一对少”出版 (One-To-Few Publishing)
新闻信、播客和细分网络,都是利用小众化的吸引力来获取巨额回报,下一步就要扩展到更细分的受众群体。此外,一些平台也会为内容创作者提供构建小众付费订阅模式的机会,比如Revue和Substack就提供了上线一项付费新闻信服务的工具:软件、分析、首款服务和模板。
我们已经看到了不少独立播客和新闻信的细分尝试,但同时也期待更多的混合现实应用等创新形式。对于所有想要通过细分受众来获取收益的媒体公司来说,这个领域都潜藏着机会。
通知的滥用 (Abusing the Notification Layer)
通知显示碎片信息,包括即时更新、提醒和朋友发来的信息。它们会在手机、可穿戴设备以及其他连接设备的锁屏界面上弹出。
推送通知对新闻组织来说一直很有吸引力,因为它们能在我们专注程度最薄弱的时候捕获我们的注意力。利用我们的错失恐惧心理(FOMO,Fear of Missing Out),让我们看向屏幕并点击内容。
但问题在于,现在通知简直无处不在——从政府预警、天气预报应用、游戏、社交平台、播客……无穷无尽。新闻组织需要开发新的策略,来确保他们的通知不会对这种杂乱状况助纣为虐,避免推送把读者推得更远。
服务型新闻 Journalism as a Service(Jaas)
在传统新闻产品之外,新闻组织现在也在提供新闻服务。这种转向使得媒体能充分实现其内容价值。新闻服务主要面向从事知识领域工作的群体,包括大学、法律初创公司、数据科学公司、商业、医院甚至科技巨头等。媒体积累的内容实际上是能够被结构化、清洗,从而被多种组织运用的数据资源。
作为服务的新闻包含多个部分:新闻报道;API;编辑部和付费第三方均可使用的数据库;与新闻事件结合的日历插件;使用媒体组织积累的内容和数据库来自动生成报告的系统等。服务可以脱离社交媒体平台而提供,减少新闻组织对外的利润分成,使其提供的服务可以充分变现。
度量透明 (Transparency in Metrics)
媒体现在希望社交网络返还给它们的数据能够具有更多的透明性。对于在内容公司工作的许多人来说,数据度量标准既不容易被发现,又不容易被理解。之前,Facebook为视频播放数据有误而向广告主和媒体道歉,并且表示这种不正确的机制已经持续了两年。无疑,数据测量会影响内容生产和商业决策,也会影响公众对一则报道的流行程度的感知。现在多数大型机构都雇佣了专门的受众参与度分析经理人,来充当一种中间人的角色。
Chartbeat是新闻组织中比较流行的度量工具
平台度量标准的有效性会被媒体和广告商质疑,是因为这个标准很难被验证。同时,希望新闻能够开发出更具透明度的数据模型,也为内部员工提供有参照意义的指标。
实时信息核查 (Real-Time Fact Checking)
面对假新闻的挑战,由人和算法合作进行的实时信息核查,将会成为记者优先选择的方法。2016年,Google在其新闻服务中引入了事实核查标签,读者就能在热门报道旁边直接看到核查结果。
在以后几年,AI系统能够实现更多复杂的事实核查:揭示信息是否脱离背景、夸大或低估其重要性。很快,AR系统也能够提供协助,比如在演讲过程中,AR应用可以实时展示演讲者的资助者等利益相关情况。而基于社交媒体数据和媒体自身文章数据库的实时信息核查,在将来也能同时提升公众关注和品牌美誉度。
离线连接 (Offline Connections)
随着用户转向移动设备,开发者们也应当确保自家APP能够离线使用。Netflix、Youtube和Amazon Prime现在都在打造离线浏览功能,允许用户缓存视频,稍后观看。新闻内容聚合应用,如Google、Smartnews和Apple,同样想要尽可能地利用用户时间,哪怕在wifi信号很弱的时候。《华盛顿邮报》的渐进式网络应用(Progressive Web App,可以理解为类似微信小程序,但它是基于Web浏览器运行)就将移动网页的加载时间从4秒缩短到了80毫秒,使用户在离线状态下也能阅读新闻。
Netflix的视频离线缓存功能
音频搜索引擎 (Audio Search Engine)
随着新闻机构在播客形式上的探索,新的搜索工具需要实现媒体和用户对于纯音频内容的内容搜索。Spotify近期实现了这一功能,用户对语音助手说出他们的搜索需求,就能立刻跳转到他们尝试回忆起来的播客、重播他们在车上听到的新闻报告,或是获取特定主题相关的音频片段。
然而,我们也看到了很多对语音识别AI展开的新型攻击行为。这种攻击会欺骗语音识别系统,使其转而识别合成语音、人耳不易察觉的声音甚至家中常见的环境噪声。这些音频提示,都可能触发智能系统执行用户本来并不想要的操作,比如进行购买,或者将音量调到最大。日益依赖音频搜索的用户更需要警惕个中漏洞。
趋势七:混合现实与视频
美国成年人每天花费将近一小时线上视频,并且越来越多地使用移动端。而皮尤中心的报告显示,更多美国人偏好看新闻视频(46%),而非阅读(35%)或者听新闻(17%)。可见这一媒介形态之重要。而混合现实(VR、AR、全景视频和全息图等),也正在成为视觉形态的有力加持。
流媒体 (Streamers)
2017年的第四季度,见证了50万名消费者抛弃了他们的有线和卫星电视服务。而用户持续为电视付费的两大原因在于,电视能够观看直播,和价格优惠的互联网与有线服务套餐。——显然这两个理由都不大像传统有线电视能持续的优势。未来预期会看到Amazon Fire Stick、Google Chromecast和Roku等更多流媒体设备的份额增长,和有线卫星电视订阅的稳定消退。而流媒体服务则会侵蚀本地广播新闻市场,也会使较长时长的电视新闻节目陷入劣势。
联网电视 (Connected TVs)
可以联网的电视已经不是什么新鲜概念,而新发生的改变是它在家庭中的平均渗透率,和绕过各大有线公共频道而直接使用的流媒体应用,比如Amazon Prime Video、Roku、Youtube、Hulu、Netflix等。媒介组织应当主动利用这一技术,提供更为丰富的内容,赢得观众。
网页实时通信 (WebRTC)
WebRTC是由Google、Mozilla和Opera提供支持的实时通信技术。Google Hangouts就是基于此技术开发的应用。网页实时通信技术可以将你在电脑上阅读的文章传送到移动端,并对呈现部分进行调整以提供更好的用户体验。这一技术能够实现设备之间的无障碍沟通,这意味着媒体不再需要第三方应用,比如Skype,来为用户直播新闻,并且视频播放会更加流畅。
流媒体社交视频 (Streaming Social Video)
很多人都通过Facebook Live、Twitter、Youtube等社交平台观看过突发事件的直播。而彭博社上线TicToc这款24小时新闻产品不到一个月,就收获了超出75万的日常观众。随着人们更加倾向于通过手机和电脑屏幕观看内容,他们对直播内容的需求也就更高。
同时,我们也进入了有史以来第一个不需要任何技术基础和特殊装备就能生产新闻的时代,因此得以通过社交媒体见到了许多未经过滤的新闻事实。这也引出了一个问题,出于公共利益,是否所有内容都应该被呈现?这就需要媒体建立一个框架,来决定是否可以在社交视频中,复现一场谋杀或其他暴力行为。
全景视频 (360-Degree Video)
《纽约时报》、CNN、《华盛顿邮报》等多家新闻机构都开始使用全景视频,我们有望看到沉浸式新闻的持续发展。全景视频让用户可以捕捉到正在发生的新闻事件的全貌,而不是被迫接受镜头背后那个人选择的视角;在长视频中,全景视频也能使观众成为一个积极互动的侦探,寻找事件的蛛丝马迹。这样,全景视频就可以让观众长时间专注于作品,尤其是在这样一个注意力短缺的时代。
全息图 (Holograms)
由于其高成本和相对有限的应用,全息设备应该不会先普及到个人用户,而是先出现于较为专业的情境中。这种情况下,媒介组织可以考虑尝试为全息平台定制内容,目前来看,这一形式更适用于娱乐领域,如初创公司Eyellusion使用全息技术制作了巡回演唱会的全息版本。
虚拟现实 (Virtual Reality)
虚拟现实是一种计算机模拟环境。佩戴VR眼镜或者将手机嵌入特定设备,即可获得身临其境的体验。目前,VR市场还没有成熟到可以投入广泛应用,毕竟VR内容生产需要搭建一整个虚拟环境,对于新闻机构来说,投入产出比显得不够理想。VR未来发展可能需要娱乐和游戏方面来驱动。
另外,VR对品牌来说意味着宣传层面的新商机——通过沉浸式体验,来直接对消费者的认知产生影响。比如,宝马和沃尔沃都为想要买车的顾客推出了VR试驾的体验APP,想象一下,比起一个喋喋不休的汽车销售人员,在蓝天白云之下开阔路面上驾驶的交互体验,很容易将你的心锁定在那辆车的驾驶座位上——这也被形容为VR带来的观念偏好(belief biases)。
这位女士正通过三星VR设备来试驾一辆BMWi汽车
增强现实 (Augmented Reality)
AR并不像VR那样要模拟整个新环境,而只是在你的自然视野里放置几个数字元素。我们熟悉的游戏Pokémon Go就是AR在移动设备上的应用。不久的将来,AR会为新闻机构开启新的市场,媒体可以通过用户视野中的可识别元素,来丰富实时内容的传递。
AR在媒体中的应用还有不少。比如类似于Snapchat脸部贴纸的AR功能,可以隐藏信源的身份。另外,AR可以为报纸印刷版增加交互亮点,作为吸引读者的一种方式。内容方面,AR公司Blippar可以为之补充只能用智能手机解锁的动画或图像。广告投放方面,用户可以使用AR来扫描他们喜欢的东西,浏览数字商品信息界面,直接通过手机购买。AR的这种加成意味着媒体与广告主之间的双赢。
美妆公司Max Factor和Blippar联合推出的识别商品的功能
混合现实体验馆 (Mixed Reality Arcades)
就像上个世纪80年代的电子游戏一样,游戏形式日渐流行,但大多数人并不能负担设备费用,所以如同当年的游戏厅,混合现实体验馆应运而生。新成立的“虚拟世界体验馆”即提供一种无限VR体验时间的会员资格。这种生意能够持续的原因还在于,随着技术发展,游戏愈加沉浸化,玩家不时需要更新设备——这就没有购买会员资格来得划算。
趋势八:可穿戴设备
可穿戴设备(Wearables)如今已成趋势。对媒体来说,一方面,它是需要为之定制内容来抵达特定读者的新媒介形式;另一方面,也是可以从读者一方收集反馈信息的方式。比如,视线、心率、睡眠模式乃至身处的天气情况,都可以及时传递给企业,反馈用户行为,实现高度定向化的内容分发。
智能眼镜 (Smart Glasses)
这是开发者开始尝试智能眼镜Magic Leap的一年。Magic Leap直接投影到用户眼中,看到的数字影像就好像存在于现实世界当中一样。目前来看,智能眼镜还在探索其市场方向。
智能收听设备 (Hearables/Earables)
智能收听设备集成了语音指令、生物识别跟踪、选择性降噪、音乐和数据存储以及软件集成等功能,本质上是功能更高级的耳机。Apple旗下无线耳机Earpods将来可能可以监控运动时的体温、出汗、心率等情况,同时也可以仅仅通过感应头部动作来控制手机等设备。耳机Bragi Dash配合智能语音助手,响应语言与动作指令。媒体现在也可以尝试为听觉设备的交互场景设计音频应用了。
头戴式显示器 (Head Mounted Displays)
头戴式显示器(HMD)是目前VR、游戏和其它沉浸体验中最多应用的设备。虽然由于佩戴不适感和眩晕等原因,此种设备尚未普及至家用用户,但HTC Vive和Oculus等设备品牌还是展示了引领游戏与专业使用者细分市场的潜力。目前,新闻与之结合的主要机会还是通过360°全景视频。
触觉交互 (Haptics)
在可穿戴设备的情境中,触觉交互(Haptics)代表着设备与用户通过肢体感知来沟通的手段,比如智能手表的震动提醒。随着可穿戴设备进步,触觉交互的机制和应用都会变得更复杂。Facebook甚至测试过佩戴在前臂上的设备,该设备可以将一定单词词汇转化成一系列模式化表意的震动。这项技术离普及应用还比较遥远,不过也提醒媒体可以利用触觉交互,在没有视听界面的情境下,向读者传递新闻标题或一些简短推送。
思考式设备 (Thinkables)
思考式设备(Thinkables)是指在技术和人脑之间建立交互的可穿戴设备,使用户用想法去控制指定设备。公司4DForce制造了一种头戴设备,可以将脑电波转化为电脑能够理解的信号,搭载于游戏、健康和娱乐等应用之中。Facebook也在尝试开发一种设备,可以读取脑电波,推断人所想的词语。
植入式设备 (Embedables)
植入式设备是可穿戴设备的极端趋势。一些技术狂热者寻求将技术直接植入自己的身体,植入物包括装饰性LED灯,嵌入手臂皮肤之下的RFID芯片(用来解锁电子门)等。这种趋势过于小众,对于新闻机构而来,尽管有一种流行做法是在耳朵中植入磁铁代替耳机,可能会促进音频媒体消费,但由于健康风险,预计不太可能在短期内成为主流。
智能手表 (Smartwatches)
考虑Apple watch和Samsung Gear等产品的普及,智能手表和智能手环可能是可穿戴设备中最亲民的一种了。目前它们仍然作为手机的辅助性角色出现,但随着发展,基于位置服务、动作感应和解放双手等特色,以及开发者不断为其定制应用与功能,它也会渐渐独立。智能手表前景不错,新闻机构可以考虑怎样定制内容,从而在可穿戴设备领域占据一席之地。
趋势九:硬件
微型卫星 (Cubesats)
接下来的三年里,企业会尝试制造和发射数以千计的低成本、高价值的卫星。这些卫星很小,能够彼此联系,无间断地拍摄地球表面每一寸土地的影像。
微型卫星,直译是“立方体卫星”。其拍摄的图片经过图像分析软件,可以提示沃尔玛等大型零售商,停车场里现在停了多少辆车,并且观察不同时段的变化规律。美国联邦航空管理局计划在2018-2020年间发射“前所未有的数量”的微型卫星。记者、公司、政府和公民个人都可以出于各种目的来获取其拍摄的图像和工具,但也意味着一定的国防安全问题。
无人机物流 (Drone Delivery)
2016年底,商用无人机运输开始运行。美国公司Zipline用其无人机运输系统向卢旺达地区供应血液,UPS、亚马逊、DHL等也在测试自己的无人机。预计2019-2020年,航空管理当局会开始行动,商用无人机也最终进入正式运行阶段。这意味着会出现更多的新闻报道选题,也很有可能代表着人工投递报纸时代的终结。
一只帮7-11送货的无人机
上升的无人机专利数量和对新法规的呼吁 (Increasing Patents and Calls For New Regulation)
无人机运输服务能否发展,很大程度上取决于立法和企业的发展。2017年底,特朗普政府宣布授权一项项目,来测试“创新区”不同条件下的无人机飞行。在欧洲,欧盟暂时批准相关法规,目前仍在等待成员国的确认。加拿大、英国和国际民用航空组织都在制定新的法规。这些结果都将影响2020年及之后无人机的发展。
无人机交通 (Drone Lanes)
业余无人机驾驶员一直在给商业和私人航空飞行员带来麻烦。目前,美国联邦航空局(FAA)规定,禁止无人机在机场空域飞行。NASA和美国联邦航空局正在制定计划,以提供全国范围内无人机交通管理的解决方案。这也为从事基础设施管理和基于AI云的监控项目的公司提供了机遇。
自主检测与避障技术 (Sense and Avoid Technology)
利用神经网络和人工智能的机器人能够依据程序设计做出推论和决策。“自主检测与避障技术”是其原理。今年,无人机将可以沿着GPS定位点的路径飞行,它们会在空中策划最佳路线,决定何时避开建筑物、树木和山峰或者其他无人机。
应用于极端领域的无人机 (Microdrones and Drones Used In Dangerous/ Hard-To-Reach Areas)
工业领域开始应用AI驱动的迷你无人机来进入难以到达的危险空间,比如地下矿井和核设施的内部。这样一来可以降低人类生命危险,缩短无人机停机时间,从而节省成本。Facebook推出了一款提供网络信号的无人机,加上AT&T开发的蜂窝网络信号无人机的成功运行,证明了无人机可以给缺乏基础设施的欠发展地区提供基本服务。
无人机群 (Drone Swarms)
几百台微型无人机可以同时部署,作为一个有机技术整体在空中移动,速度可以快到相机难以实时捕捉。这项技术由军方开发,被应用于迪斯尼公园和超级碗半场表演期间的灯光秀。不过,在2018年,据称由叙利亚叛乱分子控制的无人机群袭击了两个俄罗斯军事基地。
物联网搜索 (Searching The Internet of Physical Things)
物联网正在以相当可观的速度发展,可能会有数以亿计的实体设备被关联到网络当中,那要如何搜索它们呢?Shodan和Thingful是两款针对物联网设备的搜索引擎,它是一款用来帮助IT人员定位物联网设备的追踪工具——但与此同时,黑客也发现他们可以用此来远程连接婴儿的摄像头或车库的门。在不远的将来,也许不难看到世界上所有的东西都成为分布式网络中可搜索的一份子。黑客行为也提醒着我们需要匹配一个核实搜索结果的新系统。
搜索引擎shodan的主页
智能摄影机 (Intelligent Cameras)
搭载AI功能的智能摄影机能够自动听声音和观看所拍摄的影像,然后根据获取的信息做出拍摄决定。比如记录一段谈话,或者追踪一个小偷。2017年,亚马逊云服务(AWS)上线了一种名为DeepLens的AI摄影机,包含图像和物体识别功能。智能摄影机可以协助公司远程统计和监控仓库中的货物。华盛顿大学也开发了一种可以追踪人体移动的智能相机网络系统。
DeepLens
将来,智能摄像机会和其它物联网设备联合,进行自主决策,比如什么时候应当锁门——以及最后一块派应该分给哪一位室友。
速度更快的5G网络 (Faster Connected With 5G)
5G是第五代无线技术,现在正在全世界范围内建设当中。5G会大幅度地提升连接速度,我们将可以在云端加载高清和3D视频,甚至使用VR,下载速度预计可以达到10Gb/s左右,这将对新闻组织的视频内容分发产生极大的帮助。不仅仅是手机可以使用5G网络,无人驾驶汽车、智能电网和智慧城市也都可以。
趋势十:媒介经营
媒介整合 (Media Consolidation)
在美国,数字用户日渐增加,传统媒体公司利润持续下降,基于广告的收入模式很难维持,尤其是对于本地媒体来说,形势更加艰难。美国联邦通信委员会(FCC)的去管制化政策也为大型媒体集团的收购合并与垂直整合铺平了道路。
广告拦截 (Ad Blockers)
拦截技术继续发展,威胁媒体的商业模式,正在被媒体联合起来共同抵制。媒体所采用的更好的广告形式和移动体验似乎已经生效了。研究发现,广告拦截率已经趋于稳定,但给媒体造成的收入流失依然是一个重要问题。
媒体用来拦截广告的拦截软件的策略有两种,提升广告质量和用户体验的“曲线救国”法,和更直接地检测拦截软件、禁用其脚本的方法。也有一些网站在检测到广告拦截软件时,要求用户将其加入白名单。广告之外,媒体还在探索其它替代性的内容变现方式,但进展缓慢。Google 2014年上线了Google Contributor,作为读者来对媒体进行小额付费的方式,具体视他们访问的频率而定。
趋势十一:政策规制
互联网巴尔干化 (Splinternets)
二十年前,互联网作为一个信息自由的全球性空间诞生。而现在,互联网应当如何被规制,被谁规制,每一个人都有不同的观点。不远的将来,我们即将抵达一个分裂的巴尔干化的互联网时代。2018年的GDPR法案使得数以百计的合法新闻机构被封锁,我们可以看出不同地理环境中的网络状况有多么不同。
由于缺乏协调努力,互联网的分裂趋势未来几年会继续扩散。这可能会使世界范围内的优质新闻传播更加困难。它也可能会给面向全球读者分发内容的新闻机构带来大麻烦。
泄密 (Leaking)
2018年同样见证了大量的泄密事件的发生,泄密涉及政治和社会领域。但需要记住的是,如果政府信息不向媒体披露,那么政府将有效控制公众了解到的信息。问题在于如何确立哪种信息可以披露的标准,比如事件完全出于政治的或违反道德的原因。以及,在泄露信息可以被快速散布的情境下,应该做些什么来保护特殊信息。
数字时代的第一修正案 The First Amendment in a Digital Age
虽然美国宪法第一修正案制定已经很久了,但今天一如既往,它还在设计和开发的领域发挥着建设性的作用,为技术创造者和用户提供着法律保护。
然而,宪法第一修正案反对的只是政府对于自由言论的压制,不包括私人企业。如果Facebook或者Twitter决定封锁所有政治倾向言论,只因其无法摆脱虚假消息的嫌疑,他们也仅仅只是做出商业决策,而并不违反第一修正案,收紧信息规则对他们来说有着绝对的正当性。
数字时代,第一修正案的问题还在于,AI的言论是否应当被赋予同样的权利,以及技术、算法和代码的开发者,应当负何种程度上的义务。
file:///C:/Users/mac/AppData/Local/Temp/ksohtml/wpsD84A.tmp.png 趋势十二:安全与隐私
如今,再怎么强调隐私安全的重要性也不为过。科技巨头、政府管理者乃至每个公民都被卷入了各种问题当中:从个性化到隐私,从信息安全到监管,从透明度到国家安全。相对较大的新闻组织拥有解决安全和隐私问题的资源,但小型新闻编辑室则面临着保全自身和用户数据的安全挑战。网络环境下,信息产业面临着堪称影响生死存亡的危机,是继续现在的商业模式,还是开始建立更能保护用户数据的新模式,全看他们的选择。
合规方面的挑战和不切实际的预算 (Compliance Challenges and Unrealistic Budgets)
安全与隐私之间由来已久的张力,在未来将产生更多挑战。用户每天都在产生更多的数据,每天都有更多的连接设备进入市场,也就使得可用数据激增。而那些掌握用户数据的组织,尚未做好未来备案——但相关规章制度又作出了要求。管理者将需要持续更新他们的安全策略,并使个中细节透明化。大多数组织并没有投入足够的预算来保护他们的数据和设备,但这意味着承担后果。比如,没有为物联网安全制定足够预算的企业,会发现自己将要处理大量的召回、问题补救和诉讼纠纷。
差分隐私 (Differential Privacy)
差分隐私原本是一个数学概念,近期,它被Apple和Google等公司运用,作为一种分析总体数据、但不会泄露个人信息的方式。差分隐私是通过在数据集中策略性地注入随机噪音而实现的。差分隐私很适合用来研究低敏感度的简单问题,比如分析iPhone用户中最流行的emoji,谷歌地图中的交通模式等,同时可以保护个人用户的匿名状态。
差分隐私能做的相对有限,即使很多科技巨头都提供了各自的成功经验。这一机制生效仍然取决于具体的应用和数据集,在多种变量相关时,差分隐私也很难维持其效果。
勒索软件 (Ransomware As A Service)
在英国,一款名为WannaCry的勒索软件关闭了80家医疗中心的电脑,迫使20000多个预约被取消。黑客应用恶意工具来劫持数据,锁定系统和设备,直到要求的费用被支付为止。考虑现金和网银支付容易被追踪,比特币成为他们新的选择。区块链和加密货币的出现使得勒索软件转而成为一种可以盈利的生意。现在,简单的数据备份可能也不够为我们带来实质性的保护了,因为研究者发现,黑客不单单满足于扣留你的数据,而是威胁要将它们悉数公布在网上,供所有人观看。
黑客行为增长 (Hacktivism On The Rise)
由黑客转型而来的激进分子(Hackers-turned-activists)近几年很忙碌——为了信仰。他们对政府、组织和银行发起了DDoS攻击,渗透美国大选。包含维基解密在内的黑客组织,已将自身视为推动变革的持续性力量。这一类黑客将继续用他们的技能来帮助重塑政治和商业实践。
针对语音助手的定向攻击 (Targeted Attacks on Digital Assistants)
Alexa、Siri、Cortana等语音助手已经成为主流应用,我们也就不难预料到随之而来的定向攻击——无论攻击者针对的是语音助手还是它们的硬件。这也需要被纳入媒体公司的考虑范围之内。
计算机“小故障”频发 (Strange Computer Glitches Will Keep happening)
小故障(Glitches)指的是那种不会产生即时的、显著的影响,但可能导致毁灭性结果的问题。比如,英特尔就被一位谷歌工程师发现其芯片设计的巨大漏洞,后招致了许多批评;摩根大通等银行遇到技术故障,导致用户无法访问其账户信息,也没办法存钱或者取钱;或者语音助手Alexa错误地把一对夫妻在厨房中的谈话发给了他们的朋友,这也属于系统小故障的范畴。“小故障”通常与网络连接和带宽需求计算中存在的问题有关。
加密货币协助,暗网扩散 (Proliferation of Darknets, Aided By Cryptocurrencies)
暗网一般是指为违法活动提供匿名性保证的网络空间。人们可能会在这里出售枪支,或者兜售被黑客窃取的数据。而可以保证交易活动基本不受追踪的加密货币,刺激了暗网的活动。浏览暗网并不违法,但也不像你在网上搜索你高中的暗恋对象一样随意,还是需要具备特定软件和一定的技术知识。不过也有少数好的事情在暗网之中发生,比如异见者在这里寻求庇护,有些调查记者也会在这里寻找新闻线索。
政府和执法部门会接受如何探测暗网的技术培训,但其挑战在于,培训是静态的,而暗网掌握在其开发者的手中。
新型开源应用的脆弱性 (New Open Source App Vulnerabilities)
2017年,一位数据科学家发现了一种能够感染OpenAI Gym的新型恶意软件——OpenAI Gym是一种用于机器学习算法的开源工具。这只是恶意程序利用开源应用程序漏洞的案例之一,这种恶意程序的市场还在不断扩展。随着AI生态的发展,势必需要更多的开源代码和社区构建的工具,所以提前发现问题就显得尤为重要。而使用开源工具的组织以后也需要每日例行检查,来保障安全。
窃听与被窃听的权利 (The Right To Eavesdrop/Be Eavesdropped On)
随着我们越来越多地使用接入物联网的设备(手机、汽车、咖啡机等等),这些设备之间、设备和开发公司之间都在随时交换信息——关于用户的信息,设备在“窃听”、彼此“交谈”和研究用户,但用户却被排除在这一过程之外。关于用户权益的争论点就在于,用户是否应当拥有这样的权利,去了解设备传递了自身哪些信息、以及背后是谁在窃听这些信息呢?
匿名 (Anonymity)
匿名性是如今的技术趋势之一。世界需要匿名性,它可以保护泄密者,还有那些可能因自己的信仰而遭到迫害的人们。数字匿名性允许我们在需要的时候联合起来,进行善意募捐,或是与不正义作斗争。然而,匿名性也助长了泄露隐私信息、攻击其他社交用户和发表诽谤性言论等线上行为。我们对于匿名发表内容的希望不会消退,但同时,我们对于核实查证的需求也更强烈了。
网络喷子 (Trolls)
喷子(Trolls)代表的是一种特定类型的网络暴力,通常包括垃圾邮件、仇恨言论、人肉搜索和其他形式的骚扰。抑制喷子行为往往迫使许多媒体必须要在言论自由和审查两种立场之间抉择。过去一年,Twitter、Facebook和Instagram都提升了平台对于仇恨言论的限值标准。Facebook在2016年首次应用人工智能算法DeepText,来减少Instagram和Messenger中冒犯性的言论。
媒体机构,尤其是新闻网站,在调节线上言论的过程中,都在努力保持一种客观无偏见的立场。Google开发的Perspective API通过使用机器学习和人工智能技术,帮助其他平台和媒体提升其网站的评论审核能力,其中就包括维基百科、《纽约时报》、《卫报》、《经济学人》等。
真实性 (Authenticity)
内容真实性问题已经不只出在虚假新闻,现在还扩展到了一种新型的虚构媒体:视频。Deepfakes就是一例,由计算机生成“换脸”视频。这一趋势起初发端于Reddit,并在关闭之前积累了超过80000名订阅者。真实性核查公司Trupic已经拿到了超过1000万美元的种子投资,致力于打击被操纵的图片或视频。
数据保留 (Data Retention)
欧盟通用数据保护条例(GDPR)给全球媒体组织都敲醒了警钟,提供了数据保存政策所急需的标准。随着科技巨头随之更新数据政策以符合监管,依赖报告和分析的小型媒体组织也感受到了压力。YouTube宣布,从2018年7月开始,它会在60天之后删除数据分析报告。
所有权 (Ownership)
法律意义上来讲,数据所有权一般指的是IP或者版权数据。随着可穿戴设备和物联网的兴起,人们也意识到他们自身的健康数据和线上活动是如何被大型公司收集并利用的。近期Facebook、Apple和Amazon又都上线了面部识别功能和相关产品。我们已经进入了一个设备生来智能且永远处于连接之中的时代,但数据使用的监管和所有权却尚未明晰。
加密管理 (Encryption Management)
过去两年发生了许多大型攻击事件,但至今,拥有我们数据的组织要么不使用加密手段,要么使用过时的工具。黑客自然也知道这一点,所以我们接下来有望看到更多攻击。不过,加密数据可以阻挡黑客侵入,但也会使员工和消费者合法使用数据变得更难。未来,企业总需要投入大量资源来建设数字安全——或者在被攻击时花上数百万美元善后。
语音监控 (Constant Audio Surveillance)
有了新型智能音箱技术和更先进的机器学习系统,公共区域成为监控的主要场所。2018年,沃尔玛申请了一项专利,用于监听客人和员工之间的互动,以及货物上架下架产生的噪声,还有我们使用移动设备发出的咔哒声。所有这些数据都可以收集起来做进一步的分析,但这无疑也带来了隐私问题。
数据泄露 (Leaky Data)
用户越来越讨厌所谓的“开源”网站,尤其是那些使用他们数据的网站。一家开源家谱网站GEDmatch允许用户自愿免费分享他们的基因档案,作为寻找亲人与追踪家谱的一种方式。GEDmatch也被执法部门使用,成功追踪并逮捕了连环杀手Joseph James DeAngelo,他自己没有提供过生物样本,但显然某个和他有亲缘关系的人这么做过。这个案例表明,如果你认识的人——或者和你有某种联系的人——将自己的信息上传至开源网站,就很有可能由此追溯到你。
总之,这份报告不仅描摹了技术革新为行业带来的美好愿景,也暴露了种种伦理规范尚未匹配之时的问题。最后不妨也引用FTI创始人Amy Webb在报告前言中的话:“无论技术怎样变化,我们都要有能力创造自己喜欢的未来。”
附注: 1、考虑呈现,合并原报告相近技术、技术-技术应用,如下: 004 Real-Time Machine Learning+005 Real-Time Context in Machine Learning 016 Ambient Interfaces+017 Digital assistants Become Ubiquitous 064 VR+069 VR for marketing 065 AR+AR Face filters to protect individual's identity+067 AR as a tool to enhance print 2、补充引用资料: [1] 008-AI For Seeing Trough Walls https://www.quantamagazine.org/the-new-science-of-seeing-around-corners-20180830/ [2] 012- RL and Hierarchical RL https://www.quora.com/What-is-supervision-in-machine-learning [3] 047- Proximity News and Information
网址链接:https://mp.weixin.qq.com/s/2dqKWdY1Oi1TpWaZaL9t4w
编辑:臧博
|