人工智能与新闻业案例集锦

刘海明 · 发表于 2019-8-21 12:22:32

【案例】智能时代需要「向善」的技术伦理观

原文作者：司晓

原文来源：腾讯研究院

原文链接：https://mp.weixin.qq.com/s/mn-H2ciohE3yjgtcZsv4Iw

随着人工智能技术的快速发展和广泛应用，智能时代的大幕正在拉开，无处不在的数据和算法正在催生一种新型的人工智能驱动的经济和社会形式。人工智能能够成为一股「向善」的力量，持续造福于人类和人类社会，但也带来了隐私保护、虚假信息、算法歧视、网络安全等伦理与社会影响，引发了对新技术如何带来个人和社会福祉最大化的广泛讨论。人工智能伦理开始从幕后走到前台，成为纠偏和矫正科技行业狭隘的技术向度和利益局限的重要保障。正如有学者所言，要让伦理成为人工智能研究与发展的根本组成部分。

在此背景下，从政府到行业再到学术界，全球掀起了一股探索制定人工智能伦理原则的热潮。例如，OECD和G20已采纳了首个由各国政府签署的人工智能原则，成为人工智能治理的首个政府间国际共识，确立了以人为本的发展理念和敏捷灵活的治理方式。我国新一代人工智能治理原则也紧跟着发布，提出和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理八项原则，以发展负责任的人工智能。可见，各界已经基本达成共识，以人工智能为代表的新一轮技术发展应用离不开伦理原则提供的价值引导。

因此，我们认为需要构建以信任、幸福、可持续为价值基础的人工智能伦理，以便帮助重塑数字社会的信任，实现技术、人、社会三者之间的良性互动和发展，塑造健康包容可持续的智慧社会。

构建让人信任的人工智能规则体系

虽然技术自身没有道德、伦理的品质，但是开发、使用技术的人会赋予其伦理价值，因为基于数据做决策的软件是人设计的，他们设计模型、选择数据并赋予数据意义，从而影响人们的行为。所以，这些代码并非价值中立，其中包括了太多关于人类的现在和未来的决定。所以，技术无关价值的论断并不正确。现在人们无法完全信任人工智能，一方面是因为人们缺乏足够信息，对这些与我们的生活和生产息息相关的技术发展缺少足够的了解；另一方面是因为人们缺乏预见能力，既无法预料企业会拿自己的数据做什么，也无法预测人工智能系统的行为。

因此，需要构建能够让人们信任的人工智能规则体系，让技术接受价值引导。作为建立技术信任的起点，人工智能发展与应用需要遵循四个方面的理念，给人工智能发展提供必要的价值引导。

一是可用。发展人工智能的首要目的，是促进人类发展，给人类和人类社会带来福祉，实现包容、普惠和可持续发展。为此，需要让尽可能多的人可以获取、使用人工智能，让人们都能共享技术红利，避免出现技术鸿沟。可用性还意味着以人为本的发展理念、人机共生、包容性以及公平无歧视。要求践行「经由设计的伦理」理念，将伦理价值融入到人工智能产品、服务的设计当中。

二是可靠。人工智能应当是安全可靠的，能够防范网络攻击等恶意干扰和其他意外后果，实现安全、稳定与可靠。一方面人工智能系统应当经过严格的测试和验证，确保其性能达到合理预期；另一方面人工智能应确保数字网络安全、人身财产安全以及社会安全。

三是可知。人工智能应当是透明的，是人可以理解的，避免技术「黑盒」影响人们对人工智能的信任。目前，学界和业界已在致力于解决人工智能「黑盒」问题，实现可理解的人工智能算法模型。此外，算法透明不是对算法的每一个步骤、算法的技术原理和实现细节进行解释，简单公开算法系统的源代码也不能提供有效的透明度，反倒可能威胁数据隐私或影响技术安全应用。相反，在人工智能系统的行为和决策上实现有效透明将更可取，也能提供显著的效益，例如在适当的时候对人工智能系统的决策和行为提供说明，而不是一味追求技术透明。最后，在发展和应用人工智能的过程中，应为社会公众参与创造机会，并支持个人权利的行使包括隐私、表达自由、救济等。

四是可控。人工智能的发展应置于人类的有效控制之下，避免危害人类个人或整体的利益。短期来看，发展和应用人工智能应确保其带来的社会福祉显著超过其可能给个人和社会带来的可预期的风险和负面影响，确保这些风险和负面影响是可控的，并在风险发生之后积极采取措施缓解、消除风险及其影响。长期来看，虽然人们现在还无法预料通用人工智能和超级人工智能能否实现以及如何实现，也无法完全预料其影响，但应遵循预警原则，防范未来的风险，使未来可能出现的通用人工智能和超级人工智能能够服务于全人类的利益。

当然，信任的建立，需要一套规则体系。在这些原则之下，人们可以探索制定标准、法律、国际公约等。需要采取包容审慎、敏捷灵活的治理方式，可以采取事后监管或者通过出台标准、行业公约、伦理框架、最佳实践、技术指南等调整人工智能等新技术的发展应用，支持行业自律。

确保人人都能追求数字福祉

其一，保障个人的数字福祉，人人都有追求数字福祉的权利。一方面需要消除技术鸿沟和数字鸿沟，全球还有接近一半人口没有接入互联网，老年人、残疾人等弱势群体未能充分享受到数字技术带来的便利。另一方面减小、防止数字技术对个人的负面影响，网络过度使用、信息茧房、算法偏见、假新闻等现象暴露出了数字产品对个人健康、思维、认知、生活和工作等方面的负面影响，呼吁互联网经济从吸引乃至攫取用户注意力向维护、促进用户数字福祉转变，要求科技公司将对用户数字福祉的促进和保障融入到数字产品及服务的设计中。

其二，保障个人的工作和自由发展，人人都有追求幸福工作的权利。虽然有人声称人工智能将导致大规模失业和无用阶层的出现，但目前而言，人工智能的经济影响依然相对有限，不可能很快造成大规模失业，也不可能终结人类工作，因为技术采纳和渗透往往需要数年甚至数十年，需要对生产流程、组织设计、商业模式、供应链、法律制度、文化期待等各方面做出调整和改变。但工作的内容、性质、方式和需求等可能发生很大变化，需要人们掌握新的知识和技能。预测显示，未来20年内，90%以上的工作或多或少都需要数字技能。而且人工智能、机器人等新技术正在从ICT领域向实体经济、服务业、农业等诸多经济部门扩散、渗透，未来中国将成为机器人大国，这些变化将在很大程度上影响当前的就业和经济结构。现在需要做的就是为当下和未来的劳动者提供适当的技能教育，为过渡期劳动者提供再培训、再教育的公平机会，支持早期教育和终身学习。

塑造健康包容可持续的智慧社会

技术创新是推动人类和人类社会发展的最主要因素。在21世纪的今天，人类所拥有的技术能力，以及这些技术所具有的「向善」潜力，是历史上任何时候都无法比拟的。换言之，人工智能等新技术本身是「向善」的工具，可以成为一股「向善」的力量，用于解决人类发展面临着的各种挑战。与此同时，人类所面临的挑战也是历史上任何时候都无法比拟的。联合国制定的《2030可持续发展议程》确立了17项可持续发展目标，实现这些目标需要解决相应的问题和挑战，包括来自生态环境的、来自人类健康的、来自社会治理的、来自经济发展的等等。

将新技术应用于这些方面，是正确的、「向善」的方向。例如，人工智能与医疗、教育、金融、政务民生、交通、城市治理、农业、能源、环保等领域的结合，可以更好地改善人类生活，塑造健康包容可持续的智慧社会。因此，企业不能只顾财务表现、只追求经济利益，还必须肩负社会责任，追求社会效益，服务于好的社会目的和社会福祉，给社会带来积极贡献，实现利益与价值的统一。包括有意识有目的地设计、研发、应用技术来解决社会挑战。

编辑：吴悠

刘海明 · 发表于 2019-8-21 13:30:41

【案例】干货！中央广播电视总台5G+4K/8K+AI应用实践报告

原文来源：广电独家

原文链接：https://mp.weixin.qq.com/s/xzieJtXeFr5xwn_lzRJtRQ

今年10月1日之前，中央广播电视总台标清制作系统将全面下线。与此同时，总台将推出超级移动客户端——“央视频”App。

8月20日，BIRTV2019主题报告会在北京国际饭店会议中心举行。中央广播电视总台央视分党组成员姜文波作了题为《中央广播电视总台5G+4K/8K+AI应用实践》的报告，介绍了总台在5G+4K/8K+AI上的战略布局、应用案例和新中国成立70周年庆祝活动的转播计划。

报告透露了以下几个重要信息：

今年10月1日之前，中央广播电视总台标清制作系统全面下线。CCTV公共频道和CCTV付费频道将全部实现高清化。

2018年，总台已完成CCTV-13新闻频道高清制播系统建设，并于2018年开展运行前的演练，近期将择机正式上线运行。目前，CCTV付费频道高清播出及编码压缩系统也已建设完成，计划在下个月正式上线运行。

除此之外，在“十一”前夕，总台将推出超级移动客户端——“央视频”App。

总台积累了海量的电视节目库，并具备强大的电视及新媒体生产能力，要将“央视频”App打造成为用户喜爱、以视频为主的超级移动客户端。

通过“央视频”这个超级客户端和各频道垂直客户端，总台将对新中国成立70周年庆祝活动进行全方位、多角度宣传报道。

不仅如此，为做好庆祝新中国成立70周年的宣传报道工作，总台将投入3辆4K转播车和1套4KEFP进行现场转播，通过台内4K演播室进行包装制作，在CCTV-4K、CCTV-1/13等高清电视频道直播。

与此同时，总台还计划将4K超高清电视信号接入全国70家电影院直播，将设置约10个8K电视机位录制庆祝活动素材。

以下为演讲报告的主要内容：

▍总台5G+4K/8K+AI战略布局

在战略布局上，主要包括以下几方面：

融合制播：融合发展关键在融为一体、合而为一。

要不断推进电视与新媒体一体化发展，充分发挥电视媒体在视频音频制作方面的优势，迅速提升总台高品质新媒体制作能力。

超高清电视：超高清是电视发展的必然。

按照国家超高清行动计划，结合总台实际，加快推进HD向UHD升级换代，快速提升总台超高清电视制作能力和节目产量，为广大用户提供丰富的超高清电视节目。

移动新媒体：5G移动通讯网为广电媒体的发展插上了翅膀。

要坚持移动优先策略，充分发挥5G网络技术优势，打造总台超级客户端，构建手机小屏和电视大屏融合传播的全媒体分发服务体系。

人工智能：人工智能将彻底重构电视媒体的生产传播。

要充分运用云、大数据和人工智能等技术，创新媒体形态，优化媒体制播流程，再造融媒体生产传播平台，建立精准传播体系，增强用户的收视体验，支撑总台从传统媒体向国际一流新型主流媒体转型升级。

央视媒体融合技术体系1.0（2016-2018）实现一体化协同制作，多渠道协同分发，多终端互动呈现，全媒体精准传播。

重要公告：告别标清

今年10月1日之前，中央广播电视总台标清制作系统全面下线。

2018年，总台已完成CCTV-13新闻频道高清制播系统建设，并于2018年开展运行前的演练，近期将择机正式上线运行，这标志着CCTV公共频道全部高清化。

目前，CCTV付费频道高清播出及编码压缩系统已建设完成，并进入上线运行前的整备阶段，计划在下个月正式上线运行，这标志着CCTV付费频道将全部高清化。

为满足全国直播卫星服务平台、IPTV平台、地面模拟及数字电视、海外电视传播的播出需求、总台仍采用HD下变换SD的方式，在播出高清的同时，仍保留CCTV公共服务频道和部分付费频道，以及CGTN频道的标清播出。

▍总台5G+4K/8K+AI应用案例

4K/8K

以标准规范为主线，以应用需求为牵引，以总台4K技术体系建设为平台，联合产学研机构，全面推进4K/8K技术创新，引领全国4K/8K发展。

总台首创4K伴随HD超高清制播模式

其技术特点是：

在高清制作平台，快速实现4K制作，大幅度降低4K系统建设成本——仅升级4K摄像机无需升级4K全系统，延续HD目生产流程；

4K智能伴随HD制作，无需人工干预——4K节目智能伴随高清切换台切换制作，无需人工干预，自动生成4K PGM；

4K和HD同步制播，提高节目生产效率——1个节目制作团队同步制作HD和4K电视节目。

关键技术

虚拟切换技术包括2项发明专利——《4K节目监看方法及系统》《4K节目制作方法及系统》，2项专利均已进入实质审查阶段。

典型应用及效益

已在央视部署4个大型综艺演播室、1辆转播车和1套外场ESP系统；

《2018年央视春节联欢晚会》实现4K版自动智能录制；

《2019年央视春节联欢晚会》实现4K和HD同步直播；

2018年总台超高清节目产量由2017年21小时提升到2018年851小时，增长了40倍；4K制作成本约为HD的1.2倍。

科技奖励

荣获2019年中国电影电视技术学会科技进步奖一等奖。

原创混合现实（IMR）4K超高清电视制作模式

总台开创性地提出了原创混合现实（IMR，Idea Mixed Reality）4K超高清电视制作模式。按这个模式，总台制作了5集大型科学纪录片《飞向月球》。

原创驱动，沉浸式创作：节目制作的电视技术人员和节目人员整合成一个团队，一起进行创作设计。

前期拍摄渲染和后期编辑合成紧耦合：根据故事场景在虚拟演播室构建一个拍摄、渲染、后期编辑、合成紧耦合的制作环境，采用集控技术，实现对摄像系统、灯光系统、渲染系统等的集中控制，满足沉浸式制作需求。

奖励：《飞向月球》2019年UNREALOPEN DAY被授予最佳行业应用奖，入围中央宣传部精神文明建设“五个一工程”优秀作品奖。

2019年，中央广播电视总台将建设IMR 4K超高清电视制作平台，打造4K超高清电视精品纪录片制作新高地。

4K IP信号调度及交换系统

总台联合华为公司和格非公司，开发了4KIP信号调度及交换系统。

总台：牵头组织，提出需求，总体方案设计，应用试验平台；

华为：IP调度和交换核心组网解决方案（NE9000-8,8X4Tbps）；

格非：IP视音频处理方案及相关设备，SDN控管监系统。

4K IP演播室系统

总台联合华为和格非公司开发4KIP演播室系统。总台提出需求、总体设计和应用平台，华为提供IP交换技术（NE40E，2Tbps），格非开发综合控管监系统和AV转换处理媒体节点。

自研媒体节点——遵循国际标准，自主开发，与国际主流设备互联互通。包括IP 网关、IP多画面、摄像机、字幕包装、播出录制、延时器、监视器等媒体节点设备。

全IP远程制作——符合ST2110标准，全程制作、控制IP化，满足远程制作、现场播出要求。

IP信号净切换——基于高精度PTP，整帧切换、即切即得，软件定义硬件面板。

4K电视 or 4K电影

4K UHDTV 视音频技术参数：3840x2160清晰度， 50p，BT.2020色域，HDR（HLG标准/1000nit）， 10bit色深，5.1环绕声/三维声。

4K数字电影视音频技术参数：4096x2160清晰度，24P（48P），SDR，DCI-P3 色域（低于BT.2020），12bit色深，5.1环绕声（巨幕11.1环绕声）。

图像和声音两个方面均达到或超过电影院的水平，基于4K超高清电视的家庭影院可以达到电影院VIP厅的效果，在超高清电视时代，电影和电视将全面融合，完全可以满足人们对家庭影院需求。

家庭影院将随着4K电视的普及将引领电视转型升级。

家庭影院—4K+5.1

从视角和分辨率估算，4K电视机最佳观看距离约为屏幕高度的1.5倍，考虑到有利于眼睛健康，65吋4K电视观看距离为2~3米。

4K超高清电视影院直播—4K+5.1

4K超高清节目具有高分辨率、宽色域、高动态范围等优势，将直播的4K超高清电视节目投放到影院中进行实时播放，将广播电视内容的时效性、多样性与电影播放环境的专业性、高品质有效结合，将为观众带来更加有冲击力的视听新体验。

在8K技术上的研究进展

按照国家超高清行动计划和科技冬奥的要求，总台积极推进8K技术研究和技术系统建设。

自2018年以来，总台已启动8K测试序列的拍摄工作，部分8K序列将在今年的BIRTV展会上展出。

今年年初，总台录制了8K版2019年春晚节目。为推进总台8K制播技术研究，现已发出了2套8K讯道拍摄设备、10套8K ENG、1套10通道8K收录服务器、10套后期编辑工作站的采购标书。

以2022年北京冬奥8K制播为目标，目前已启动8K拍摄、转播、编辑、渲染、直播、点播、编解码、传输、接入、呈现全链路的研究，并加大推进8K电视制作工艺的研究和相关标准的制定工作。

两天前，总台联合产学研机构申报的科技冬奥项目完成了专家评审，正在等待最后的批准。

5G

总台联合营运商和华为建立5G媒体应用实验室，立足5G技术特点，面向媒体制播域，构建5G+4K/8K制播应用模式；面向用户服务域，构建5G全媒体传播模式，从而形成5G媒体产业应用。主要包括以下几方面工作：

1、总台与三大运营商及华为公司签署协议共同推进4K+5G发展

2018年12月28日，中央广播电视总台、中国电信、中国移动、中国联通、华为公司共同签署《合作建设5G新媒体平台框架协议》。

五方决定在总台联合建设“5G媒体应用实验室”，共同推动5G+4K/8K媒体应用研究。

2、总台与三大运营商及华为公司开展5G+4K/VR传输测试

2019年1月13日，总台春晚深圳分会场4K超高清5G传输测试。

2019年1月28日，总台春晚长春分会场5G网络VR实时制作传输。

3、总台与三大运营商及华为公司开展5G+8K传输测试

2019年6月26~27日，在2019世界移动大会•上海（MWC2019）上，中央广播电视总台联合中国移动、中国联通和华为公司、中国超高清产业联盟和北京数码视讯公司，开展了5G+8K远程传输测试，成为上海移动大会的一大热点，对8K电视图像的评价有以下16个字：栩栩如生、纤毫毕现，赫赫之光，姹紫嫣红。

4、移动优先——5G+4K/VR集成制作

5、移动优先——5G网络环境下的大屏小屏融合呈现

6、5G4K背包

总台联合华为公司开发5G4K背包。

7、移动优先——打造超级移动客户端

移动新媒体具有移动性、便捷性、社交性等特点，已成为人们获取信息的主要渠道，具有强大的生命力。微信公众号、新浪微博、今日头条等新媒体病毒式传播，对传统电视媒体产生了极大的冲击力。

CCTV-4K频道自去年“十一”开播以来，市场上的4K电视机销量剧增，反映出广大受众对高清和超高清电视充满期待。

从5G媒体应用实验室的研究表明，通过移动客户端，可采用投屏的方式，从手机小屏便捷地切换到电视大屏，流畅地收看4K超高清电视节目，还可采用AI技术为用户提供个性化推荐服务，大幅度提升用户收看电视的体验。

总台积累了海量的电视节目库，并具备强大的电视及新媒体生产能力。目前要打造用户喜爱、以视频为主的超级移动客户端---“央视频”App。

AI

密切跟踪国际国内人工智能的发展，借助于语音识别、图像识别、语义识别，创新媒体制作、传播、分发流程，大幅度提升媒体生产力和传播力。

人工智能+媒体

新媒体新特征：病毒式传播，简洁化的风格，基于手机移动传播。

人工智能赋能媒体生产：创新媒体形态和生产模式，重构生产流程，大幅度提升媒体生产能力和水平。

人工智能提升用户体验：信息云端预处理，信息精准传播；终端极简，用户使用便捷；永远在线；用户每一次使用都在调试……

人工智能+媒体：将构建人机交融媒体传播新形态，也就是智慧媒体。

智慧媒体——人工智能在媒体中的应用

智能语音：自动识别语音内容，目前主要识别各种语言并形成文稿。

智能主播：用虚拟主持人进行视频播报。

智能标签：根据媒体题材、场景、人物等信息，对视音频媒体进行标注。

智能审核：利用图像、语音、文字识别技术，辅助内容审核。

智能搜索：通过搜索引擎，进行素材快速检索和提取；通过网络媒体的大数据，为节目创作提供新闻线索。

智能编辑：根据视频和音频，进行拆条和剪辑。

智能写稿：在体育、财经等特定的业务领域，根据算法在第一时间自动生成稿件。

智能广告：依托于大数据和人工智能，让广告投放更加精准。

智能推荐：利用用户行为大数据和节目评价大数据进行个性化智能推荐。

智能转码：为满足用户流畅收看，根据用户所处网络环境自动调整媒体播放码率。

人工智能案例

《经典咏流传》第二季采用智能主播技术，仿真撒贝宁；

《2019年春晚》采用智能语音转写技术进行春晚小品字幕制作，效率提高了10倍；

《创新中国》采用智能语音技术，模拟已故配音演员李易老师的声音；

CBA赛事采用图像识别、文字识别、实时数据分析技术，通过编辑引擎制作个人进球集锦、5佳球等短视频内容，在CCTV-5移动客户端与赛事转播同步呈现。

智能主播

智能语音文稿唱词系统

总台联合科大讯飞研发的智能语音文稿唱词系统，采用人工智能语音识别技术与分布式视音频编解码技术相结合，提供超实时、多格式视音频语音转写服务。

这是极具创新性的人机耦合的字幕生产工艺流程，改变了几十年来拍唱词的传统工作。它的流程生产效率是传统字幕制作的3倍，大幅度降低了劳动强度。

2019年央视春晚语言类节目就应用了这种系统。

目前该系统已申请发明专利5项：《实现电视节目字幕和语音内容自动匹配的方法》《一种对语音进行词语标注并实现字幕时码自动调整的方法》《一种实现电视节目字幕自动化生产的非编系统》《基于广电行业视频字幕自动断句的方法》《一种基于声纹识别实现电视节目角色区分和自动剪辑的方法》

智能推荐---主流媒体的有导向个性化推荐

基本情况：2016年6月，央视在有线HD/4K互动电视的免费平台。

基本架构：央视在各省有线电视网建设边缘节点，并租用中国有线多业务综合传输平台实现专区管理。

以“央视专区”为平台，开展主流媒体的有导向个性化推荐服务，通过建立节目导向与用户喜好之间的关系，向每个用户推荐既符合内容导向又符合个性化的节目。

▍做好新中国成立70周年的宣传报道工作

6月3日，国务院新闻办公室发布了庆祝中华人民共和国成立70周年活动标识。

为做好庆祝新中国成立70周年的宣传报道工作，总台将投入3辆4K转播车和1套4KEFP进行现场转播，通过台内4K演播室进行包装制作，在CCTV-4K、CCTV-1/13等高清电视频道直播。

与此同时，总台还计划将4K超高清电视信号接入全国70家电影院直播，将设置约10个8K电视机位录制庆祝活动素材。

在“十一”前夕，总台将推出超级移动客户端——“央视频”App，通过“央视频”这个超级客户端和各频道垂直客户端，总台将对庆祝活动进行全方位、多角度宣传报道。

编辑：吴悠

刘海明 · 发表于 2019-8-22 22:45:51

【谈天说地】【人工智能】人民网董事长叶蓁蓁：内容科技或将催生新的社会化大分工

原文来源：全媒派

原文链接：https://mp.weixin.qq.com/s/UMKA1n8iLqYRmgMw1suLTw

传媒业的发展向来与技术更迭息息相关。人工智能崛起，5G时代已来，内容产业将如何与各行各业深度融合？当万物互联，一切皆媒，新时代媒体改革的浪潮又将去向何方？

近日，在“中国人工智能峰会”暨“多媒体信息识别技术竞赛成果发布会”上，人民网党委书记、董事长、总裁叶蓁蓁指出，内容科技将加速内容产业业态重构，催生新的社会化大分工。

本期摘编叶蓁蓁演讲全文，深入解读内容科技的具体指向与巨大潜力，与你一同瞭望传媒业的未来。

万物皆媒时代的战略创新

突破内容科技，重塑产业格局

在一定意义上，传媒行业和金融行业十分相似：信用是它们共同的生命。两个行业都依赖于有信用的价值传递：传媒行业以信息作为价值的载体，信用是信息真实性和权威性的保证；金融行业以货币作为价值的载体，信用是货币作为价值尺度和支付手段的保证。

在新一轮信息革命中，这两个行业都受到技术的冲击：电子支付已经逐渐取代纸质货币，成为我们主要的支付手段；信息传播的主要方式也从传统的纸质媒介转变为移动互联网。因此，业务重构势在必行。正如同金融行业有热火朝天的“金融科技”，内容产业同样需要突破“内容科技”。

今年1月25日，习近平总书记主持中央政治局集体学习时深刻指出，从全球范围看，媒体智能化进入快速发展的阶段，我们要增强紧迫感和使命感，推动关键核心技术自主创新，不断实现突破，探索将人工智能运用在信息采集、生产、分发、接收、反馈中。

6月6日，5G牌照的发放标志着中国正式进入万物互联的5G时代，万物都将成为互联网的入口。从内容产业的角度来看，万物也将成为内容的载体，即万物皆媒。万物互联、万物皆媒，内容产业将发生根本性变化，过去内容产业是“直立”的，或者用流行的说法叫“垂直”，它与其他行业是并列关系。

但进入万物互联、万物皆媒的5G时代，内容产业将变为“平躺”的，横向打通各行各业、深度融入各行各业之中，激发全新业态，重塑产业格局。我们理解，这也正是习近平总书记所提出的媒体将变成“全程媒体、全息媒体、全员媒体、全效媒体”，传媒行业将和各行各业深度融合。

在此背景下，人工智能技术将会加速内容产业新的社会化大分工，催生出一个个新的价值链的“环”。内容产业可以根据生产、传播、变现等不同环节，来进行重新划分，如内容原创、内容二度加工、内容运营、内容风控、内容聚合、内容分发等。

关于内容科技，我抛砖引玉，做一个不成熟的定义供各位专家批评指正。“内容科技”主要是指对内容产品的供给与消费链条、内容产业的组织与分工模式产生重大影响的人工智能、大数据、区块链、云计算、物联网等各种新兴技术，以及由这些技术所催生的新业态、新应用、新服务。

人民网内容科技三大布局

精准定位万亿量级市场

人民网内容科技的概念分为三个层次：基础层、平台层和应用层。

基础层

在基础层，我们已经成立了人民网人工智能研究院，今天下午举办的“人工智能产业发展论坛”上，将会向首批人工智能研究院的专家发出聘书。同时，我们正在申请设立“媒体智能认知国家重点实验室”。研究院与实验室将共同打造人民网内容科技的基础层。

平台层

在平台层，我们于上月发布“游戏适龄提示”平台，将网络游戏划分为6岁以上、12岁以上、16岁以上和18岁以上等四个层级，腾讯、网易、盛大等8个国内网络游戏的头部企业已加入该平台，21款流行的网络游戏已开始发布适龄提示。目前由于积累的数据和经验相对不足，“游戏适龄提示”平台多数工作目前依靠人工实现，我们希望有更多游戏公司和从事相关研究的人工智能企业参与其中，尽快将其转变为智能化、自动化的技术平台。

另一个是“风控大脑”平台，我们与中科院自动化所成立人民中科智能技术公司，给予核心科学家股权激励，推动研发互联网内容风控大脑，帮助互联网企业有效把控内容政治方向、舆论导向和价值取向，避免出现重大差错，防范企业潜在风险。

应用层

在应用层，我们将内容业务划分为四个部分。

第一是内容原创。尽管媒体行业现在已经可以实现机器人写稿、虚拟主播等技术，但我认为短期内机器人不太可能完全取代人类从事深度报道、政策解读、新闻评论等内容的创作。在很长一段时间，“人机融合”可能是内容创作领域的主流。

第二是内容风控。我们和一些互联网公司合作，凭借人民网过硬的内容把关能力和风控体系，帮助他们有效地把控风险。目前已经承接苹果、腾讯视频、咪咕等15家互联网头部企业内容风控的任务。内容风控并不是人民网独家所有，如Facebook在全球拥有15000人的内容审核团队，今日头条的内容审核团队也超过10000人。

我们预测内容风控将是一项新兴产业，未来3到5年中国可能会有百万人从事该产业，创造产值3000到5000亿元人民币。前面提及的风控大脑，也将是对全行业开放使用的人工智能平台。

第三是内容聚合与分发。目前绝大多数内容聚合分发平台采用“家乐福模式”“沃尔玛模式”，所有品牌厂商把商品聚集在大型超市，由大型超市统一售卖和收银，如微信公众号和今日头条，就是这样的模式。但是，人民网希望打造全新的“内容批发市场”模式，来自不同源头的内容在批发市场进行集合、交换、交易，我们负责风控、分类和分级，确保由批发市场分发的内容安全可靠、有趣有用。

内容聚发领域是一个庞大的市场，今日头条2018年产值就超过500亿，今年有可能突破1000亿。人民网的“批发市场模式”内容聚合分发平台1.0版本将于今年9月10日正式上线。

最后是内容运营，即把我们在内容方面的策划、创意、制作、分发、运营能力，输送给政府机关、企事业单位和合作伙伴，帮其运营网站、客户端及各类账号平台，做好与群众、用户之间的互动。目前已有近百个部委、地方、企业的官方网站或社交媒体账号由我们代理运营。

内容原创、风控、聚发和运营，都需要内容科技来进行再造和升级，这无疑是万亿量级的市场，其政治价值更加不可估量。

编辑：吴悠

刘海明 · 发表于 2019-8-22 23:12:09

【谈天说地】【人工智能】北大博雅讲坛第197期实录 | 何渊：大数据黑洞——我们正在坠入的深渊 | DataLaws

原文来源：数据法盟今天

原文链接：https://mp.weixin.qq.com/s/BhPpCdRJOzgz_rUn4SUsFA

互联网时代，数据和我们每一个人的生活都息息相关。可以说，你每一天都在和数据打交道。但是，数据安全呢？对于企业而言，有时候，数据问题甚至已成为攸关企业生死的事情。

8月16日下午，第197期北大博雅讲坛“大数据黑洞：我们正在坠入的深渊”在上海志达书店举行。本次博雅讲坛由北京大学出版社、北大博雅讲坛、上海悦悦图书有限公司主办。

围绕大数据在应用过程中出现的多种风险，大数据的发展到底给我们的个人、社会和国家带来了什么影响，上海交通大学凯原法学院副教授、天册律师事务所资深顾问何渊为观众朋友作了一场既有深度又有趣味的精彩演讲。

“人工智能”与“大数据”是近几年非常热门的概念，按照何老师的说法，“人工智能”等于“大数据”+“算法”。目前，我们遇到的人工智能方面的问题，都可以从大数据的处理和算法两个角度来讨论。算法主要涉及伦理问题，而大数据则主要涉及隐私和安全问题。

随着科技的发展，尤其是4G、5G技术的出现与应用的推广，高效、大量处理数据成为可能。原先不存在价值或者说价值不大的单个数据不断聚集，在数据处理能力不断提升的今天，这些成规模的大数据也就具有成为财富的潜质。马云就曾公开说，阿里巴巴最有价值的不是淘宝，不是支付宝，而是平台上的大量数据。

对于数据应用的法律风险，何老师着重从五个方面进行了分享：

一是数据泄露。按照中国消费者协会2018年的调查报告，85.2%的人遇到过信息泄露情况。央视曾在一档节目中说，通过一个手机号就能把个人的身份信息、财产状况查个遍，包括户籍、资产、开房记录、打车记录、通话记录、实时位置信息等。央视“3·15”晚会还曝光过，一些公司已通过机器人拨打骚扰电话。某家公司的机器人在一年多的时间就拨打出去40亿次骚扰电话。另外，2018年发生的华住酒店集团5亿条用户数据泄露、12306网站470余万条用户数据泄露事件，都在提醒我们，没有谁是安全的。

数据泄露通常与数据黑产问题有关，如《大数据战争》一书提到的数据堂涉数据黑产交易案件，最后公司相关涉案人员被法院处以一年六个月到三年不等的刑期，并处罚金。另外，巧达科技案、瑞智华胜案都涉及非法窃取数据问题，尤其是后者，所涉数据量高达30亿条，两起案件都仍在进一步处理中，后续会公布相关的惩处结果。

数据泄露问题在国外也时时发生。比如，英国航空公司就曾因50万客户数据泄露被处罚1.83亿英镑；万豪酒店数据泄露案导致其全球超5亿客户受影响，被英国信息专员办公室（ICO）处以1.24亿美元的罚款；Facebook数据泄露事件使多达8700万用户受影响，被美国联邦贸易委员会（FTC）罚款50亿美元。

二是隐私保护。2018年支付宝分享年度账单事件、百度浏览器APP偷窥隐私遭江苏省消保委提起公益诉讼事件说明，在日常生活中我们的隐私随时都有可能被侵犯。关于隐私问题，《大数据战争》一书讲了两个案件，其一是中国被遗忘权第一案——任甲玉诉百度案。此案提出了一个问题，即我们能否要求互联网平台删除我们不希望被他人知道的过往信息。按照法院的说法，中国法律中并没有规定“被遗忘权”这种权利类型，要保护此类权利，必须证明利益是正当的，且保护是必要的。其二是cookie隐私第一案——朱烨诉百度案。此案提出的问题是，我们能否阻止互联网公司搜集我们的信息用于其广告推广等经营事项。二审法院认为，百度进行了匿名化处理，相关信息不能识别个人，而只能识别到电脑，且其已经尽到显著提醒说明的义务，因而判朱烨败诉。

另外，最近还发生了手机通讯录第一案——今日头条被指侵犯隐私案、数据关系链第一案——腾讯微视被诉滥用用户微信及好友信息案，案件都还在审理过程中。

何老师认为，个人数据权至少包括两个方面：其一是数据人格权，包括知情同意权，数据修改、删除权，数据被遗忘权等；其二是数据财产权，包括数据采集权、数据可携权、数据使用权和数据收益权等。

三是伦理问题。媒体曾报道，某宝上的某些商家，真假货掺在一起卖。如果你的购物数据中很少给中评、差评，很少退货，那么你收到假货的可能性就会增大。另外，一些航空公司、酒店代理商、电商平台会根据你以往的消费数据给你进行数据画像，然后提供一个你可以接受的价格，所谓同房不同价。这就涉及价格歧视问题。

之前有一款AI“杀人机器人”产品，其对目标的打击准确率几乎达到百分之百。这个技术如果被恐怖分子所掌握，其后果不堪设想。所以，我们应遵循“阿西莫夫伦理三法则”，其中第一法则即是机器人不得伤害人类。

四是数据竞争。因数据竞争问题，现实中一些企业已经发生过争端。比如大众点评网诉百度案、新浪微博诉脉脉案、腾讯与华为因微信用户的数据之争、顺丰菜鸟的数据之争等。《大数据战争》中详细分析了大众点评网诉百度案、新浪微博诉脉脉案。前者确立了爬虫规则，即你可以利用爬虫去爬取他人的数据，但你不能用爬取来的数据干与他人相同的事情，也就是不能与他人形成直接竞争；后者则确立了合法收集、使用个人信息数据方面的“三重授权原则”，即“用户授权”+“平台授权”+“用户授权”，其中第一个“用户授权”是用户同意平台（新浪微博）使用其数据，第二个“用户授权”是用户同意平台将其数据交给第三方（脉脉）使用。

今年，腾讯系的微信、QQ与头条系的抖音、多闪因数据关系链问题也产生了争议，即所谓“头腾大战”。在这起案件中，腾讯认为，抖音擅自将腾讯通过开放平台提供给抖音的账号授权登录服务、来源于开放平台的微信/QQ头像和昵称转而提供给未获得腾讯授权的多闪，而多闪与微信存在竞争关系。受理法院已向抖音、多闪发出诉前禁令。目前案件仍在审理当中。有关案件的详细分析可以看看《大数据战争》一书。

五是国家能力。据称，2017年全世界出现的500多家“独角兽”公司中，有300多家是百度、阿里、腾讯、谷歌、微软、苹果、亚马逊、Facebook八家公司投资的。在中国，腾讯和阿里则几乎投资了所有的“独角兽”公司。当一个企业过于庞大，拥有太多数据的时候，是存在比较大的风险的，且会影响到国家数据能力。可以说，国家数据能力是未来国家不可或缺的治理能力。在数据自由流动过程中，国家必须认真面对国家数据能力、数据垄断等棘手问题，着力避免出现互联网公司的数据技术能力替代国家的认证能力等窘迫状况。这就要求国家要加强对互联网公司的监管，但也不能破坏数据产业的发展，即要做到“数据流通和数据权利保护的平衡”。

针对上述风险，何老师指出，我们国家也在采取措施积极应对。比如，全国人大常委会已经在着手制定《个人信息保护法》《数据安全法》，国家网信办也在制定数据安全方面的规章。现有的法律规范中，《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》对“非法提供”和“非法获取”公民个人信息入刑情况作出了规定，《网络安全法》对窃取或以其他非法方式获取、非法出售或非法向他人提供个人信息作出了处罚规定，但总体来说，我国缺乏像美国FTC一样的机构，而且相关处罚额度太小，对于数据泄露方面的违法犯罪打击力度有限。

编辑：吴悠

刘海明 · 发表于 2019-8-23 16:58:08

【案例】PPT讲解机器人产业发展现状与未来展望，重磅资料

原文作者：王喜文

原文来源：直观学机械

原文链接：https://mp.weixin.qq.com/s/MiZZdpBW4JCOfQ_QdZK9sA

前段时间分享过王喜文博士做的关于《5G》的PPT，大家反映做的很棒，最近王喜文博士在机械工业出版社又出了一本新书：智能+：《新一代人工智能发展规划》解读，ISBN：978-7-111-63008-1，今天再分享一篇王喜文博士关于讲解机器人产业的PPT，十分有价值。

编辑：吴悠

刘海明 · 发表于 2019-8-23 18:02:04

【案例】人工智能排在第一位的伦理规则

原文来源：博古睿研究院

原文作者：何怀宏

原文链接：https://mp.weixin.qq.com/s/XjgmkKaVA7G0UkCwILyyiA

今天面对人工智能和基因工程等领域的迅猛发展，一些国家，乃至一些大公司都出台了一些一般的伦理规则，这些规则看起来都不错，但多是美丽的大词，细究起来内容也相差不多。这些概括性的原则语汇自然是有必要的，但可能还需要深入具体，对一些专门智能机器的功能和使用制定比较具体的适用规则，包括明确一些准入或禁入门槛。这样也能从具体规则出发来更好地概括出一般规则，帮助我们区分它们的轻重缓急乃至排列次序。

在对人工智能的各种公示的伦理规则中，我认为比起诸如公平、隐私、透明、共享、反歧视等伦理规则，“安全可靠”是第一位的，因为它直接涉及保存生命。

2017年6月，德国公布了全球第一个针对无人驾驶汽车的道德规则。哪怕它还不完善，很可能还需要修订，但这种预先防范的努力是值得赞许的。这些规则包括：保护生命优先于其他任何功利主义的考量，道路安全优先于出行便利，必须遵守已经明确的道路法规。无人驾驶系统要永远保证比人类驾驶员造成的事故少。人类生命的安全必须始终优先于对动物或财产的保护。为了辨明事故承担责任方，无人驾驶车辆必须配置始终记录和存储行车数据的“黑匣子”。不得对必须在两个人的生命之间做出选择的极端情况进行标准化设定或编程。法律责任和审判制度必须对责任主体从传统的驾驶员扩大到技术系统的制造商和设计者等这一变化做出有效调整。当发生不可避免的事故时，任何基于年龄、性别、种族、身体属性或任何其他区别因素的歧视判断都是不允许的。虽然车辆在紧急情况下可能会自动做出反应，但人类应该在更多道德模棱两可的事件中重新获得车辆的控制权等等。

当然，这一法规中的规则仍然是一些比较一般的原则规范，但它们强调了保障人的生命安全高于一切——高于功利、高于便利、高于财产、高于动物的生命。尽管这一法规肯定还需要在某些方面细化，也需要不断结合道德原则和现实进展情况进行重新审视、补充和修改，但它的确提供了一个宝贵的可供讨论的样本。

我们不要忘记，我们是在为一个比我们得到的信息更多、计算更快、动作更灵敏的机器设计规则乃至引入人类的价值观。它们在某些方面比我们更能干，但总体上并不比我们更智能。它们是专门化的工具，只用于汽车驾驶，可以确信不会发展为总体上超越人类智能和综合性的自我意识的超级智能机器。我们对它们的规则设计可以奏效，它们没有滥用或颠覆这些基本规则和价值的危险。但如果我们面对的是一种可能发展为具有全面功能，包括控制和指挥其他智能机器，乃至最后控制人的超级智能机器，我想我们大概是不能将有可能促进其产生自我意识的因素输入给它的。我们在这方面要慎之又慎，宁愿让机器在这方面“傻”一点。

同样是聚焦生命安全问题，现在我想提出另一个可供分析和讨论的个案：即直接涉及对暴力和强制手段的反应和使用，但目的是保障人的生命安全的智能机器。也就是说，为了一个良好的目的，为了一个保障人的生命安全的目的，是否可以生产具有暴力和强制功能的机器人，比如机器战警、机器保镖和有暴力功能的机器保姆？我们要不要这样的有力帮手？如果说不能要，是出于什么样的理由？人自己不是也在大量使用暴力和强制吗？为什么不能接受机器为了保护人而使用暴力和强制？

有关行使暴力的智能机器，据说已经有数十个国家正在秘密研制战争中可以使用的暴力机器，有些甚至可能已经成功了。但这个问题我们暂且不谈，这是一个涉及国际关系的悲哀话题。我们现在还是先集中讨论可能在一个国家内部使用的、包括可能民用的，具有暴力或强制功能的智能机器。

第一种是机器警察。

不是那些功能很有限、纯属防御性且其行动是由人直接指挥而非自主的智能机器人（比如能够排除定时炸弹的机器人），而是一种“机器战警”，即和人类警察一样，配有各种武器，甚至还有自己更独特、更强大的武器或火力的“机器警察”。这样的警察看起来不是很好吗？能力超人、钢筋铁骨、不怕损失、没有私心、能够高效地执行除暴安良的任务，这不正是人们梦想的“完美警察”吗？

第二种是可供个人使用的、具有暴力和强制功能的机器保镖。

它不掌握在政府手里，而是掌握在个人手里，为个人服务。这样的“机器保镖”就比较容易被我们否定了：如果一个想作恶的人获得了这样的机器，不是非常可怕吗？的确如此。而这样一个否定的理由也可以在某种程度上用于上述“机器战警”，因为政府中的一些个人、机构，有时甚至是整个政权机器，也可能滥用或误用这种智能机器。但无论如何，我们是有更强有力的理由排除“机器保镖”的生产销售的，因为善意的用户有了它们固然可以增加自己的安全保障，但恶意的用户杀人越货也就有强大的帮手了。

第三种情况更复杂一些：“机器保姆”。

机器保姆可以用来照顾老人、病人和孩子，未来必将是一个广大的应用领域。但是否能让它们具有暴力和强制的功能呢？使用这些机器的人一般都是弱者，假设有歹徒入室侵犯用户，要不要让机器保姆能同样使用暴力制服暴徒？或者稍温和一些，让机器保姆具有一种强制功能，在判断某些老人或孩子的行为将对其生命健康造成严重伤害时，采取某些强制性的措施，比如关闭房门或限制行动，让人暂时成为“机器的囚徒”？

日本本田公司研发的ASIMO机器人

的确，在一些具体的情况下，如果机器具有这样的功能，在一时一事中大概是能够有效发挥作用的。但是如果让这成为普遍功能，这些功能同样有可能被机器和掌握机器的人误用甚至滥用，从全面和长远计，可能还是没有这种功能更好。尤其是当作为中枢的智能机器一旦突破人的控制，变得比人更聪明并具有自我意识时，它就可能独立判断，使用和指挥众多暴力机器达到自己的目的。

所以，人类不去发展具有暴力功能的自主智能机器，这是一种“防患于未然”。因为它们和人类已经发展出来的其他战争工具和杀人武器不一样，那些武器（比如核武器）还是处在人类直接指挥和控制之下的，智能杀人机器却具有一种自我学习能力，具有某种程度的自主性，它还可能具有完全的自主性。我们禁止它们可能会因此失去某些具体情况下强大的安全保障，但因此获得的一般情况下的安全系数却会更大。

当然，这并不是说人工智能机器不能在保障安全方面帮助我们。去掉机器的暴力攻击和强制功能，它们还是可以成为保护人类安全的重要工具。比如一个不具有暴力和强制功能的“机器保姆”，无疑还是可以被设计成具备监测和报警功能的，这样也可以威慑犯罪者和保护用户。但我们如果在这方面放开或放任暴力功能，就很可能会遇到难以测知的重大后果。

由此我想转入讨论高科技时代对现代伦理提出的一种新的重大挑战，即它所带来的“不可预测的严重后果”。那就是：我们做的许多事情看起来是好的，是探索物质世界、增长人类知识，甚至是试图造福人类的，但是由于技术达到了如此高端的程度，它的结果却常常是我们无法预知的。一些严重的恶果将可能和好的结果偕行，乃至超过好的结果，还有些实验甚至可能打开“潘多拉的盒子”。

比如，未来可能会有计算速度极快、掌握数据极多的量子计算机出现，它将可以解决许多计算难题，也能破解世上所有的加密方式。那么，假如第一台这样的计算机掌握在不怀好意或过于贪求自己利益的机构或国家手里，就可能造成金融动荡以及社会和政治危机。

又如合成生物将制造出许多新的便利科技产品和治疗疾病的良药，但合成生物也有可能带来生物武器和难以控制的入侵物种等巨大的危险。再如基因工程、克隆技术，它们有可能增强人的各种能力、延长人的寿命，但也有可能带来基因编辑婴儿和克隆人的危险。还有一些高科技的发展可能带来大规模的安防监控，将可能侵犯人们的隐私，使边沁所设想的全景监视不仅用于监狱，也用于整个社会。还有能够制造出几乎可乱真的虚假音频和视频——深度造假（DeepFake）——的技术，可能摧毁好人的声誉、影响到司法证据等等，不一而足。

使用DeepFake进行“换脸”。（图片来自 CBC）

有科学家说，人工智能等高科技的发展目前都还在可控范围之内，就公开显示的信息而言，我基本同意。还有科学家认为，现在的人们可能高估了人工智能的发展速度，未来的二三十年都不会有发展出超级智能机器的可能或者出现大的危机。这也很好，我甚至希望这个时间能再延长到五六十年、上百年。但是，文明不仅要考虑十年大计、百年大计，还有千年大计。考虑到这几十年科技的飞速增长，以及各种意外发现的可能，以及下面将要谈到的人类现代文明的一个基本矛盾，人类就不能不尽早地未雨绸缪。

相对于其他动物来说，人的优势就在于：人有意识，从而能够有预期和计划地行动。在高科技时代之前，人虽然不能完全预测其行为的结果，但大致能够预测这结果的方向或性质。然而，进入到今天这样一个迅猛发展、不断变化的高科技时代，人们行动的后果不再像以前那样容易预测了，负面的后果可能比正面的成果更难于预测。而这后果一旦发生，有时相当严重，有时甚至是不可逆转的。

因为这些不可预知的后果的紧迫和重大，我们也许就需要一种预防性的伦理和法律，也就是说，为了防患未然起见，我们还要考虑如何对人们行为事先的动机和欲望有所限制，而不仅仅是在行为过程之中进行防范和在行为结果之后给予惩罚。

这样，面对“不可预知的严重后果”，现代伦理的两大流派——道义论和目的论——就都有一个在行为的过程和结果出现之前就预先防范的任务。道义论不能满足于只是在行为规范和过程的正当性上严防死守，也要考虑对行为动机进行有效地遏制；目的论也不能满足于只是抱有良好的目的并进行后果的评价，还要审视自身的目的动机，并谨防使用不当的手段来达到目的。

从人类整体进入到了一个高科技的时代来看，我认为似乎可以将目前人类文明的一个基本的、持久起作用的矛盾概括为人类不断快速增长的控物能力与自控能力的日益不相称。控物能力是指人向外用力，对外物有办法，表现为科技和经济；自控能力是指人向内有力，对自己有办法，表现为精神和道德。科技的发展目前看不到什么限度，或者说还有非常广阔的空间和提升的可能，但是道德的发展却会遇到人性的瓶颈，即人不可能成为天使。这并不是说现在的人比以前堕落、道德严重滑坡，而是只要人的道德自控能力不可能普遍提升到一个很高的程度，那么他所掌握的控物能力越大就越危险。人希望达到全能，但却永远达不到全善。人的这两种能力的不相称是一个根本的、近代以来始终存在，日后还很有可能加重的矛盾。而造成这一基本矛盾的原因，一方面是人对物质和身体的各种欲望在近代以来一直得到不断强化，平等释放了各种欲望，而物质的欲望渐渐成为主流，好新骛奇还在不断开发和刺激新的欲望；另一方面则是人类精神的注意力也转向了物质，本来可以驯化和节制欲望的各种制度和精神文化因素在不断弱化。

我们对现代伦理所期望的也许还有更多，即希望正当与好、规范与价值、道德与信仰能有一种比此前更紧密的结合，从而不仅让精神能够对道德的规则予以一种更强有力的支持，而且能帮助人们更注意生命的丰富和建立一种不那么物化的幸福观。

编辑：吴悠

刘海明 · 发表于 2019-8-23 19:24:27

【案例】Facebook推出隐私管理工具，让用户避开目标广告

原文来源：半导体投资联盟

原文链接：https://baijiahao.baidu.com/s?id=1642459400711691411&wfr=spider&for=pc&isFailFlag=1

芯科技消息（文／Allis），根据《Financial Times》报道，Facebook终于推出众人期盼已久的隐私工具，让用户自行决定是否要接受在社交网站上看到投放广告。该公司会首先在爱尔兰、韩国、西班牙推出这款名为Off-Facebook Activity的工具，并在接下来几个月在全球各地陆续推出。

通过这项工具，Facebook及Instagram的用户将可以看到Facebook和第三方网站以及应用程序分享了哪些关于用户的个人资料以投放目标广告，并自由选择是否要限制分享的数据内容。《Financial Times》指出，主要数据包含用户将哪些产品加入购物车、购买了哪些物品等等。

不过，新工具不会对Facebook收集用户数据的能力产生任何影响。就算用户选择不要分享，Facebook也不会彻底将这些数据从公司服务器当中移除，且会继续收集讯息，进行分析后，抹掉任何可以识别出用户的资料，再提供给第三方业者。

传立媒体（Mindshare）全球创新负责人Jim Cridlin表示，在经历过一连串的隐私问题后，Facebook必须要展现出积极性，以赢回消费者的信任。但他认为即使推出了这项工具，Facebook还是有很大的能力可以通过该公司收集的数据投放广告。

《Financial Times》指出，Facebook目前提供一款免费商业工具Facebook Pixel让第三方合作网站及应用程序使用，只要通过Pixel收集各个网站上的数据，Facebook就能追踪用户在网络上的纪录，了解用户购物习惯，并用于未来的广告投放。

Facebook产品经理Stephanie Max表示，这项工具将为用户提供更多的透明度以及控制权，不过，由于这些数据在提供个人化的内容上可以起到很大的帮助，她们认为Facebook的广告投放将受到影响。

编辑：吴悠

刘海明 · 发表于 2019-8-27 21:20:36

【案例】

从图灵机、图灵测试到人工智能：什么决定了AI能否取代人类？

导读：美国电视剧《西部世界》第二季的第一集一经播出就引起热议。一时间，人和人工智能这个话题又重新被辩论。由于程序功能越来越强大，人们开始担心：“人工智能程序会不会全面取代人类？”

人工智能是否会取代人类这个问题，实际上涉及对于认知的无穷边界的考量：图灵机能表达的带有人工智能模型的可计算数（程序）无穷大，人的思考过程也无穷大，哪个无穷大更大？

01 图灵机和可计算数

图灵的论文《可计算数及其在可判定性问题上的应用》(《On Computable Numbers，with an Application to the Entscheidungsproblem》）发表于1936年，在这篇论文中，他构造了一个图灵机来计算可计算数，证明希尔伯特提出的通用可判定性方法不存在。

图灵机的具体构造可以参考图灵的论文，这篇论文阅读起来非常晦涩。但如果要理解他的构思或者灵感，那么阅读他的论文是最直接的方式。图灵不是我们同时代的人，要推测图灵的构造灵感非常困难，但是读者可以像作者这样通过阅读到的文字和听到的故事去隔空对话这位伟人，推敲他的灵感来源。

电影《模仿游戏》详细地介绍了他的生平，据历史学家估计，图灵因为破解德国的恩尼格玛密码机（Enigma Machine）而拯救了1400万英国人。在破解恩尼格玛密码机的时候，图灵沉浸在密码学之中。

▲《模仿游戏》中破解密码机的图灵

密码学就是将一组数字按照某种规则让机器变成另外一组数字。接收方可以根据一个反向规则让机器将其变成原文。举个简单的例子，10多年前为了让我的信件不被家长偷看，我曾构造过一个简单的加密方法：把所有的英文字符换成英文字符表的下一个字符，接收者把每个英文字符换成字符表的前一个字符即可以重构原文。

举一个更加复杂的例子，计算机科学一般用两位数字01，02，…26来表示英文字母A，B，…Z，用00表示空格。这样，一个关于聚会的时间和地点的文字消息就可以转化为一串数字。接收者收到这串数字后，把每两位数字转换成对应的字母，就可以还原出文字消息了。

把一个句子通过一个机器逻辑映射成一个数字非常有意思，例如ICU可以映射成090321。图灵在破解恩尼格玛密码机的时候可能深谙其中的乐趣。

《Cloud Foundry：从数字化战略到实现》一书的第1章曾回顾香农信息论为代表的数字世界的崛起。我们谈到了冯·诺伊曼为何建议香农在他的信息论中采用物理学中熵的概念，但是我们并没有仔细讨论后面的哲学，这里可以再继续深入讨论一下。

物理学家和数学家都隐隐约约感觉到物质和能量背后存在的信息（数字）世界，那么我们能否用数字世界来描述物理世界？香农和奈奎斯特独创了信息论。在他们两位开天辟地的工作成果下，我们可以通过一个机器把图像、音频编码成一组数字。

于是，我们今天可以用二进制编辑器打开任何一台计算机上的图片或者音频，其实它们只是一串0和1编码。这些0和1的字符串对应了一个数的二进制表示，所以它还是一个数。

图灵在从事密码破译工作的时候，有机会去美国的贝尔实验室协调英美两国的合作。他在贝尔实验室遇到了两位大师（可见人生结交高质量的朋友多么重要）。

作者猜测图灵从两位大师制作的编解码机器中大受启发，将他对世界万物都是数的信念往前推进了一步：如果说人的五官能够感受到的世间万物都可以用机器转换成数字来表示，那么人的思考过程是否也能用机器转换成数字来表示？

为帮助读者理解图灵的这个构思，可以用iPhone手机上的Siri语音助手来类比。Siri是一个能思考和分析的程序，如果你用一个二进制编辑器打开它，它也是一个用二进制0和1表示的数。但是Siri对应成iPhone这个机器（本质上就是一个图灵机）上的一个数字后，在机器上的运作就能起到人工智能的效果。

通过这个例子，读者也可以看到数字化是人类前进的一个新方向，相比人类在工程和物理领域的几千年的研究，数字世界的探讨从图灵等人在20世纪40年代开辟这个话题算起，到今天才经历了几十年。

图灵的论文详细介绍了图灵机的构造和定义在图灵机上的可计算数。如果读者觉得论文太难懂，可以参考《图灵的秘密》一书，该书做了非常详细的注解。

图灵用极其简单的抽象机器来模拟一个数学工作者。一个数学工作者脑子里面有个思考状态（上下文），他在纸上扫描到下一个字符的时候脑子里会产生一个状态，然后可能在纸上移动位置写下一个符号，不断重复这个过程。图灵机的构造就是这么简单，图1-12就是图灵机的一个大致描述。

▲图1-12 图灵机的大致表示，来源：维基百科

图灵机在无限长的纸带上移动，每次移动读取一个符号（数字用二进制表示），然后图灵机的内部状态进行改变，并决定图灵机下一个移动的位置。图灵在论文中给出的一个例子是打印一个分数1/3。

这个图灵机很简单：打印1个0往右移动一格，然后再往后移动一格，留出一个空格做可能的符号标记，然后再打印一个1并往右移动一格，之后，图灵机再往右移动一格从而留出一个空格作为可能的符号标记。之后以此类推。以上过程可以用表1-1所示的状态切换表来表示。

表1-1 可计数1/3的图灵机表示：

机器状态(Configuration)		行为（Behavior)
当前状态(m-config)	输出符号(symbol)	操作(Operation)	结束状态(final m-config)
b	无	P0(打印0)， R(往右移动一格)	c
c	无	R(往右移动一格)	k
k	无	P1(打印1), R(往右移动一格)	e
e	无	R	b

写过程序的读者会发现，这有非常经典的汇编程序的味道。机器打印出来的纸带如图1-13所示（早期的软件工程师应该有使用穿孔纸带的经历）。

▲图1-13 可计算数1/3的图灵机纸

把这个纸带标记为小数点后的二进制数字（0.010101…），读者可以用级数求和，其结果等价于1/3。

读者可能有两个疑问：

二进制表示对数字计算机的产生有极大帮助，那么图灵是如何突发奇想地想到用二进制来表示图灵机？

图灵为何只讨论0到1之间的实数？这两个问题的确非常重要，因为这涉及我们对人和机器之间的互补和竞争关系的讨论：机器到底是否会取代人？我们在下一节中再展开讨论，这里暂时聚焦在图灵机上。

这个图灵机只做一件事情，就是表示一个可计算数1/3。为了达到举一反三的目的，我们可以把表1-1中的b和k的顺序更换一下，从而创造另外一个计算2/3的图灵机。表格如表1-2所示。

表1-2 可计数2/3的图灵机表示：

机器状态(Configuration)		行为（Behavior)
当前状态(m-config)	输出符号(symbol)	操作(Operation)	结束状态(final m-config)
b	无	P1(打印1)， R(往右移动一格)	c
c	无	R(往右移动一格)	k
k	无	P0(打印0), R(往右移动一格)	e
e	无	R	b

它的纸带如图1-14所示，其中1和0的顺序与数1/3纸带中1和0的顺序正好相反。

▲图1-14 可计算数2/3的图灵机纸带

我们现在了解了图灵机的定义和运行机制，能够用图灵机计算的数叫作可计算数。目前，得到了两个表格表示的不同图灵机，分别用来计算可计算数1/3和2/3。写过程序的人可以把这两个表当作两个程序，以方便理解后面的内容。

如果图灵只是用假想的机器来编码可计算数，那与香农和奈奎斯特的成果没有任何可比性，因为两位大师已经用机器把图像、声音等信号用机器编码成数字。但是图灵往前走了一步，他不仅把数字编码成特定的图灵机，还把特定的图灵机编码成通用的图灵机。

读者可简单地理解为图灵创造了一个通用的机器，在这个机器里面，上面的两个图灵机(可以简单理解成上面的表1-1和表1-2）也可以编码成两个可计算数（程序），这意味着（理论上）通用计算机的诞生。对于数学领域的人而言，世界上已经存在计算机了。

把表1-1表示的计算1/3的程序和表1-2表示的计算2/3的程序输入到这个通用计算机，就会输出对应的纸带：图1-13和图1-14。香农和奈奎斯特的编解码机器也可以在这台通用图灵机上运行。

用今天的事物来类比，就是把微信程序、地图程序、Siri程序输入到iPhone这个通用计算机上执行。普遍被认为具有人工智能的Siri，从这个意义上说只是图灵机上的一个可计算数而已。对图灵的这个通用计算机的构造有兴趣的读者可以阅读他的论文或者有注解的《图灵的秘密》一书。

提出通用计算机以后，图灵就开始为他假想出来的计算机编写程序。图灵当然也关心如何在物理世界创造出一台物理计算机，但是这需要获得大量物理世界的资源、聚集团队和持续执行才能实现。最终，冯·诺依曼实现了这个目标，但作者不认为第一台可存储程序计算机是冯·诺依曼一个人创造的，而应该是他和他的团队一起创造出来的。

数字是数，信号是数，程序也是数，世界万物都是数。自从第一台假想计算机和第一台物理计算机诞生以后，再加上香农和奈奎斯特把物理世界的信号编码成数字，数字技术开始蓬勃发展，进入了大型机、PC机和云计算机时代。

一批数学、物理工作者后来转变成为能编写程序的软件开发人员。从计算机发明到现在短短六七十年，开发人员编写出各种各样的程序，不少程序带有人工智能或机器学习的数学模型，涉及虚拟现实、无人驾驶、人脸识别、语音助理等领域。

由于程序功能越来越强大，人们开始担心：“人工智能程序会不会全面取代人类？”

02 认知边界上的考量

人工智能是否会取代人类这个问题，实际上涉及对于认知的无穷边界的考量：图灵机能表达的带有人工智能模型的可计算数（程序）无穷大，人的思考过程也无穷大，哪个无穷大更大？面对这个问题，大部分人会困惑“两个无穷大的数还能区分大小？”所以，这里有必要重新理解一下数。

数有两个让人最头疼的问题：无穷问题和无理问题。据说知名的数学家、集合论的创始人康托尔（Cantor）就因为沉溺于数的无穷问题而得了躁狂型抑郁症。作者无意将这种痛苦带给读者，但是对于思考AI是否要取代人的读者，这个是绕不过去的坎。

自然数集、有理数集合和无理数集合在有限情况下非常容易理解，但是在无限的情况下很多属性会发生变化。我们看下面两个集合（N为自然数）：

自然数集合A{1，2，3，4，...，N}

偶数集合B{2，4，，...，2N}

在N是个有限的数的情况下，集合A的元素的元素数（叫作基）是集合B的基的两倍。但是，当N无穷大的时候，两个集合的势（无限集合的基）就相等了。为什么呢？从偶数集中拿出一个2，从自然数集合中拿出1，再从偶数集中拿出4，从自然数集中拿出2，如此进行下去，可以用无穷自然数集1对1数的无穷集合叫作“可数”。

一个无穷集合如果是可数的，那么就说它们的基和自然数集A相等。读者可以尝试证明一下无穷有理数集合也是可数的，只要把集合元素顺序的写法写得可数。具体做法就是把分子分母之和等于1，2，3，4的自然数一一列举如下：

有理数集合C{1/1，1/2，2/1，1/3，2/2，3/1…}

读者可能兴致勃勃地把这个可数的数的证明推广到实数集，但是康托尔用对角论证法证明了实数集合是不可数的。康托尔的证明激发了图灵只讨论[0，1]区间的二进制形式的数，而使用二进制对实际计算机的发明产生极大的帮助。

这里简单介绍一下这个证明方法，具体证明方法可以参考维基百科。假设我们数完了所有的[0，1]之间的实数r1，r2，举个象征性的排列例子如下（来自维基百科）：

r1 = 0 . 5 1 0 5 1 1 0 …

r2 = 0 . 4 1 3 2 0 4 3 …

r3 = 0 . 8 2 4 5 0 2 6 …

r4 = 0 . 2 3 3 0 1 2 6 …

r5 = 0 . 4 1 0 7 2 4 6 …

r6 = 0 . 9 9 3 7 8 3 8 …

r7 = 0 . 0 1 0 5 1 3 5 …

我们现在把所有无理数数完了。我们创造一个新的超越数，它的第k位取自上面数字rk的小数点后的第k个位并加1，如果遇到9变成0，所以这个新数就是0.6251346...它和上述的数都不一样，所以它不在这个可数数列表中，可得出实数集是不可数的结论。

这个证明带来另外一个非常有意思的结论：同样是无穷，实数集合的无穷要比自然数集合的无穷更大。如果把自然数集合的势记为aleph-0（康托尔把它叫作超限数），因为康托尔想计算实数集的势，于是他引入了[0，1]区间的二进制形式的数和集合论。他尝试用小数点后无限位二进制数的0和1的交替的记法去对应实数里面的元素。为帮助读者理解，列举几个数如下：

0.0000000…

0.1000000…

0.0100000…

0.1100000…

0.0010000…

0.1010000…

0.0110000…

0.1110000…

如果我们把1当作√一样的标记，学过子集的读者肯定觉得这个标记和列举含3个元素{0，1，2}集合的所有子集的记法很相似：

含元素0	含元素1	含元素2	...	对应子集
				{}
✓(1)				{0}
	✓(1)			{1}
✓(1)	✓(1)			{0,1}
		✓(1)		{2}
✓(1)		✓(1)		{0,2}
	✓(1)	✓(1)		{1,2}
✓(1)	✓(1)	✓(1)		{0,1,2}
				...

将这个二进制小数列表无穷列举下去，那么对应的子集表也可以无穷列举下去。这些二进制形式的小数对应所有［0, 1］区间的实数，而表格第五列中子集的列表也等同于无穷自然集的子集。因为一个含有N个元素（基为N）的集合的子集数目为2N，无穷自然数子集的数目就是2aleph0，这个数也就是实数集合的势。

康托尔猜测2aleph0就是下一个超限数aleph1，中间不存在其他超限数，也叫连续统假设（这是希尔伯特提出的23个问题中的第一个问题）。

因为康托尔的工作，我们知道了实数集与可数数集同样是无穷大，但是实数集更大。图灵发明了图灵机和定义在其上的可计算数，所以图灵自然要考虑：“可计算数对应了可数数还是整个实数集？”

遗憾的是，图灵证明了可计算数虽然包含无理数中的代数数（例如根号2这样的代数方程的解）和部分超越数（例如π和e），但它是可数的。可数数的势aleph0远小于实数集合的势aleph1 = 2aleph0。而世间万物都是数，且大部分数都是实数，实数中的大部分超越数都无法用图灵机表示。

这意味着什么？第一个选择是我们拒绝承认不可计算的实数的存在，这就等同于我们构造了不存在的数；第二个选择是我们承认它们的存在，图灵机无法表达一个随机生成的无理数。那么人脑是否有个思考过程能对应一个无限、无理的数？图灵和邱奇恰恰认为人脑不能完成这个工作，这就是他们提出的邱奇-图灵论题。

这个论题可以简单地表述为：“凡是人类能够执行的算法，图灵机也可以。”用其等价的逆反命题来说是：“如果算法过程是图灵机不能解的，人类也不能解。”到这里，读者可以清晰地知道，这个是论题，它并不能被证明。

人工智能是否能够取代人，本质上也依赖于这个论题是否正确。在作者眼里，这个论题就像几何的五个公理或者物理学里面的能量守恒定律一样，是我们公理化的认知边界。

到这里，读者已经看到图灵机上能表达的可计算数是无穷的，但是有个更大的实数无穷是图灵机无法表达的。这两个极限的差别表现出图灵机的解决问题的范畴是有局限的。

举个例子来说，我们不能发明一个程序检查另外一个程序的错误。一个错误的程序会使图灵机进入失控状态，计算过程会进入到一个表格里面不存在的状态（m-config）。

回到希尔伯特可判定性的讨论，图灵试图构造一个图灵机，从希尔伯特的《数学原理》中的几个公理和规则出发，让图灵机列举出所有可证明的公式。但是，图灵证明了这样的图灵机不存在。根据邱奇-图灵论题，人类数学工作者也找不到一个思考过程判断一个公式的可证明性。

图灵接下来讨论了一系列人和机器智能的问题。在1950年的Mind杂志上，图灵就人工智能这个话题发表了另外一篇论文“Computing Machinery and Intelligence”。在这篇论文中，他提出了“机器能够思考吗？”这个问题。他认为思考和机器（读者可以认为AI）的定义过于模糊，为此给出了知名的图灵测试来回答这个问题。

在图灵测试中，被测试者（人）在一个黑暗的屋子里面与一台机器或一个人进行对话（那个年代采用文本方式，现在则可以升级到语音方式），若被测试者无法区分对话的是人还是机器，则可以称机器通过了图灵测试。这也是电影《机械姬》的故事情节的基础。

▲《机械姬》剧照

我们如何看待邱奇-图灵论题决定了我们怎么看待人和AI之间的关系。为帮助读者理解邱奇-图灵论题，作者尝试用通俗易懂的语言来表述。图灵机在某个状态下观察一个符号，然后切换到下一个状态，这个行为和我们人类数学工作者几乎一样。差别在于，邱奇和图灵认为机器的状态是有限的，类似于我们构建的表1-1的行状态是有限的。

图灵认为，如果人脑有无限的状态，必然因为有些状态无限接近而造成混乱。但是作者认为“人的思想可以支持一个无穷状态”，因为我们对人的意识理解得并不清楚，证明数学不完备性的数学家哥德尔也表示了类似的观点。

但是，机器智能或者人工智能的产生，极大地解放了人类在可计算数范围内求解问题的速度。机器智能的诞生似乎加速了人类对于数字世界中未知领域的探索。只是，我们对于新生事物的直觉反应总是恐惧，对机器智能的兴起也有类似的反应。

图灵认为人类在上个世纪末不再会抵触和反对机器思考。但是到了今天，我们还是因为不了解或无法掌控机器智能而感到恐惧或不安，过度的恐惧和不安又有可能限制我们充分利用机器智能的长处，进而错过对于机器智能以外的世界的探索。

我们今天感受到的数字世界，存在一定的公理和论题上的边界。在这个边界里面也有黑洞，原因是不完备性；我们没有一条快速路径来鉴别黑洞，是因为不可判定性。

但是，如果你和作者一样认为人的意识格局相比图灵机具有无限性，那么应该持续地去拓展这个边界。在拓展或者重构这个边界的时候，有些黑洞或许会消失，或许可以找到一条路径鉴别黑洞。就像希尔伯特说的：“我们必须知道；我们必将知道。”

本文摘编自《Greenplum：从大数据战略到实现》，经出版方授权发布。

原文链接：https://mp.weixin.qq.com/s/sm9JulSl6mE2diUrhkwYmw

编辑：陈茗

刘海明 · 发表于 2019-8-27 21:26:41

【案例】

你的编辑部用上机器人了吗？

新华智云26日发布自主研发的25款媒体机器人，希望能用智能化的技术、媒体机器人来解决媒体人在新闻生产过程中的痛点，从而更快更好地采集和处理新闻资源。

新闻研究学者认为，这25个机器人涉及新闻生产的全产业链，将提速全产业链智能化进程，受益者将是整个行业，行业观念也将快速统一到加快新闻生产分发的人机协同上来。

25款媒体机器人，帮助媒体人处理媒资逾1000万条

新华智云是由新华社和阿里巴巴共同成立的一家媒体人工智能科技公司，被业界称为“技术公司里最懂媒体、媒体公司里最懂技术”的公司。26日发布的25款新闻机器人，主要是根据内容生产者的痛点和难点，运用在采集和处理新闻资源两个方面。

其中，助力新闻人“采集”新闻资源的媒体机器人有8款，分别为：突发识别机器人、人脸追踪机器人、安全核查机器人、文字识别机器人、数据标引机器人、内容搬运机器人、多渠道发布机器人、热点机器人等。

助力新闻人“处理”新闻资源的媒体机器人有17款，分别为：智能会话机器人、字幕生成机器人、智能配音机器人、视频包装机器人、视频防抖机器人、虚拟主播机器人、数据新闻机器人、直播剪辑机器人、数据金融机器人、影视综快剪机器人、体育报道机器人、会议报道机器人、极速渲染机器人、用户画像机器人、虚拟广告机器人、一键转视频机器人、视频转GIF机器人等。

“在未来，媒体是否具备了智能化，这将成为媒体最重要的特点。随着大数据和人工智能时代的到来，新闻人在新闻资源的采集和处理过程中面临新的痛点，需要新技术来解决。但无论技术如何变化，从媒体角度来讲，有些事情是固定不变的。”新华智云联席CEO傅丕毅说，采访和写稿是媒体最重要的工作，也就是对新闻资源的采集和处理，这是媒体在任何时代的两个根本工作和重心。

“先进的人工智能深度学习技术依赖于数据，而新华智云的优势之一正是我们对媒体这一垂直行业的媒体数据资源和深度理解。”新华智云联席CEO徐常亮说，新华智云推出的25款媒体机器人，已率先在“媒体大脑·MAGIC短视频智能生产平台”（magic.shuwen.com）集成应用，目前累计帮助用户处理媒资超过1000万条，生产短视频30万余条，大幅度提高了采集和处理新闻资源的效率和产量。

2017年12月26日，新华智云发布中国首个媒体人工智能平台“媒体大脑”。2018年12月27日，新华智云又推出了“媒体大脑•MAGIC短视频智能生产平台”，聚焦研发视频生产的智能技术和自动化技术。

浙江、山东等地新闻人率先使用：有人惊叹“效率提速5倍多”！

据了解，目前浙江、山东等地新闻人已在这些媒体机器人的协助下开展新闻资源的采集和处理。大至地震、台风等突发事件的报道，小至为视频添加字幕的日常工作，有了各种机器人的助力，使用者的普遍感受是“操作简单、提效明显、成果专业”。

在所有新闻中，突发事件“唯快不破”。新华智云针对这一刚需研发的突发识别机器人，被媒体用户誉为“最AI的机器人助手”。这款机器人首先会自动识别属于突发事件的媒资，提醒记者、编辑优先处理。其次，机器人还能自动识别突发事件媒资中有价值的新闻片段。其算法模型的准确率高达95%。

在2019年的四川宜宾地震和台风“利奇马”等报道中，“媒体大脑”中来自受影响地区的现场素材会被打上突发事件的高亮标签，提醒编辑优先处理，广受媒体好评。

可视化时代，媒体制作“数据新闻”的需求大增。新华智云由此研发“数据新闻机器人”，只需要用户上传一个Excel表单，就能一键生成相对应的数据动画视频，覆盖饼图、折线图、柱状图、词云、排名图等18种模板样式，据了解，在25款媒体机器人中，数据新闻机器人也是迭代最多的机器人之一。

在2019年8月的超强台风“利奇马”报道中，浙江广电集团旗下的钱江都市频道新闻部用数据新闻机器人制作了多条快速、准确的数据新闻视频。

浙江广电集团钱江都市频道新闻部副主任汤汉涛说，数据新闻原先有比较高的制作门槛——编辑获得数据后，由专业的后期人员用AE做可视化。现在有了数据新闻机器人的帮助，编辑获取数据后可以自己直接做视频，生产效率大为提高。

“数据新闻机器人的另一个优势在精准度上。传统的数据可视化视频，通常使用AE模板，虽然样式好看，但各组数据之间的比例往往由后期估算出来的，无法完全和数据精准对应。现在钱江都市频道在媒体大脑MAGIC上生产的数据新闻视频，完全基于数据生成，可视化准确，动画呈现也非常直观专业。”汤汉涛说。

根据新华智云“媒体大脑”后台数据统计发现，字幕生成机器人是最受记者编辑们欢迎的一款媒体机器人。

为视频添加字幕一直是编辑制作视频新闻的必要工作，但十分繁琐。新华智云“字幕生成机器人”可以将一段长文本智能地拆分成适合屏幕展示的短句，还支持字幕批量替换，如果文稿中有错别字或不需要的标点符号，可以像WORD文档一样搜索内容，一键批量替换，大幅度提高短视频制作效率。

新华社浙江分社记者唐弢是一位工作两年的消防条线文字记者，现在也承担了一些短视频报道任务。唐弢认为，新华智云的媒体大脑MAGIC是一个很好的视频编辑平台，这个平台最大的特点就是好上手，功能新颖。相比于Premiere、Final Cut等专业软件来说，MAGIC的操作是“傻瓜式”的，操作界面简洁，各个编辑条块的分布也清楚，文字记者都能轻松操作。

“字幕生成机器人”给他的帮助尤其大。“从前我制作两分钟的同期字幕，至少得花半小时，现在机器人少则几秒（采访对象普通话标准），多则十分钟就能搞定。至少节省三分之二的时间，”唐弢说。“譬如我制作的《红色守望，一个人的升旗仪式》短视频，时长近3分钟，制作花费大约半个小时时间，我的主要精力花在思考画面的剪切和衔接，至于配字幕、听同期，就直接交给机器人了。”

5G时代将为普通个人用户带来高速率，低时延的上网体验，也对新闻行业在来自前方现场的直播内容提出更多需求。

新华智云据此研发的“直播剪辑机器人”可以在直播场景提供人脸识别、语音识别转文字等智能能力，帮助编辑在直播过程中精准定位，实现直播流快速剪辑，内容实时分发。

“直播剪辑机器人”还有另一个小伙伴是“会议报道机器人”。“会议报道机器人”更侧重大会活动类的直播场景，自动生成人物集锦、会议集锦等。比如主旨演讲类大会活动中，机器人可以根据不同发言人，自动拆条出发言人集锦视频；而在新闻发布会场景下，机器人可以按记者和回答为单位，自动拆条出问答视频。

山东互联网传媒集团大众网采访中心记者邓云峰说，大众网目前主要在媒体大脑MAGIC上用直播剪辑机器人做直播流的拆条，基本2至3分钟就能出一个视频。

“以前做这类视频，如果这条新闻马上需要剪辑的话，只能停掉直播流，然后将视频本地软件上剪，加上片头片尾LOGO等，然后再转码传到我们的自有平台，差不多就需要20分钟。现在用媒体大脑MAGIC可以实现边直播变剪辑，流程变成了‘拉流直播—语音识别分话题剪辑—生成链接—值班责编内容审核—客户端视频发布’，所有的片头片尾LOGO都可以机器自动封装，2-3分钟出一条视频，工作效率提高了5倍多。”邓云峰说。

专家评价：新闻媒体进入“云和智”阶段，新闻生产分发“人机协同”成共识

新华智云26日发布自主研发25款媒体机器人，同样得到了国内多位新闻研究学者的高度关注。他们认为，这是智能化新闻业发展进程中有标志意义的事件，与这些机器人的协作将使人类新闻工作者的新闻生产能力大幅度提高，希望智云的实践能引领世界媒体融合发展趋势，在媒体智能化领域贡献中国的智慧和实践。

清华大学新闻学院教授沈阳认为，“媒体大脑”媒体机器人，它的本质在于提升了内容生产的生产力，并且在内容的生产关系上，也起到一个很好的促进和发展的作用。

“这是利用人工智能、大数据，加上我们媒体内容行业的专业智慧，三者相结合的一个非常好的工具平台。”沈阳说，我们希望这个平台，未来能够更加稳健，更加快速的持续迭代，更多地向全国的同行进行开放，使得它具有更好的应用案例和更广阔的应用范围。

中国政法大学新闻传播学院网络与新媒体研究所副教授王佳航认为，25款新闻机器人的批量推出是智能化新闻业发展进程中有标志意义的事件。从这25款新闻机器人的功能来看，在以下几个方面有重要价值：

其一，新闻业人机协同的观念和意识将大大提升。在写稿机器人零星出现的时候，新闻业讨论最多的是“机器人是否会替代记者”。这种讨论实际上意味着整个行业对人工智能应用的一些观念性误区。这25款新闻机器人的推出将使整个行业观念快速统一到加快新闻生产分发的人机协同上来，例如人脸追踪机器人、数据标引机器人、突发识别机器人等都明显超越了人类新闻工作者的能力，与这些机器人的协作将使人类新闻工作者的新闻生产能力大幅度提高。

其二，全产业链智能化进程提速。25个机器人涉及到新闻生产的全产业链，从采集、制作、视频、分发、审核到广告、用户，均有涉足。新闻生产全线智能化应该会带来变化，从初期产制方面的智能化，逐步到产业生态、生产关系、竞争格局......值得跟踪观察。

其三，将推动媒体融合的进一步深化。媒体大脑一直在为中央和地方媒体的媒体融合转型提供服务，25个新闻机器人的推出将使整个行业受益，可以预见媒体融合深化过程中，智能化将成为下一个重点。

华中科技大学新闻与信息传播学院院长、教授张明新说，人类社会新闻传播实践的发展史，就是一部媒体技术不断演进和应用的发展史。人类经过漫长的“铅与火”、“光与电”和“数与网”的阶段性演变，现今已经步入到“云与智”的时代。

张明新认为，作为媒体智能化研发和应用的典范，新华智云在这方面引领了时代潮流。从2017年发布中国首个媒体人工智能平台“媒体大脑”，到2018年成功推出“媒体大脑•MAGIC短视频智能生产平台”，到今天推出“智能新闻机器人第一梯队”，每年都有重大成果，显示了在媒体与技术交叉领域的独有优势。

“自古至今，人类永远在探索和追求更完善、更理想、更具人性化的传播境界。我们期待在已经到来的5G时代，新华智云能够在这方面继续发力，以高度的前瞻性、预见性和想象力，不断深度开掘，引领世界媒体融合发展趋势，在媒体智能化领域贡献中国的智慧和实践。”张明新说。

原文链接：https://mp.weixin.qq.com/s/rQtPuhCBWBdVmPAclukCeQ

编辑：陈茗

刘海明 · 发表于 2019-8-27 21:46:31

【案例】

我国新闻业首迎25款媒体机器人

　8月26日下午，目前国内最大的媒体机器人生产商和服务商新华智云正式对外发布了其自主研发的25款媒体机器人。

　　这些机器人已集成在“媒体大脑MAGIC短视频智能生产平台”上。它们功能各异：有的可以进行文字识别，有的会自动生成字幕，有的能实时进行直播剪辑，有的能轻松制作视频数据新闻……

　　“这是我国新闻史上首次有公司推出媒体机器人。”新华智云联席CEO傅丕毅也颇有野心，“希望这次发布能载入历史，成为有意义的事情。”

　　瞄准媒体业痛点，人工智能成帮手

　　前段时间，浙江省和台风“利奇马”来了场遭遇战。对媒体人来说，应对这超强台风也是一场大考。

　　你之前或许看到过，AI女主播现场播报气象灾害预警信息，钱江视频“数说台风”展示台风风力随时间的变化，还有台风期间的正能量故事……这些视频的背后，都有媒体大脑MAGIC智能生产平台做支撑。

　　媒体大脑是我国第一个媒体人工智能平台，由新华智云于2017年年底推出。新华智云则由新华社和阿里巴巴共同投资成立。

　　“新闻业是个开放且复杂的领域，常需要用到多模态技术，比如图像识别、人脸识别、语音识别、自然语言处理等等。”新华智云联席CEO徐常亮告诉科技日报记者，业界此前鲜有为新闻业研发的智能模型，想在新闻业中寻找适合人工智能技术的落地场景，要既懂新闻，也懂技术，还得有大量素材和数据积累。比如，此次推出的25款机器人中，有一款为“突发识别机器人”。它可以在视频素材中识别出“火灾”“爆炸”“碰撞”事件和“警务、医护等特殊车辆”，及时提醒编辑部；还能对视频进行二次处理，找到标志性片段，将其推荐给编辑和记者。

　　其实，每一套人工智能模型都需要数据的“喂养”。徐常亮也表示，从技术上来讲，深度学习等各类算法模型已经比较成熟，但更需要解决的问题是数据的收集和标注。

　　5G时代，媒体面临智能化转型新要求

　　华中科技大学新闻与信息传播学院教授张明新指出，人工智能技术已经历史性地改变了新闻传播业的面貌。“在网络、大数据等技术支持下，新闻传播从新闻线索搜集与评估、采访与编辑到制作与分发等全流程，都越来越体现出智能化的特性。”

　　傅丕毅认为，为了迎接5G时代，媒体需要向智能化转型。“不过，大多数媒体离智能化还有段距离。”其实，媒体大脑正是要帮媒体缩短向智能化跨越的进程。毕竟，要求每家媒体都投入大力气研发智能平台是不现实的，但传统媒体也可以通过各种方式拥抱技术。

　　5G时代，带来新的机遇。在徐常亮看来，5G最明显的特征是时延低、网速快、容量大。在5G的帮助下，媒体可以做摄像头、传感器新闻，用手机端+云端就能处理数据，可以更流畅地应用各项人工智能技术。“媒体的采编发流程可以大幅度加速。”

　　而对普通公众来说，他们也会身处一个“全视频”传播环境。正如北京师范大学新闻传播学院执行院长喻国明所说，社会主要交流手段将从书写文字转为视频语言；曾经只在后台当无名英雄的智能技术会走到台前，更直观地被受众感知；而VR、MR、AR等各种技术，也会得到更充分的展示。

　　不过，内容为王永不过时。

新的技术带来新的生产力，媒体能输出的内容在机器的辅助下可以翻倍。这也对媒体的深度和专业度提出新的要求。“媒体人要成为全能选手，要学会和机器一起工作，还要当好‘把关人’。”傅丕毅说，好内容加上好技术，媒体才可以更好地掌握舆论场主动权和主导权。

原文链接：https://mp.weixin.qq.com/s/-LQbaVAY7cAMFXsmOtmrnw

编辑：陈茗

帐号		自动登录	找回密码
密码			实名注册