【案例】
《华盛顿邮报》的数字新生:报纸媒体的技术自救丨【芒种·案例】
将数字化列入近百年来最重要的关键词之一,应无疑义。数字化的内涵不断深化,范围无限延展,形成现在蓬勃旺盛的数字化生态,将众生裹挟其中。
这中间,传统的媒体与调研机构难免被波及,需在新环境中奋力探索存续之道。对众生而言,数字化生存绝非一时的命题,也无固定答案,在无远弗届的数字化时代,常变常新才可长存。
本文选择《华盛顿邮报》作为选题案例,剖析这一历史悠久的报纸媒体是如何通过数字化手段重获新生的。
主要内容板块包含:
报纸媒体的技术自救
覆盖内容管理全流程的数据处理工具箱
内外兼修,提升数据服务能力
编者按:1877,这是《华盛顿邮报》创立的年份。此次选题案例中,《华盛顿邮报》以143岁“高龄”,当之无愧为最悠久。作为日益高涨的数字化浪潮中被认为岌岌可危的报业中的一员,《华盛顿邮报》何以实现“数字化生存”?这是笔者为本篇设定的命题。
新媒体这股巨浪拍向报纸媒体已经10余年了。这10余年里各大报业机构使出浑身解数,架设网站、发行数字报、开设社交媒体账号、发力视频已经成为纸媒转型的标准路径。而在众多报业机构的自救图景中,《华盛顿邮报》(以下简称《邮报》)以推出内容数据工具Arc Publishing(以下简称Arc)为自己开拓了新的业务战场,走出了一条不同寻常的新生之路。
01报纸媒体的技术自救
虽然Arc现在已经成为《邮报》对外推出的商业产品,但它在诞生之初只是《邮报》的自救举动而已。
2013年为解决《邮报》内部内容管理系统的低效和割裂问题,技术团队搭建了一个名为“PageBuilder”的可以自动构建网页的内容管理系统在内部试运营,并不断改进,增加新的工具模块,如工作流管理、图片及视频管理编辑等。
2014年,《邮报》看到了这一工具平台对外输出的可能性,开始将其免费提供给耶鲁大学、马里兰大学、哥伦比亚大学等近10所高校的学生报纸使用,在外部使用中不断修复问题、调整迭代,提升服务能力。
一年以后《邮报》将其命名为Arc并获得了第一个付费客户《Willamette Week》。随后Arc进入高速增长阶段,不断在美国本土、加拿大、西班牙、阿根廷、韩国等国家拓展市场,并于2017年获得由WAN-IFRA(世界报业和新闻出版协会)推出的北美数字媒体奖中的最佳创新产品奖,是美国五大内容管理系统之一。
目前,Arc为全球30多家客户的800多个网站提供服务,每月流量超过7.5亿独立用户。其客户以报纸媒体为主,包括《芝加哥论坛报》《洛杉矶时报》《纽约每日新闻》《波士顿环球报》《达拉斯晨报》等美国媒体,以及法国Le Parisien(《巴黎人报》)、西班牙El País(《国家报》)、中国《苹果日报》、韩国The ChosunIlbo《朝鲜日报》等。此外新西兰NZME、阿根廷Infobae 、美国Graham Media Group、Raycom Media等网站、广播电视集团客户也在使用Arc的工具产品。
由于品牌客户对内容日益重视,Arc也在努力拓展非媒体行业客户,2019年Arc签约英国石油公司,为旗下250个内部网站的内容生产、分发等业务提供服务。
Arc以SaaS模式运营,按照网站流量、工具使用、数据存储等情况收取月费,基本订阅费是每月1万美元,最大的客户每月所支付金额可达15万美元。由于巨大的技术开发费用,Arc尚未实现盈利,但《邮报》内部对Arc的发展前景非常乐观。其首席信息官Shailesh Prakash 2019年接受采访时表示,在未来3年内Arc年营收将达1亿美元,成为《邮报》在订阅、广告以外的第三大营收来源。
02
覆盖内容管理全流程的
数据处理工具箱
目前,Arc已经形成了一套完备的内容数据处理工具箱,覆盖内容生产、分发、盈利全流程。其中,Websked 负责文章的规划安排,Photo Center 和 Video Center能分别管理及处理图片和影片,Bandito可对内容进行优化呈现,PageBuilder、Subscriptions等则可完成内容的分发和盈利等多项功能。
内容生产工具助力内容资产管理、创作、优化和工作流管理
对于内容生产来说,内容资产管理、创作和优化呈现是3个核心环节,在Arc目前的业务版图里,则分别由Photo或Video Center、Composer和Bandito来完成以上工作。
Photo Center是一种图片资产管理系统,支持批量上传、图片分配、图库编辑策划等功能。客户可以根据图片来源、种类、上传日期以及其他关键词进行筛选和搜索,快速定位图片资产。Video Center的功能与之类似,在基础的视频资产管理以外,也提供直播视频剪辑、发布等功能。
在这些内容资产的支持下,用户则可更好地利用Composer这个创作工具进行内容创作。由于Arc主要服务于纸质媒体的数字出版业务,Composer中内置的模板也主要适配于网络文章的创作,分为标题、段落、图片、视频、社交链接等几大模块,客户可以自由添加相应模块,并从该模块的资产库中拖拽需要的内容进行填充,操作极其灵活高效。
为了达到更好的传播效果,客户还可创作多版本的内容,利用Bandito测试不同的标题、导语、字幕、缩略图等各种内容变量的表现效果。这个2016年推出的测试工具,可以适用于文字和视频内容,根据内容的点击率,检测用户喜欢的版本,并自动提高该版本的曝光率。它还允许媒体在测试过程中不断添加新的变量或者删除旧的变量,并且根据用户的不同特征进行个性化呈现。
在Bandito的算法中,不同内容版本的呈现概率取决于这个版本所获得的UCB(Upper Confidence Bound)分数,它等于该版本的Bonus分数与Reward分数之和,其中Bonus分数与该版本展示的次数成反比,而Reward分数与该版本的点击率成正比,这意味着Bandito不仅可以提供已经表现出强互动性的内容,以提高用户参与程度,而且也为新的内容版本提供了曝光机会,以探索更多更好的互动效果。
在对内容进行资产管理、创作和优化以外,Arc还可以实现对内容团队的工作流管理。内容团队可以通过名为“Websked”的工具创建并分配内容任务,并通过电子邮件、Slack和Webhook等应用通知相应成员使内容按计划进行,团队成员可以方便地查看任务进度、稿件状态,也可以编辑、审核、签发稿件。WebSked还提供对团队创建的所有内容进行统计的仪表盘,以更好地掌握团队工作绩效。
值得一提的是,Arc还加强了人工智能在内容工具中的应用,自动化写作工具Heliograf、自动化视频生产工具Helio Video、标题推荐工具Headliner、内容审核工具ModBot以及内容预测工具Virality都在积极开发中,以期帮助客户进行更加自动化、智能化的内容生产。
内容分发工具实现灵活高效地建站和直播
与国内传统媒体逐渐将传播阵地转移到微博、微信、抖音等社交网站不同,海外传统媒体仍然坚守着自身网站作为核心传播阵地。于是,方便灵活地建站成为许多传统媒体的重点需求,作为Arc第一个扩展型工具箱原型的PageBuilder也是在这种意义上被首先开发的。
为了尽可能地简化技术开发和内容团队的工作,PageBuilder将原本僵化固定的网页元素拆分为灵活的模块化单元(Page Feature),每个单元配备了可选的样式、脚本、模板,以及与之关联的不同内容或数据。内容团队可以任意配置所需的模块,并调用整合的内容资产库或其他内容进行填充,从而创建和更改页面的外观及内容,并无需接触代码库。
在这种灵活的建站功能以外,PageBuilder还集成了内容测试、模板管理以及受众细分功能,以确保用户在合适的时间和地点获得最佳的内容体验。它提供用户友好的视觉界面,也使建站任务更加简单易操作。
阿根廷新闻网站Infobae就是PageBuilder的用户之一。自采用Arc的编辑工具套件以来,Infobae推出了一个新站点Infobae Mexico,以及两个新的垂直领域,即Infobae Gaming和InfobaeEconómico。后者在头两个月记录了超过1400万唯一用户,而本站Infobae的独立用户数也增长了200%,重度用户成长了110%,每月独立访问用户数达7500万。
为了满足其不断增长的广播电视客户的内容分发需求,Arc还推出了Broadcast这一移动实时视频流应用程序。
该程序允许记者和内容创作者将高质量的直播视频同时流式传输到多个自有站点和社交平台,如Facebook、YouTube、Twitter、Twitch和Instagram以及拥有和运营的网站以及OTT应用中,最大限度地减少了现场制作高质量的直播视频所需的资源和成本,使记者和内容创作者能够用手机快速高效地捕获和传输实时视频。
该应用还集成了视频资产管理系统Video Center,这意味着编辑人员可以与现场的记者进行远程协调,以管理分发或对实时视频进行编辑,如图形叠加。
内容盈利工具覆盖广告和订阅两大收入模式
广告和订阅是媒体最主要的两大收入来源,开发简单易用的盈利工具以提高媒体的广告和订阅收入也自然是《邮报》关注的焦点,Zeus和Subscriptions即是其努力成果。
Zeus是一套旨在通过减少网站延迟、提高广告可见度和增加整体广告收入来改善广告性能的工具组合,由Performance、Prime和Insight3个产品构成。
Performance是一套广告框架和渲染引擎,它在AMP页面的基础上使用Google的Progressive Web Apps(PWA)技术对页面进行了重新编码。该技术使Arc可以在不牺牲速度的情况下在其移动网页上提供丰富的多媒体内容。在Zeus的帮助下,《邮报》在手机、电脑等设备上的所有广告,只需要不到两秒钟就能加载完毕。Zeus上线移动设备后,不仅提升了广告的加载速度,点击率也提高了32%。
Prime和Insight则是为程序化广告购买开发的产品,目前尚在商业化的初级阶段。以Prime为例,这个自助广告投放系统目前只针对华盛顿地区的广告客户开放,而在《邮报》的规划中,该产品会同时面向广告主以及媒体客户。作为人群定位工具的Insight目前也只能基于《邮报》第一方数据使用,还不能实现对客户数据的引入打通。
订阅工具Subscriptions能够处理整个购买流程,包括注册、报价、结帐和计费。它可以实现灵活的付费墙设置,包括需要注册的硬付费墙或基于计量的软付费墙,还可以对不同来源、不同地点的用户设置个性化的付费墙。此外,Subscriptions还使用机器学习来帮助确定最有可能订阅的读者以提高收入,其内置的PageBuilder则能快速创建商品页面及客户服务门户。
新西兰最大的传媒集团NZME是第一家使用Arc Subscriptions的发行商,推出了新的Premium订阅服务。该服务订阅人数在发布后不到两周就超出了最初的预期。
个性化工具Clavis提升内容生产、分发和盈利全流程效率
居于Arc工具箱的核心地位,作为内容生产、分发和盈利工具效率引擎的则是个性化工具的Clavis。它能完成内容的分析、分类、人群定位以及推荐功能,由Topic Classifier、Target和Hybrid3个工具组成。
Topic Classifier是一种自然语言处理引擎,可对内容进行解析,自动从文本中提取关键词、主题和辅助信息,并打上相应的标签。
Target可跟踪用户的阅读历史记录和内容的综合浏览量,每次有新的用户进入页面,自动为其创建唯一的用户ID,提取被浏览内容的主题、关键词、词包等标签数据,将其添加至用户的阅读记录文件,并保存在浏览器中,以供广告平台或推荐系统使用。
Hybrid则是将内容的受欢迎程度、用户兴趣、群体行为结合起来的混合推荐引擎,它不仅基于内容的元数据,为用户推荐相似的内容,也基于其他用户的浏览行为其推荐内容,就像亚马逊的“购买了此商品的人也购买了其他商品”的建议一样,此外,它还会基于内容的受欢迎程度做出推荐。通过混合使用不同类型的推荐算法,不仅能提高用户的参与度,同时也考虑到重复访问用户的“疲劳”因素,不断为其提供更多新鲜有趣的内容。
实际在应用中,Clavis可以被用在内容生产、分发以及盈利的所有环节。Clavis对内容的标签处理是对内容进行资产管理的基础;正在开发中的标题推荐工具Headliner、自动化写作工具Heliograf、自动化视频生产工具Helio Video都是基于对内容的分析实现的辅助或自动化生产过程;推荐系统通过展示与用户兴趣相关的内容而提高内容的分发效率;精准广告投放则更是Clavis的一个显而易见的应用方向。在这种意义上,Clavis可以说是Arc的核心和底层。
纵观Arc的这一整套内容工具,明显表现出两大特点:
第一,工具之间互相嵌套整合,如Video Center里内置了Bandito可以对缩略图和标题字幕进行变量测试,PageBuilder里嵌入了Clavis、Bandito以及Photo/Video Center这些内容资产管理工具,极大提高了客户操作流畅度和运行效率。
第二,作为媒体出身的技术提供商对媒体需求的深刻理解,如Websked的工作流管理功能,以及作为Headless CMS的易用性。正如Infobae创办人Daniel Hadad所说:“软件工程师通常很难真正了解新闻工作者的需求。我们会喜欢Arc,就是因为它是《邮报》开发的,他们很清楚新闻人要的是什么。”
03
内外兼修,提升数据服务能力
作为一家媒体机构,《邮报》何以能推出内容数据工具并且获得成功?这是研究Arc案例时一直萦绕在笔者脑海的关键问题。而经过仔细分析我们发现,它对内提高对数据的把握和处理能力,对外借助优秀合作伙伴的技术实力,是其成功的重要法则。
发挥优势,融媒体业务洞察于数据处理之中
如同Infobae创办人Daniel Hadad所说,Arc的核心优势在于《邮报》作为老牌媒体对新闻业务的深刻洞察,《邮报》则将这一优势充分运用在数据处理和工具开发的过程中。
如前所述,对内容进行标签化处理是Arc的核心,其中涉及到两个大的数据类型:Topics和Keywords。
Arc的数据库中设定了约130种Topics,这是Clavis的开发人员与部门编辑一起讨论的结果,部门编辑依靠多年的报道经验,确立了这个既足够完整又足够灵活的主题列表相比Al Qaeda(基地组织)、terrorism groups(恐怖主义团体)这样的词更容易进入主题列表,因此该系统能够很长时间内适应新的报道范围。
Keywords的提取则是在标准的tf-idf算法外,基于自身经验,增加了额外的专有名词权重,并且如果这些名词出现在故事中较早时,它们还会增加权重。
Clavis的混合推荐算法是在深入考察了多种推荐引擎之后做出的决策。传统的协作式过滤器面临着所谓的“冷启动”问题,它需要历史和数据来学习,这对于会不断发布新内容的媒体业务来说是一个短板;基于内容的推荐引擎则对内容的理解能力提出了较高的要求,这种困难在面对视频、图片、音频内容时尤为明显;而如果只从内容和行为的相似性做出推荐会导致重度用户的“疲劳”,因此加入受到全体用户欢迎的内容可以提高用户的新鲜感和参与度。
而前文提到Bandito算法中使用的Bonus分数和Reward分数也是同样考虑到用户新鲜感和参与度的决策。
当然,Arc得以运用媒体业务逻辑处理、分析、应用内容数据的前提是对内容、用户、作者三大维度数据的全面掌握,这些数据构成了Arc理解客户、理解业务的核心资源。
内容数据是Arc系统的重中之重,它包括系统自动识别的主题、关键词等核心数据;内容类型、作者、发布时间及版块等外围数据;以及浏览量、浏览时长、社交声量等效果数据。值得一提的是Arc能在主题、关键词识别以外,判断出内容的情绪、可读性等质性数据,它在开发中的内容预测工具Virality即是通过情绪、可读性、社交声量等数据综合分析来预测帖子的病毒性扩散趋势。
用户数据是另一个重要资源,包括对于用户地理位置、设备型号、登录时间等基本信息的记录;阅读过的内容的主题、关键词、词包、卷入程度等阅读记录数据;以及诸如订阅、购买、浏览等其他行为数据。《邮报》商业化产品团队RED推出的Re-Engage产品可以通过监视用户在页面的滚动频率和其他无效操作,为不活跃的用户提供一个“Re-Engage”的单元,推荐可能感兴趣的内容。
岗位、工作内容、工作数量、工作进度、联系方式等作者数据则是Websked工具管理内容团队及工作流的重要基础。
开放合作,借力顶尖技术伙伴优化服务水平
平心而论,《邮报》的技术水平并不优秀。为了补足这个短板,Arc选择与细分领域的顶尖选手合作,借助其优秀的技术实力,以最优化Arc工具的连续性、易用性和效率,提高对客户的服务水平。这份合作伙伴的名单包括AWS、Akamai、Catchpoint、Mulesoft和Splunk。
与AWS同属一个老板,Arc与AWS的合作关系自然最为深入。Arc是AWS Partner Network (APN)的一员,在技术、营销、销售领域都有密切的合作关系。
Arc本身建构在AWS之上,借助AWSElemental Media Service、AWS Lambda、Amazon Kinesis、Amazon DynamoDB、Amazon Aurora、Amazon Simple Storage Service等多样化的工具,Arc得以提供强大的功能效用和服务能力,包括快速部署和更新、大规模客户服务等。
此外,Akamai的内容分发网络是Arc PageBuilder功能得以实现的重要基础;Catchpoint对内容分发全链条的主动测试和监视功能可帮助Arc为客户快速定位和解决网站的性能问题;接入Mulesoft的Anypoint Platform让Arc能被更加灵活地集成到客户现有系统中;专注于日志分析的大数据公司Splunk则让Arc可以快速定位网站、软件运行中的问题。在这些合作伙伴的支持下,Arc得以确保客户获得最佳的内容工具,为客户提供优质服务。
04
结语
从技术自救出发,《邮报》逐渐把这套优化内部运营效率的内容数据工具对外输出,成为一个极具增长潜力的新业务,也为自身开拓了新的发展空间。尽管作为传统行业机构的《邮报》并不具备技术优势,但它在垂直领域的业务经验助力其用另一种姿势切入数据工具市场,这无疑为许多传统产业机构提供了一条新思路。
链接:https://mp.weixin.qq.com/s/vQs3sqpJ6r6YoP7ZOIhK3w
编辑:李佳怿
|